音声認識によるリアルタイム字幕作成システム構築マニュアル
2009年11月25日 公開
聴覚障害学生の情報保障手段として、音声認識技術を用いた字幕作成システムに関心を持たれる方も多いのではないでしょうか。しかし、授業担当教員の音声を直接入力・認識させても、とても情報保障手段として活用することはできないというのが実情です。
本マニュアルでは、講師音声を復唱者が復唱し、音声認識ソフトウェアにて変換し、変換後の誤認識を修正して字幕作成を行うシステムを構築する一手法について、及び情報保障者に必要なスキルについて解説しています。併せて本システム構築に必要な修正作業用ソフトウェアを無償配布しております。
パソコンノートテイクの次の情報保障手段として、是非ご活用下さい。
<主な内容>
- はじめに
- 音声認識同時字幕システムの概要
- 復唱方式を用いた音声認識同時字幕システムで使用するソフトウェア
- 音声認識ソフトウェアと連携作業用システム構成の手順と字幕作成までの流れ
- 復唱・校正作業負担を軽減させる機材
- 復唱方式における情報保障者のタスクについて
- 事例1:筑波技術大学における情報保障実験等から得たノウハウ
- 事例2:群馬大学における音声認識技術を活用した字幕呈示システムの運用の取り組み
- 同時配布CD 連携作業用通信ソフトウェア「SR-LAN2ダッシュ」
音声遅延再生用ソフトウェア「SR-DELAY」
※本マニュアルで紹介しているフリーソフトウェアには、音声認識ソフトウェアは含まれておりませんのでご注意下さい。
こちらからPDFファイルをダウンロードしてご覧ください。(冊子の配布は終了しています)
→PDFファイルダウンロード(5MB)
(筑波技術大学リポジトリのページが別ウィンドウで開きます)
編集 |
「音声認識によるリアルタイム字幕作成システム構築マニュアル」編集グループ
|
---|
※敬称略、肩書きは発行当時
- 注1:本マニュアルの著作権はPEPNet-Japanが所有します。講習会等での使用を目的にコピー・配布することは許可しますが、営利目的での使用は禁止します。
- 注2:本マニュアルで紹介しているフリーソフトウェア「SR-LAN2ダッシュ」「SR-DELAY」の再配布・営利目的での使用は禁止します。
- 注3:ソフトウェアのサポートは終了しています。配布をご希望の場合にはPEPNet-Japan事務局までご連絡をお願いします。