音声認識によるリアルタイム字幕作成システム構築マニュアル

2009年11月25日 公開

聴覚障害学生の情報保障手段として、音声認識技術を用いた字幕作成システムに関心を持たれる方も多いのではないでしょうか。しかし、授業担当教員の音声を直接入力・認識させても、とても情報保障手段として活用することはできないというのが実情です。

本マニュアルでは、講師音声を復唱者が復唱し、音声認識ソフトウェアにて変換し、変換後の誤認識を修正して字幕作成を行うシステムを構築する一手法について、及び情報保障者に必要なスキルについて解説しています。併せて本システム構築に必要な修正作業用ソフトウェアを無償配布しております。
パソコンノートテイクの次の情報保障手段として、是非ご活用下さい。

音声認識マニュアル表紙

<主な内容>

  • はじめに
  • 音声認識同時字幕システムの概要
  • 復唱方式を用いた音声認識同時字幕システムで使用するソフトウェア
  • 音声認識ソフトウェアと連携作業用システム構成の手順と字幕作成までの流れ
  • 復唱・校正作業負担を軽減させる機材
  • 復唱方式における情報保障者のタスクについて
  • 事例1:筑波技術大学における情報保障実験等から得たノウハウ
  • 事例2:群馬大学における音声認識技術を活用した字幕呈示システムの運用の取り組み
  • 同時配布CD 連携作業用通信ソフトウェア「SR-LAN2ダッシュ」
    音声遅延再生用ソフトウェア「SR-DELAY」
    ※本マニュアルで紹介しているフリーソフトウェアには、音声認識ソフトウェアは含まれておりませんのでご注意下さい。

こちらからPDFファイルをダウンロードしてご覧ください。(冊子の配布は終了しています)
 →PDFファイルダウンロード(5MB)
(筑波技術大学リポジトリのページが別ウィンドウで開きます)

編集

「音声認識によるリアルタイム字幕作成システム構築マニュアル」編集グループ

  • 三好茂樹(筑波技術大学 障害者高等教育研究支援センター 准教授)
  • 磯田恭子(筑波技術大学 障害者高等教育研究支援センター 特任研究員)
  • 金澤貴之(群馬大学 教育学部障害児教育講座 准教授)
  • 味澤俊介(群馬大学 学生支援課障害学生支援室 専門支援者)
  • 立入哉(愛媛大学 教育学部 准教授)
  • 苅田知則(愛媛大学 教育学部 准教授)
  • 大倉孝昭(大阪大谷大学 教育福祉学部 教授)
  • 白澤麻弓(筑波技術大学 障害者高等教育研究支援センター 准教授)
  • 河野純大(筑波技術大学 産業技術学部 准教授)
  • 黒木速人(筑波技術大学 産業技術学部 准教授)

※敬称略、肩書きは発行当時

  • 注1:本マニュアルの著作権はPEPNet-Japanが所有します。講習会等での使用を目的にコピー・配布することは許可しますが、営利目的での使用は禁止します。
  • 注2:本マニュアルで紹介しているフリーソフトウェア「SR-LAN2ダッシュ」「SR-DELAY」の再配布・営利目的での使用は禁止します。
  • 注3:ソフトウェアのサポートは終了しています。配布をご希望の場合にはPEPNet-Japan事務局までご連絡をお願いします。
ページ上部へ