株式会社テレビ朝日クリエイト様
正確かつ速い生放送字幕付与が、高度な専門スキルなしで実現できる製品を開発

左からLIM・JOOSUK様、下永𠮷 寛之様、横山 岳史様
元来、生放送番組に付与する字幕テキスト制作については、「高い入力スキル」や「高い認識精度を出せるリスピークスキル」が必要となり、そのような高い専門スキルを持った人材が必要でした。テレビ朝日クリエイト様では、長年に渡って培ってきた生字幕制作に関する知見と最新技術であるAIを組み合わせることによって、「生字幕制作に高い専門スキルは不要」でありながら「視聴者に対し正確で読みやすい字幕を提供」できる製品「J-TAC Pro」を開発。開発の背景とAmiVoice採用の効果について、同社の字幕制作局 リアルタイム字幕部 兼 開発運用部 下永𠮷 寛之様、字幕制作局 開発運用部 横山 岳史様、CG制作局 CGシステム部 LIM・JOOSUK様に伺いました。
課題・背景
生放送の字幕制作では専門スキルを持つ人材の確保が課題
リアルタイム字幕の主な制作方式としては「人間が放送音声を聞き起こしてタイピングする方式」と「放送音声をリスピークして音声認識でテキスト化する方式」と「放送音声を音声認識に直接かけてテキスト化する方式」が挙げられます。
これまでテレビ朝日クリエイトでは「人間が放送音声を聞き起こしてタイピングする方式」を用いていましたが、この方式に必要な高速入力者の業務負荷が年々増大していたことに加えて、特殊なスキルを持った人材を確保することも課題となっていました。これらの課題を解決するために新しい制作方式として「放送音声を直接音声認識して誤認識箇所を修正する方式」を確立し、この新しい制作方式を実現するためとしてJ-TAC Pro を自社開発することとしました。
2012年にAmiVoiceの当時最新の音声認識技術に触れたことがきっかけで、2013年にはパッケージ字幕制作の一部を自動化する支援システム「J-TAC」をリリースしました。その後も様々なシステムの開発を行ってきましたが、実運用にこぎつけられたシステムもあれば、運用面での諸問題を乗り越えられずに挫折してしまったシステムもあり、ここまで試行錯誤の繰り返しとなっていました。
それが、近年の音声認識技術の劇的な進化と音声認識エンジンを手軽に活用できる「AmiVoice API」のサービス開始により、これまで抱えてきた諸問題を克服する可能性を見いだせたことが採用の理由となります。
導入の効果
発話から字幕付与までのタイムラグを大幅に削減することに成功
従来方式(高速入力方式)によるリアルタイム字幕付与は発話から文字起こししているために、どうしても発話から字幕付与までに遅延が発生してしまっていました。
この遅延をいかに小さくするかがAI 音声認識による生字幕制作システムの開発においても課題ではあったのですが、「J-TAC Pro」開発当初の仕様では発話単位で音声認識結果を出力していたため、発話者が息継ぎなどをしないで一気にしゃべった場合には認識結果を出力するまでに長時間かかっていました。そこから校正作業を行うことで発話から字幕付与までの遅延が従来方式よりも大きくなってしまうことが課題でした。この遅延に対する課題をどうしても解決する必要があり、長期間にわたって試行錯誤していましたが、御社の技術者との意見交換の場において「音声認識エンジンから送信される認識結果の途中確定情報を取得する方法」があることがわかり、この方法を新たに採用したことによって発話から校正作業開始までの時間を大幅に短縮することに成功しました。それにより発話から字幕付与までの遅延を従来方式と同じかより小さくすることが可能となり、これにより『J-TAC Pro』の開発は一気に前進していくこととなりました。

音声認識結果画面

校正端末画面
数字の音声認識結果が間違えることがほぼなく、すごい
ユーザー企業からは以下のような反応をいただいています。
・対象番組(ニュースなど)における音声認識の精度が他社製品と比較して高い
・ニュースなどで事前に固有名詞などが判明していない場合でも、音声認識エンジンへの単語登録が簡単に行えることがよい
・他社製品と違い、音声認識中の途中確定情報が取得できることで、校正作業をいち早く開始することができるため、発話から字幕表示までの遅延を少なくできる
・注目度の高いニュースにおける固有名詞が音声認識エンジンに反映されるまでのタイムラグが短い
・弊社では数字情報を多く取り扱っている番組で使用しているが、数字情報については音声認識結果が間違えることがほぼない。すごいと思った!
認識精度や機能については、弊社においても前述したユーザー企業ご担当者様と同じ印象を持っています。
ユーザー管理という観点でも、管理画面でユーザーが一覧表示されて、簡単に利用状況が確認できる点や
全ユーザーの利用料金をCSVファイルで取得できるので精算時に助かっています。また、不具合や要望などの技術的な問合せと回答のやりとりもスムーズにできるのも
今後の展望
多くのテレビ放送局の省力化に寄与できるように改修・新機能追加を予定
2024年4月より静岡朝日テレビにおいて、生放送番組に対して『J-TAC Pro』を使用してリアルタイム字幕付与が開始されました。次いで2025年1月からはテレビ東京においても、一部の生放送番組に対して『J-TAC Pro』を使用してリアルタイム字幕付与が開始されました。テレビ朝日クリエイトでは、この流れを他のテレビ放送局へと拡大するため『J-TAC Pro』 をさらに省力化に寄与できる便利なシステムへと改修していきます。また将来的には本システムがテレビ放送だけでなく様々な動画配信サービスでも利用していただけるように、新しいサービス展開の検討と新機能追加を積極的に進めていきます。

社名 | 株式会社テレビ朝日クリエイト |
---|---|
事業内容 | テレビ番組等の美術プロデュース、イベント等の企画・制作、字幕制作ほか |
URL | http://www.tv-asahi-create.co.jp/index.html |