AIの学習には多くの学習用データが必要な事は周知のとおりです。それらを用意するためバンダイナムコ研究所では、幾つかの会社さんに業務委託をして作成いただいています。
特に音声合成用のコーパス作成は音声を聞きながらアクセント付けや音素セグメンテーションを行うため、声を正確に聞き取る力が必要になります。この作業を、ほとんどのワーカーが聴覚障がい児の親御さんである株式会社Hibouにお願いしています。
このセッションでは、AI音声合成について簡単に説明した後、収録台本作成→音声収録→機械的アノテーション→手動アノテーションといった音声コーパスを作成するための手順とポイントを紹介し、音声合成AIを学習して作られた音声も紹介します。
講演者プロフィール
鈴木 尚也
大手SES会社、オンラインゲーム会社を経てバンダイナムコスタジオに入社。ビッグデータの解析等の分析業務を経てバンダイナムコ研究所へ転籍。
バンダイナムコ研究所ではDLや機械学習を使った音声関連のR&Dに従事。現在同AI音声関連チームのマネージャー。
《講演者からのメッセージ》
音声合成AIを作るには大量の「音声」と「音声に対応したテキスト」いわゆるコーパスが必要です。バンダイナムコ研究所で行っている、台本作り、収録、アノテーションから前処理までのコーパス作成の一例を紹介します。またそのコーパスを使って学習されたミライ小町音声合成AIによる音声生成のデモも予定しています。
関 加奈子
2018年 株式会社Hibou設立
・聴覚障がいをお持ちのお子さんのホームトレーニングサポート
・障がいをお持ちのお子さんの親御さん向け在宅ワーク(療育を行うためにお仕事を退職・休職・勤務日数や勤務時間を短縮された親御さん向けの在宅でのお仕事提供。)
《講演者からのメッセージ》
聴覚障がいをお持ちのお子さんと親御さんの多くは、療育センター等で何年も発話・発語・音声について学びます。それにより発話や音に関する知見が高い為、アノテーション作業ではその経験を活かすことができました。
聴覚障がいをお持ちの方の視覚優位性を活かした画像アノテーションにも、今後取り組んでまいります。
福祉事業×AIという新たな取り組みにご興味をお持ちいただけましたら幸いです。