エンタメから社会課題、チームで乗り越えた音声AIの研究開発と実用化

タグ:
日時:
2021年08月25日(水)16時10分〜17時10分
形式: レギュラーセッション(60分)
受講スキル:
AIに関連した研究開発やその実用化に興味のある方 音声信号処理およびディープラーニングに関する基本的知識があることが望ましい
受講者が得られるであろう知見:
音声合成および音声変換に関する知見 PCやスマートフォン上の単独アプリ、またクラウド上のサービスとしてAIを実装する方法
セッションの内容

音声認識や音声合成といった技術は古くからありますが、ディープラーニングの登場と進化に伴い、その可能性は大きく開きつつあります。しかしこうした技術の進展が、具体的にどのように人の役に立ったり、人を楽しませることができるのか、国際学会の研究成果を眺めるだけでは、なかなかイメージしにくいという方が多いのではないでしょうか?
そこで本セッションでは、DeNAの音声AIチームに所属する3名が、納品または公開実績のある開発事例を「エンタメ」と「社会課題」からそれぞれピックアップし、技術の進化を皆様の耳でもちろん「日本語」で体感していただくとともに、要素技術に関する解説はもちろん、台本作成やアノテーションといった実用化のためには避けられないプロセスをわかりやすくお伝えします。


講演資料

  • 20210825_CEDEC2021_Public.pdf

※資料のダウンロードにはログインが必要です。


講演者プロフィール

竹村 伸太郎

竹村 伸太郎
所属 : 株式会社ディー・エヌ・エー
部署 : システム本部データ統括部AI基盤部

奈良先端科学技術大学院大学(NAIST)卒。 大手ゲーム会社などを経て、2020年DeNA中途入社。 2児の父。
現職では、「七声ニーナ」のような一般向けWebサービスの開発・運用から、事業ごとにプラットフォームが異なるネイティブアプリへの組み込みなど、AI技術の実用化を幅広い技術領域で担当しております。お気軽にご相談ください。

過去の講演
ゲームメーカー目線で Azure を活用した開発インフラのクラウドシフトとアプリ設計事例紹介, de:code 2019
ディープラーニングによる画像処理を実機側で高速に動かし、活用する技術, CEDEC 2019
分析業務をブーストするBIツール活用術, CEDEC 2017
アプリマーケット情報を活用して、ログに頼れない分析に立ち向かおう, CEDEC 2015
データ活用で生産性UP!統計分析を伴うツール開発の舞台裏, CEDEC 2011

《講演者からのメッセージ》
受講までに「VOICE AVATAR 七声ニーナ」を是非ご体験ください!当日は、わかりやすく実装ノウハウをお伝えできたらと思います。

滝口 啓介

滝口 啓介
所属 : 株式会社ディー・エヌ・エー
部署 : システム本部データ統括部AI研究開発部第二グループ

2020年4月 DeNA 入社
研究開発チームで、深層学習を用いた音声合成・音声変換に関する研究開発を行う。

《講演者からのメッセージ》
講演では、DeNAの音声変換や音声合成に関する取り組みについてご紹介できればと思います。
「VOICE AVATAR 七声ニーナ」では、現在DeNAで開発中の音声変換システムを体験することができるので、是非一度お試しください!

豆谷 浩輝

豆谷 浩輝
所属 : 株式会社ディー・エヌ・エー
部署 : システム本部データ統括部AI研究開発第二グループ

【略歴】
2020年 Universitat Pompeu Fabra, Sound and Music Computing - MSc修了
2020年 株式会社ディ・エヌ・エー入社
【主な論文】
Investigating context features hidden in End-to-End TTS (2019, ICASSP)
【その他】
YouTubeチャンネル Joytanで音声合成を活用した言語学習サービスを公開中

《講演者からのメッセージ》
日本語音声合成を構築する方法について発表します。理論的背景から泥臭い作業まで幅広くカバーし、研究開発の全体像をご紹介します。

共同研究・開発者

森 紘一郎, 株式会社ディー・エヌ・エー