「俺の声を聞け!」ゲームのための音声入力技術

タグ:
日時:
2023年08月25日(金)14時50分〜15時50分
形式: レギュラーセッション(60分)
受講スキル:
音声入力に興味のあるエンジニア 音声入力をゲームに活用したい方
受講者が得られるであろう知見:
マイクからの音声入力のノウハウ 音声の分析技術、音声入力の活用法
セッションの内容

・最近のゲーム機は、PCやスマートフォンのように、音声入力の機能をサポートするようになりました。
・しかしながら、音声入力を活用したゲームは少ないと思います。
・音声をマイクから取り込んでみると意外と雑音が多く、簡単に処理し活用することは困難です。
・本セッションでは、この音声入力の問題の解決手法、分析手法、活用法を説明します。
1) 音声のキャプチャのためのOSのAPIやデバイスドライバの使い方
2) 雑音交じりの音声を綺麗にする手法 (ノイズキャンセル、エコーキャンセル、AGC、VAD)
3) 音声の分析手法 (音量、音程、音色)
4) 音声入力の活用法(音声コマンドライブラリの実装)
・ 音声入力を活用することで、新しいスタイルのゲームが誕生するかもしれません。
・本セッションが、皆様のゲームの開発の一助になることを願っております。


講演資料

  • CEDEC2023_「「俺の声を聞け!」ゲームのための音声入力技術」_20230825_Finall.pptx

※資料のダウンロードにはログインが必要です。


講演者プロフィール

押見 正雄

押見 正雄
所属 : 株式会社CRI・ミドルウェア
役職 : 代表取締役社長

1987年 早稲田大学理工学部機械工学科卒。
同年  人工知能研究者としてCSK総合研究所(CRI)に入社。
1990~2001年
    セガサターン・ドリームキャストの映像・音声関連のシステムソフト開発に従事。
1995年 サウンドミドルウェア CRI ADXを開発、販売。
2001年 CRI・ミドルウェアの創業メンバーとして参画。
2013年 同社代表取締役就任。

音声・映像の技術が大好きなオヤジエンジニア。

《講演者からのメッセージ》
音声入力は、ボイスチャットや音声認識を実現するためには不可欠な技術です。
ゲームプレイ中に単純にマイクから音声をキャプチャするとノイズまみれの音声になります。
ノイズを除去したり、エコーキャンセルすることで初めてゲームで利用できる音声データになります。
このセッションでは、音声入力のベースとなる技術、また登録型の音声コマンドについてお話します。
皆さんの素晴らしいゲーム開発の一助となることを願っております。

有働篤人

有働篤人
所属 : 株式会社CRI・ミドルウェア

2023年 北海道大学大学院 情報科学院 博士後期課程修了、博士(情報科学)を取得。
同年  株式会社CRI・ミドルウェアに入社。

音楽ゲームに対して「遊ぶ」・「作る」・「研究する」の3つの方向から関わった経験を持つエンジニア。

《講演者からのメッセージ》
今日、リモートワークをはじめとしてマイクから入力された音声を聞いたり取り扱ったりする機会は多くなりましたが、
マイクからの入力をゲームに使おうとして、様々なノイズが原因で思った通りに入力を利用できなかったことは多いのではないでしょうか。
今回はそんな入力をゲーム中で使えるような音声にするための手法についてお話いたします。
ユーザーの音声をゲームに使いたいとお考えの方、ぜひご参加ください。

大町 祥輝

大町 祥輝
所属 : 株式会社CRI・ミドルウェア
部署 : 開発本部 第1開発部
役職 : エンジニア

2019年 サレジオ工業高等専門学校 情報工学科 本科 卒業
同年   株式会社CRI・ミドルウェア 入社

入社五年目の自称CRI音ゲー担当。
主な業務は「CRI ADX」のライブラリ開発。ゲーム機・スマートフォンプラットフォーム対応や音声制御系の処理の実装・メンテナンスを行う。
若さとアーケード音ゲー皆伝としての視点を武器に日々活動中。

《講演者からのメッセージ》
プラットフォームのAPIはマイクの音声を快適に利用させるため、様々な加工を行う場合があります。
これらの機能が音声入力を扱うアプリケーションでは足かせになる場合があります。
また、クロスプラットフォームのアプリケーション開発においては入力される音声データの品質がプラットフォームごとに異なる状況はなるべく避けたいものです。
プラットフォームに備わる入力加工機能やそれの回避方法についてお話できればと考えています。