音声圧縮コーデックOpus解体新書

タグ:
日時:
2022年08月23日(火)13時30分〜14時30分
形式: レギュラーセッション(60分)
受講スキル:
・音声圧縮技術に興味のあるサウンドプログラマ、サウンドデザイナ ・音声を用いたコミュニケーションに興味のあるすべての方 ・サウンドデータの容量削減したい方
受講者が得られるであろう知見:
・音声圧縮のための信号処理の基礎知識 ・人の声に特化した圧縮技術と音楽などの汎用的な音声の圧縮技術の違い ・音声通信などに発生する音声データが欠損した時の補完技術 ・通信量を抑えるための信号処理技術(ボイスディテクションなど)
セッションの内容

・音声通信をはじめ、様々な分野で音声圧縮コーデックOpusが活用されています。
・歴史的な背景からOpusは、様々な分野に適応するように設計されました。
・しかしながら、多くの高度な圧縮手法が搭載され、難解なコーデックになっています。
・本セッションでは、このOpusの仕組みを紐解き、適切な使用方法を解説します。
・Opusは、通話のためのSILK圧縮と音楽のためのCELT圧縮が混在しています。
・SILKは、線形予測法を利用した圧縮コーデックです。
・CELTは、MDCTを使用した周波数領域での圧縮コーデックです。
・Opusを使いこなすためには、SILKとCELTの違いを正しく理解する必要があります。
・また、通信におけるパケットロスに対応した様々な機能が搭載されています。
・DTX、CNG、LBRRのような呪文のような高度な技術を解説します。
・特に音声通信には向いており、堅牢性の高いシステムの構築ができます。
・本セッションが、皆様のゲームの開発の一助になることを願っております。


講演資料

  • CEDEC2022_Opus_RC_06.pptx

※資料のダウンロードにはログインが必要です。


講演者プロフィール

押見 正雄

押見 正雄
所属 : 株式会社 CRI・ミドルウェア
役職 : 代表取締役社長

1987年 早稲田大学理工学部機械工学科卒。
同年  人工知能研究者としてCSK総合研究所(CRI)に入社。
1990~2001年
    セガサターン・ドリームキャストの映像・音声関連のシステムソフト開発に従事。
1995年 サウンドミドルウェア CRI ADXを開発、販売。
2001年 CRI・ミドルウェアの創業メンバーとして参画。
2013年 同社代表取締役就任。

音声・映像の技術が大好きなオヤジエンジニア。

《講演者からのメッセージ》
1994年にADXという音声圧縮技術を開発して、四半世紀が経ちました。
音声圧縮技術の進歩には目を見張るものがあります。
音声圧縮コーデックOpusは複雑ですが、その技術には学ぶべき要素が多くあります。
音声圧縮技術の深淵を感じていただければ幸いです。

及川進

及川進
所属 : 株式会社 CRI・ミドルウェア
部署 : 研究開発本部 第二開発部

2007年入社。
オーディオ、ファイルシステム系ミドルウェアのエンジニア。
ゲーム機向けのミドルウェア開発の他、業務機器向けのソフトウェア設計や開発、また、音声信号処理の研究開発等も手掛ける。

CEDEC2014でマルチストリーミング再生に関するショートセッションを行った。

《講演者からのメッセージ》
過去、音声は録音済みのデータをディスクメディアからストリーミング再生していました。
それに加えて、今日ではリアルタイム入力された音声のネットワークストリーミング再生が当たり前になっています。
音声のリアルタイムネットワークストリーミングで考慮すべき事は多岐にわたりますが、本セッションではOpusというコーデックの解説を通して、どのような点に考慮が必要なのかを明らかにしたいと考えています。
本セッションが開発の一助となれば幸いです。

石松宏幸

石松宏幸
所属 : 株式会社 CRI・ミドルウェア
部署 : 開発本部 第1開発部
役職 : マネージャ

2013年 東京大学理学系研究科卒業。
同年  株式会社CRI・ミドルウェアへ入社。
オーディオやファイルシステムのゲーム系ミドルウェアや、オーディオオーサリングツールの開発に携わる。

《講演者からのメッセージ》
音声圧縮は古くから研究されてきた分野でありながら、現在も日々新たなニュースが飛び交い、進化し続けています。
不連続転送やパケロス対応など、Opusコーデックで使用されている多様な工夫に触れ、受講いただいた皆様の今後の研究開発のヒントとなるよう努めます。