本講演では位相を引数とする神経回路網を用いて3次元動画における人物の動作を実時間で制御する手法を提案している。本手法では神経回路網の重みが歩容動作の位相によって計算される(これをPFNNと呼ぶことにする)。 PFNNでは位相を与えることによって神経回路網の重みがまず計算され、使用者の制御信号、人物の前の状態、三次元仮想空間の幾何形状を入力として、動作が計算される。 歩く、走る、跳ぶ、這い登るといった動作に仮想空間の地形データを当てはめたものを大量に入力として与え、神経回路網の全階層を同時に学習させる。これにより実行時に人物は自動的に環境の三次元形状に適応することができ、でこぼこな地形の上を歩いたり、石を乗り越えたり、障害物を飛び越えたり、低い天井の下をかがみながら進んだりすることができる。本手法では潜在的な変数である歩容の位相を明示的にシステムに組み込むことにより、LSTMといった従来ある自己回帰的手法と比べてより高い品質の動作が生成することができる。また、動作の生成を非常に高速、なおかつ少ないメモリの使用で実現できる。もともとギガバイト単位の容量の動作データであっても学習後の神経回路網の容量は数メガバイトしかなく、また動作もミリ秒単位で計算される。本手法は三次元仮想空間やゲームなどの対話的なアプリケーションにおいて、仮想的な人物を制御するのに向いている。
※ 本招待セッションは、情報処理学会コンピュータグラフィックスとビジュアル情報学研究会とのコラボレーション企画セッションとなります。
情報処理学会コンピュータグラフィックスとビジュアル情報学研究会 公式サイト: http://cgvi.jp/
講演者プロフィール
幸村 琢
経歴:
2000東京大学理学系研究科情報科学専攻博士。2000−2002 理化学研究所基礎科学特別研究員。2002−2006 香港城市大学助教授。2006−2011 エジンバラ大学講師。2011−現在 エジンバラ大学准教授
《講演者からのメッセージ》
大量のモーションキャプチャーデータを用いた実践的な機械学習手法について話します。