近年、ニューラルネットワークによって写真のようにリアルな画像を作ることができるようになってきました。
しかし、形状や位置、光環境、見た目などのパラメータを自由に指定して一貫性のある結果をAIで生成することは未だ困難です。
そのような制限を乗り越えるには各パラメータに特化したAIのインフラが必要になります。
本発表では、AIによって直接描画することを目指し、人間の顔面を対象として取り上げます。望ましい出力を得るために適切なパラメータを解析、教師データ生成のためのインフラや神経回路網の構成を比較し、実装します。
特に、光源環境、造形の特徴等を含む構造化入力引数の顔面3Dデータフォーマットを生成するGPGPUアルゴリズムを開発、応用、評価しています。
講演資料
- CEDEC2020_SiliconStudio_Hertzberg_The_Road_to_End_to_End_AI_Rendering.pdf
- CEDEC2020_SiliconStudio_Hertzberg_The_Road_to_End_to_End_AI_Rendering.pptx
- CEDEC2020_SiliconStudio_Hertzberg_The_Road_to_End_to_End_AI_Rendering_note.pdf
※資料のダウンロードにはログインが必要です。
講演者プロフィール
フレドリック・ヘルツベルユ
GPGPUと神経回路網は両方並列化の一種だと思います。両方とものアーキテクチャーに深い興味を持つ、神経の構成をGPUのニーズに合わせようとしています。APIの激励でGPUが統合されている単体のようによく使われていますが、各小部分に命令スケジューリングが独立に行われています。小部分内にはシンクロやメモリの遅延がネックにならなくて、最適化のバランスが古のハードに近づいています。Turing世代GPUのプロセッシングブロック当たり64KBのレジスタメモリがあります。スーパーファミコンには命令スケジューラ当たりのメモリも64KBでした。その時代程の最適化がまた必要になれそうです。お楽しみにします。
《講演者からのメッセージ》
AIリアルタイム描画アーキテクチャーの業界標準はまだまだ固まっていません。道を選ぶタイミングは今です。一緒に選択を分析しましょう。