◆ 音学シンポジウム2025参加報告
━♪━━━━━━━━━━━━━━━━━━
日本音響学会 学生・若手フォーラム
ASJ Freshニュース 第130号
2025年6月25日 発行
━━━━━━━━━━━━━━━━━━♪━
はじめに
まだ6月だというのにまるでRMEのオーディオインターフェースのような暑さですね. 今月号は6月13日,14日に開催された音学シンポジウム2025の参加レポートをお送りします.
音学シンポジウム2025 参加報告
2025年6月13日~14日の2日間,早稲田大学西早稲田キャンパスで音学シンポジウム 2025 (第143回音楽情報科学・第156回音声言語情報処理合同研究発表会)が開催されました.音にまつわるあらゆる研究を対象とした6月の風物詩的なシンポジウムです.招待講演とポスターセッションで構成され,すべてがシングルトラックで進行します.単なる研究会としてだけでなく,学生や若手研究者が発表経験を積む場として,発表の門戸が広く開かれているのも大きな特徴です(本フォーラムとのシンパシーを感じますね!).ディスカッションを目的とした萌芽的な初期検討や,研究紹介として既発表の研究でも申込が可能で,毎年個性的な研究が集まります.
豪華なチュートリアル・招待講演
音学シンポジウムを語るうえで外せないのが招待講演です.音分野の第一線でご活躍されている研究者の方々が,分野の動向やご自身の研究について分かりやすく解説してくださいます.すでに知っている内容でも理解が深まること間違いなしです.
今年は,以下の方々をお呼びして,基礎研究から実運用を通じた知見まで盛りだくさんな内容のご講演でした.
- 佐藤 庄衛 様 (NHK):
「公共メディアにおける音声技術の応用」
- 米山 怜於 様 (名古屋大学):
「ニューラルボコーダ概説:生成モデルと実用性の観点から」(講演スライド)
- 戸田 智基 先生(名古屋大学):
「音声研究の知見がニューラルボコーダの発展にもたらす効果」
- 落合 翼 様 (NTT):
「遠隔発話音声認識のための音声強調フロントエンド:概要と我々の取り組み」
- 小松 亮太 様 (東京科学大学):
「マルチモーダル大規模言語モデル入門」(講演スライド&ハンズオン資料)
- 瀧田 雄太 様,光藤 祐基 様(Sony AI):
「Deep Generative Models for Audio Applications」
- 藤坂 洋一 様(リオン株式会社):
「人と人をつなぐリアルタイムコミュニケーションデバイス」
- 松山 洋一 様 (株式会社エキュメノポリス):
「人の可能性を解き放つ対話型診断AIエージェントの開発」
担当者が面白いと思った発表
今月号を担当する小口が個人的に面白いと思った発表を紹介します.
「順序を考慮したオーディオエフェクトチェインの推定に対する双曲埋め込み」
和田 仰 (東京大学/産業技術総合研究所), 中村 友彦 (産業技術総合研究所), 猿渡 洋 (東京大学)
今年の学生優秀発表賞の一つです. 残響を付与したり歪みを加えたりと,オーディオエフェクトを多段に組み合わせることによって様々な音色を作ることができます.この研究はその逆問題として,すでに加工された音に対して,どのオーディオエフェクトが組み合わされているか(オーディオエフェクトチェイン)を推定する研究です.ではなぜ双曲空間が登場するのでしょうか?エフェクトを多段につなぎ合わせるとき,複数あるエフェクトから一つずつ選びながら適用することになります.つまり,オーディオエフェクトチェインの決定問題は木構造を辿ることと等価です.このとき,木構造は階層が増える度に(エフェクトをつなぐ度に)ノード数が指数関数的に増大します.一方,双曲空間も中心からの距離に応じて面積や体積が指数関数的に増加する曲がった空間です.そのため,オーディオエフェクトチェインの木構造は双曲空間と相性がよく,実験結果もそれを示唆するものでした.
オーディオエフェクトチェインを木構造と捉えるアイデアが面白く,双曲埋め込みを利用して効果的に解いているところも美しいポイントで,納得の受賞でした.
おわりに
今年も大変興味深い招待講演と個性的な研究が盛り沢山でした.2日間に凝縮された音学シンポジウムの模様をお送りしました.聴講するもよし,発表するもよし,音研究を始めたばかりのビギナーにうってつけの研究会だと思います.毎年開催されていますので,皆さんもぜひ参加されてみては!