━♪━━━━━━━━━━━━━━━━━━
日本音響学会 学生・若手フォーラム
ASJ Freshニュース 第62号
2019年8月20日 発行
━━━━━━━━━━━━━━━━━━♪━
*♪*━━━━* 目 次 *━━━━*♪*
◆ ハッカソン参加報告(ESPnetハッカソン)
◆ 合同ゼミ参加報告(関西音声合同ゼミ)
◆ 日本音響学会秋季研究発表会ビギナーズセミナー告知
◆ 第4回学生ランチミーティング告知
◆ 若手飲み会告知
◆ 研究会開催情報
*♪*━━━━━━━━━━━━━*♪*
お盆休みも明けて、音響学会秋季研発(ASJ2019a)まであと2週間!
今月も元気にASJ Freshニュースの配信をしたいと思います!
♪*♪*♪━━━━━━━━━━━━━━━━━
ESPnet Hackathon 2019 @Tokyo 参加報告
━━━━━━━━━━━━━━━━━♪*♪*♪
7/29(月)〜 8/1 (木) に、東京で ESPnet (End-to-End Speech Processing Toolkit) のハッカソンを開催・参加しました(LINE株式会社 山本 龍一)。ESPnet ハッカソンの様子と、ESPnet の魅力について簡単に紹介できればと思います。
- ESPnet: https://github.com/espnet/espnet
- ハッカソンイベント詳細: https://espnet.connpass.com/event/139753/
- 開発陣による発表資料: https://espnet.connpass.com/event/139753/presentation/
- 文献(Interspeech 2018): https://www.isca-speech.org/archive/Interspeech_2018/abstracts/1456.html
1. はじめに
ESPnet とは、音声認識・合成・翻訳等をニューラルネットワークを用いてシンプル・統一的・高性能に実現するオープンソースのツールキットです。ESPnet のコア開発メンバーに加えて、企業、大学から集まった多くの音声研究者、技術者が一堂に会し、ESPnet の機能改善を目的としてハッカソンに取り組みました。
2. ハッカソン内容
2.1. 第一部:7/29(月)
ESPnet の筆頭開発者である Johns Hopkins University (JHU) の渡部から、End-to-End 音声認識とは何か、ESPnet はなぜ作られたのかについて解説がありました。また、ESPnet コア開発者より、Google colaboratory を用いたライブデモを交えつつ、ESPnet の具体的な機能の説明、使い方の解説が行われました。その後参加者全員で、音声認識、合成等、テーマごとに分かれて機能改善のための議論を行いました。参加者のバックグラウンドは様々でしたが、非常に盛り上がったように思います。
2.2. 第二部:7/30(火)〜 8/1 (木)
第一部で議論したアイデアをもとに、参加者各自が開発に取り組みました。7/29(月)〜 8/1 (木)の間に、合計でプルリクエスト42件(うち33件がマージ済み)、5件の issue が submit され、非常に活発に開発が行われました。
3. ESPnet の魅力
ESPnet の一開発者として、いくつか魅力をお伝えしたいと思います。
3.1. オープンソース
開発はオープンソース (Apache2.0) で行われており、商用、研究用に問わず使用することができます。
3.2. シンプル
ESPnet は、End-to-End という統一的でシンプルな枠組みにおいて、従来法と比べて非常に簡単に音声認識システムを構築することができます。またそのシンプルさから、音声認識のみならず音声合成・翻訳などその他音声アプリケーションを同様の仕組みで実現することが可能です。
3.3. Kaldi-style のレシピを提供
音声認識において広く使われているツールキット Kaldi (https://github.com/kaldi-asr/kaldi) に習い、レシピという形で音声認識・合成・翻訳システムの構築方法を提供しています。Kaldi に慣れ親しんだ音声研究者にとっては入門がしやすく、またシェルスクリプトを一つ実行するだけで実験を再現することができます。
ESPnet が提供するレシピは多岐にわたり、現時点で32種類のコーパスに対するレシピがメンテナンスされています。 https://github.com/espnet/espnet/tree/master/egs
3.4. 高性能
データが十分にある条件では、人手によってチューニングされた既存のパイプライン式の音声認識システムに迫る性能を出すことが可能です。最新の結果では、LibriSpeech コーパスを使用した英語音声認識のタスクにおいて、Google によって2019年4月に発表された SpecAugment (https://ai.googleblog.com/2019/04/specaugment-new-data-augmentation.html) と同等の性能を達成できることがわかっています。
4. おわりに
ESPnet のハッカソンを開催・参加し、その内容及び ESPnet の魅力を簡単に紹介しました。ESPnet はコミュニティベースで活発に開発が行われています。新規機能追加、使いやすさの向上、テスト・ドキュメントの充実など、多くの改善が継続的に取り組まれています。興味のある方は、ぜひ一度使ってみてはいかがでしょうか。
(LINE株式会社 山本 龍一、https://github.com/r9y9)
♪*♪*♪━━━━━━━━━━━━━━━━━
合同ゼミ参加報告(第49回関西音声合同ゼミ)
━━━━━━━━━━━━━━━━━♪*♪*♪
〇はじめに
2019年7月13日に、第49回関西音声合同ゼミが奈良先端科学技術大学院大学(NAIST)にて行われました。関西音声合同ゼミは1講演・3ポスターセッションで構成され、NAISTの松本裕治教授が構文解析について公演されました。ポスターセッションは参加大学の学生による発表で、音声のみならず、音響、対話、パターン認識など広い分野の研究について発表がありました。
- 第49回 関西音声合同ゼミ(https://ahcweb01.naist.jp/KJSS/2019summer/)
〇関西音声合同ゼミの様子
会場はNAISTで、1つの会場で参加者は100人を超えます。どの発表にも多くの聴衆があつまり活発な議論が行われました。
ポスター発表会場の様子 | 懇親会の様子 |
〇関西音声合同ゼミの研究の内容
関西音声合同ゼミは、参加大学の持ち回りで開催され様々な分野の第一人者による講演が最初にあり、その後参加大学のの学生によるポスターセッションが行われます。毎年のポスターセッションでは、音声のみならず、対話、感情認識、音響、言語処理、パターン認識など多岐にわたる分野の発表があり、多くの研究が深層学習を利用した研究でした。
〇主催校の準備
この度、第49回関西音声合同ゼミをNAISTで行うにあたって、教員・学生有志ら一丸となって発表会場や懇親会の準備を行いました。土地柄、交通の便が悪く参加者に注意を促したり、前日に会場設営の予行演習をしたり大忙しでした。しかし、そのおかげか当日は特に大きな問題もなく進行できました。この関西音声合同ゼミは、学生主体の発表で柔軟な発想で、様々な研究テーマについての発表があり、ユニークな研究も多いのが特徴です。また、近隣の大学の学生の交流の場にもなっており懇親会も多くの学生が参加しました。
〇おわりに
次回は第50回関西音声合同ゼミが開催されるそうです。機会があればまた参加したいと思っています。
(奈良先端科学技術大学院大学 叶 高朋)
♪*♪*♪━━━━━━━━━━━━━━━━━
2019年 日本音響学会秋季研究発表会ビギナーズセミナー告知
━━━━━━━━━━━━━━━━━♪*♪*♪
学生・若手フォーラムでは,研究発表会にあわせてビギナーズセミナーを主催しています。学生や新入社員など,新たに音響研究分野に入ってこられた方を対象としたセミナーです。
テーマ
空間音響ことはじめ
内容
空間音響は、音の広がりや聴こえ方を制御・認識する技術の総称であり、様々な音響コンテンツを楽しむ上で欠かせない存在です。本セミナーでは、空間音響の幅広い研究分野を俯瞰し、技術がどのように発展してきたか・どのような使われ方をしているかなどをご紹介頂きます。空間音響に興味ある方、分野外の方も是非ご参加ください。
プログラム
1. 16:30-16:35 「ビギナーズセミナー開会の挨拶」
池宮 由楽(ソニー(株) オーディオ技術開発部/学生・若手フォーラム幹事
2. 16:35-17:10 「バイノーラル収音・再生」
森川 大輔(富山県立大学)
概要:バイノーラル再生は、両耳に装着したマイクロホンで録音した信号(バイノーラル信号)を、イヤホンなどを用いて聴取者の両耳位置で呈示することで、録音した空間の立体音を再生する方法である。本講演では、バイノーラル信号を得る方法、バイノーラル再生を行う方法、それぞれの注意点について解説するとともに、その歴史を紹介する。
3. 17:15-17:50 「音場収音・合成/再現」
小山 翔一(東京大学大学院)
概要:音のVR/ARを実現する上で、音空間の提示は必要不可欠な要素である。本講演では、両耳への音の直接提示を前提とするバイノーラル技術とは対照的に、複数のスピーカを用いてある領域内に音空間を提示する音場再現技術の基礎事項を解説する。また、再現する音空間を計測により取得するための、音場収音技術についても取り上げる。このような技術の特長は、音の空間的な制御によって、受聴者の動きへの対応や複数の受聴者への提示が可能となる点にある。関連技術の歴史的な変遷に加えて、最先端の研究内容についても紹介する。
小泉 悠馬(NTTメディアインテリジェンス研究所/学生・若手フォーラム代表)
♪*♪*♪━━━━━━━━━━━━━━━━━
第4回学生ランチミーティング告知
━━━━━━━━━━━━━━━━━♪*♪*♪
昨年に引き続き,日本音響学会2019年秋季研究発表会の期間中,「第4回学生ランチミーティング」を開催します!
本イベントは,秋季研究発表会に参加する学生間での学術的な情報交換の場の提供,また研究室・研究分野を超えた学生間の交流の促進を目的としています.異分野の学生同士がグループとなり,昼食をとりながら各自の研究(発表)内容について紹介し合う交流イベントです.
日時:2019年9月4日 (水) 12:00 ~ 12:45 (11:45 受付開始)
場所:立命館大学 びわこ・くさつキャンパス
ユニオンスクエア2F (ユニオンフードコート)
参加費:無料(昼食付)
参加資格:秋季研究発表会に参加の学生
定員:100名
—————————————————————————————————–
参加をご希望の方は,以下のフォームに必要事項をご記入の上,送信してください.
余裕があれば当日参加も受け入れますが,できるだけ登録をお願いいたします.
https://docs.google.com/forms/d/e/1FAIpQLSdPoZTIM05ViIlG26iUwCmp8zOb8SsjVj-xdlP1QHp7-SvgyA/viewform
※締切日:9月2日(月)(飛び入り参加できますが、予め登録していただけると幸いです)
♪*♪*♪━━━━━━━━━━━━━━━━━
若手飲み会告知
━━━━━━━━━━━━━━━━━♪*♪*♪
今回の音響学会研究発表会も初日の夜に若手飲み会を企画しております。
[開催概要]————————————–日時:9月4日(水)(学会初日)19:00~21:00 (予定)
会場:カフェ+バル フィオーレ(https://r.gnavi.co.jp/kafw000/)
滋賀県草津市大路1丁目15-39
会費:3000円(飲み放題)
アクセス:JR 草津駅 東口 徒歩4分
————————————–———–
毎回参加していただいている皆様、今回参加しようかなと思ってみる皆様、是非初日の夜は予定をあけておいてください!
色んな若手の方と交流を持てる絶好のチャンスになること間違いなし!
参加をご希望の方は,以下のフォームに必要事項をご記入の上,送信してください.
https://forms.gle/uSQpMv9X3S2QX7BJ9
※ 締切日:8月27日(火)一時締切 (飛び入り参加できますが、予め登録していただけると幸いです)
♪*♪*♪━━━━━━━━━━━━━━━━━
研究会開催情報
━━━━━━━━━━━━━━━━━♪*♪*♪
○超音波研究会(US)
直近の研究会:8/28 @東京工業大学蔵前会館ロイアルブルーホール(東京都)
○電気音響研究会(EA)
(http://asj-eacom.acoustics.jp/)
直近の研究会:10/28,29 @NHK放送技術研究所(東京都)
○音声研究会(SP)
(http://www.ieice.org/iss/sp/jpn/)
直近の研究会:8/28 @京都大学 学術情報メディアセンター(京都府)
○騒音・振動研究会(N)
(http://asj-ncom.acoustics.jp/)
直近の研究会:9/24@関西大学(大阪)
○建築音響研究会(AA)
(http://asj-aacom.acoustics.jp/)
直近の研究会:10/18 @岡山国際交流センター(岡山県)
○聴覚研究会(H)
(http://asj-hcom.acoustics.jp/)
直近の研究会:10/28,29 @NHK放送技術研究所(東京都)
○音楽音響研究会(MA)
(http://musical-acoustics.org/)
直近の研究会:8/24 @WOWOW放送センター(東京都)
○アコースティックイメージング研究会(AI)
(http://asj-aicom.acoustics.jp/)
直近の研究会:10/17 @東京大学生産技術研究所(東京都)