ページの本文へ

Hitachi

企業情報研究開発

音響・音声信号処理

人や機械が発する音を分析する技術、および人が話す声を分析・合成する技術です。音響信号処理では、機械が発する音から機械の異常を検知したり、人の声からその人の感情などを分析したりできます。音声信号処理には、発話者を特定する話者識別技術、複数話者の声が混じった音声から各発話者の発話区間を特定するダイアライゼーション技術、音声を書き起こす音声認識技術、テキストを音声に変換する音声合成技術などがあります。日立ではこれら技術の研究開発を幅広く行っており、これまでにコールセンタ等の電話音声分析・自動応答ソリューション、コミュニケーションロボットの音声対話機能、製品検査・設備保全等での異常音検知ソリューションなどで応用されています。これらの技術の研究開発を通して、人が使いやすいインタフェースを実現するとともに人と人のコミュニケーション支援にも貢献していきます。

表彰コンペ

2021年1月23日

DIHARD III Organizing committeeThe Third DIHARD Speech Diarization Challenge2位

  • The Hitachi-JHU DIHARD III System: Competitive End-to-End Neural Diarization and X-Vector Clustering Systems Combined by DOVER-Lap
  • 堀口 翔太、Nelson Yalta、高島 悠樹、薛 雅文、藤田 雄介(以上、日立製作所)、Paola Garcia、Desh Raj、Zili Huang、Shinji Watanabe、Sanjeev Khudanpur(以上、Johns Hopkins Univ.)

2020年10月18日

特定非営利活動法人ヒューマンインタフェース学会ヒューマンインタフェースサイバーコロキウム 優秀発表賞

  • 対話型エージェントへの「ミエ」に着目した環境配慮行動促進に関する実験研究(2)〜PEBTを用いた追加実験〜
  • 山脇 瑞記、上田 樹美、石井 裕剛、下田 宏(以上、京都大学)、藤岡 拓也、孫 慶華、朝 康博、沼田 崇志(以上、日立製作所)、伊藤 京子(大阪大学)、佐藤 大樹(芝浦工業大学)

2018年9月14日

Detection and Classification of Acoustic Scenes and Events (DCASE)IEEE AASP DCASE Challenge 2018 - Task 5 - 1位入賞

  • 音響認識の国際コンペティションDCASE 2018 ChallengeのTask 5における公式スコアF1-score on Eval. set (Unknown mic.) にて第1位
  • 田邊 亮、遠藤 隆、二階堂 悠貴、市毛 健志、Phong Nguyen、川口 洋平、浜田 宏一

2018年9月7日

The 5th International Workshop on Speech Processing in Everyday EnvironmentsThe 5th CHiME Speech Separation and Recognition Challenge (CHiME-5) 2位入賞

  • 雑音下音声認識国際コンペティション The 5th CHiME Speech Separation and Recognition Challenge (CHiME-5) 2位入賞
  • 神田 直之、池下 林太郎、堀口 翔太、藤田 雄介、永松 健司

著名な学会での活動

2020年12月

Neural Information Processing Systems FoundationConference on Neural Information Processing Systems (NeurIPS 2020)

  • Sequence-to-Multi-Sequence Learning via Probabilistic Chain Rule
  • Jing Shi、Xuankai Chang、Pencheng Guo(以上、JHU)、Shinji Watanabe、Yusuke Fujita(以上、日立製作所)、Jiaming Xu、Bo Xu(以上、CAS)、Lei Xie(NPU)

論文

この技術に関係する研究者