ページの本文へ

Hitachi

企業情報研究開発

2017年10月18日

発表者からのレポート


図1 提案技術の概要
拡大図

イタリアのアルゲーロでICANN 2017 (26th International Conference on Artificial Neural Networks) が開催されました。ICANNはEuropean Neural Network Society (ENNS) 主催の年次会議で、ヨーロッパ各国で開催されています。近年、さまざまな領域への応用が進んでいる深層学習技術だけではなく、神経活動のモデリングなども扱っている国際会議で、今回のICANNでは33か国から270名が参加し、約180件の発表がありました。

筆者らは、"Parallel-pathway Generator for Generative Adversarial Networks to Generate High-Resolution Natural Images"というタイトルで、深層学習技術の1つである敵対的生成モデル(GANs)を用いた画像生成技術をポスター発表しました。GANsは既存のデータから新たにデータを生成する機械学習技術の1つで近年注目されています。従来のGANsでは128×128以上の解像度の画像や、256×128のようなアスペクト比の異なる画像を生成する際、学習がうまく進まないという課題がありました。本発表では、画像を生成するためのネットワーク構造を、高解像度な画像やアスペクト比の異なる画像を生成できるように改良し、その実験結果を報告しました。


図2 ネットワーク構成
拡大図

従来のGANsによる画像生成技術では、画像生成部は畳み込み層を深く重ねたネットワーク構造をしているのに対し、本技術では2つ以上の畳み込み層を深く重ねたネットワークを並列にスタックし、画像生成部の出力近くで統合する構造を提案しました(図2)。並列構造内のそれぞれのネットワークが異なる画像特徴を生成できるようにすることで、自然かつ解像度の高い画像を生成することに成功しました。本技術を、高解像度な人の顔画像の生成およびアスペクト比の異なる高速道路の監視カメラ画像の生成課題に適用し、その結果を発表にて報告しました。

本技術によって新たなデータを生成することで、これまでデータを手に入れづらかった領域への機械学習技術の導入が可能になると考えられ、新たな価値につながっていくことが期待されます。今後も、提案手法の適用可能分野の探索や、実際に適用した際の問題点などを洗いだし、機械学習技術の高度化に取り組みます。

  • ページの先頭へ