フィジカルAIの“基本”

フィジカルAIとは何か？
AIは「情報処理」から「現実を動かす」存在へ
物理世界に作用する仕組みと安全性の考え方

2026/03/23

OVERVIEW

デジタルから物理空間へ――AIトレンドの変遷と現在地
物理世界をデータから「経験的」に学ぶ
人間の活動と同じ？「目→脳→指示出し→手足」の連携
「セキュリティ」と「セーフティ」をどう考えるか
労働力不足を解消し、熟練の「勘」を継承する
ITとOTの融合がもたらす日立の強み
社会課題解決に向けた「手段」としてのAI

現在、各社が注目する「フィジカルAI」とは一体何か？
AIが物理世界に作用する仕組みや安全性を担保する考え方など、フィジカルAIを語る前に知っておくべき“基本”を日立のAIアンバサダーでもある吉田順が分かりやすく解説する。

AIの進化はとどまることを知らない。ディープラーニング（深層学習）による「認識AI」の登場から始まり、ChatGPTに代表される「生成AI」、自律的にタスクをこなす「AIエージェント」へと、その主戦場はデジタル空間の中で拡大した。

そして現在、新たに注目されているのが、現実世界で物理的なタスクをこなす「フィジカルAI」だ。日立製作所（以下、日立）でAIトランスフォーメーションをリードする吉田順に、「フィジカルAIの基本」を聞いた。

デジタルから物理空間へ――AIトレンドの変遷と現在地

AIが社会やビジネスの在り方を根本から変え始めて久しい。これまでのAIブームを振り返ると、その主戦場は常に「デジタル空間」の中にあった。2012年にディープラーニングが脚光を浴びた「認識AI」、2022年にChatGPTが世界に大きな影響を与えた「生成AI」など、AIが得意としていたのは情報の分類や予測、テキストや画像の生成といった画面の中で完結する処理だった。

吉田は、こうした技術の潮流をビジネスの最前線で見つめてきた。同氏が率いるデータサイエンスチームは、2012年はわずか10人ほどの規模からスタートしたという。その後、デジタルソリューション「Lumada」（ルマーダ）※の立ち上げや、2018年の「データサイエンティスト3,000人宣言」、2021年のGlobalLogic買収などを経て組織は急成長を遂げた。吉田はその過程で、製造や電力といった社会インフラの現場にAIをいかに実用化するか模索してきた、いわば「現場を知り尽くす専門家」だ。
※）Lumada（ルマーダ）：日立

吉田順（日立製作所 AI＆ソフトウェアサービスビジネスユニット AI CoE HMAX＆AI推進センター本部長兼 Chief AI Transformation Officer AIアンバサダー）

そんな吉田の視座から見て、現在のAIトレンドは新たな局面を迎えている。2024年から2025年にかけて台頭した「AIエージェント」への移行だ。これは単に、問いに答えるだけでなく目標達成に向け自律的にタスクを設計・実行する存在を指す。2026年現在はまさに本格導入期だが、市場の関心はすでにその先へと向かっている。デジタル空間の枠を超え、現実世界への適用が注目され始めている「フィジカルAI」という新たな潮流の誕生だ。

物理世界をデータから「経験的」に学ぶ

吉田はフィジカルAIを、大枠として「物理空間に作用し、自律的な動きを伴うAI」と表現する。生成AIがテキストから「言語の論理」を身に付けたのに対し、フィジカルAIは現実世界の「現象」や「振る舞い」をデータから経験的に学習する点に本質がある。

日立は、AIを用いたシステム全体のプロセスを「Sense（感知）／Store（蓄積）／Think（思考）／Act（行動）」の4つのステップで定義している。吉田が強調するのは、「Think」の進化だ。かつてのロボット制御は、人間が「この角度でトルクをこれだけかける」といったルールをプログラムとして教え込む必要があった。しかし、最新のフィジカルAIは、大量のデータから動作を直接学習している。

AIシステム全体のプロセス（Sense／Store／Think／Act）（提供：日立。以下同）

「物理法則を数式で教えるのではなく、大量の動画データから『それっぽく』学んでいるのが、今のフィジカルAIの面白いところです」と吉田は話す。AIは法則を人間のように理解しているわけではないが、ボールを投げれば落ちることを幼い子供が学ぶように、過去のデータから物理世界の挙動を予測する能力を獲得した。

この進化を支えているのが、膨大な学習を可能にする強力な演算基盤とデータの爆発的な増加だ。現実には撮影が困難な「時速500キロで走行する車の挙動」などの合成データを作成して、シミュレーション空間でAIを鍛え上げることが可能になった。また、巨大なAIモデルをエッジ環境で稼働させるため、モデルを軽量化・圧縮する「蒸留」技術の普及が、現場でのリアルタイムな動作を後押ししている。

人間の活動と同じ？「目→脳→指示出し→手足」の連携

フィジカルAIは単一のアルゴリズムではない。複数のAI技術が組み合わさって機能する高度な「システム」だ。吉田はその全体像を、人間の身体の働きになぞらえて「目→脳→指示出し→手足」という流れで説明する。

ただし、この4つの要素は必ずしも常に独立したAIとして存在するわけではない。用途やアーキテクチャーによって、それぞれが役割として分化する場合もあれば、1つのAIモデルの中に統合される場合もある。

まず「目」の役割を担うのが認識AIだ。カメラや各種センサーを通じて、周囲の環境や対象物の状態を把握する。次に「脳」として機能するのが生成AIで、自然言語による指示を理解して「何をすべきか」を論理的に推論する。

その推論結果を、具体的な作業手順へと落とし込むのが「指示出し」に相当する部分だ。「荷物を運べ」という抽象的な命令を、「どの順番で、どの経路を通り、どう動作するか」といった実行可能なタスクへ分解する。この工程はAIエージェントとして実装されることも多い。

そして最終的に、「手足」として実世界で動作を生み出すのが「ロボット基盤モデル」だ。モーターの回転や関節の角度、トルクといった物理的な制御量を生成し、ロボットや設備を実際に動かす。近年注目されているロボット基盤モデルの中には、視覚情報と言語指示を入力として、動作そのものを直接生成するタイプも登場している。こうしたモデルは、「目→脳→指示出し→手足」という一連の流れを、エンド・ツー・エンドで1つのAIとして実現している点が特徴だ。

言い換えればロボット基盤モデルとは、従来はタスクごとに個別設計されていたロボット動作生成AIを、より汎用（はんよう）的に扱えるようにしたものだ。特定の作業だけをこなす「専用の手足」から、多様な動作やタスクを学習によってこなせる「汎用的な身体」へと進化させようとする試みともいえる。

このようにフィジカルAIは、役割分担された複数のAIが連携する形としても、あるいは1つの統合モデルとしても実装されうる。重要なのは、知覚・推論・動作が切れ目なく結び付くことで、AIが人間の意図を理解し、現実世界で適切な行動を起こせるようになる点だ。

日立はこの複雑な連携を、現実世界の物理現象を扱うモデルと言葉を理解するモデルを統合した「IWIM」（アイウィム：Integrated World Infrastructure Model）というコンセプトで具現化している。吉田は、「言葉で理解する側と、重力や慣性といった物理世界を理解する側を統合することが、これからの社会インフラを支えるアプリケーションには不可欠です」と語る。「言語モデル」と「物理世界を扱うモデル」を統合することで、AIは人間の意図を推測しながら状況に応じた行動を選択できるようになりつつある。

「セキュリティ」と「セーフティ」をどう考えるか

フィジカルAIが鉄道や電力、医療といった社会の根幹を支える領域に進出するに当たって避けて通れないのが「信頼性」の議論だ。物理世界で操作するフィジカルAIのミスは、人命に関わる重大な事故に直結する。

吉田が強調するのは、サイバー攻撃からシステムを守るセキュリティだけでなく、物理的な事故を防ぐ「セーフティ」を融合させる重要性だ。「従来の生成AIはセキュリティ対策が中心でしたが、フィジカルAIはセーフティの担保が極めて重要です」

AIが最短ルートを推論しても、進路上に人間がいれば論理的なガードレールが作動し、機械を強制停止させる仕組みが必要だ。「ボタンを押せば確実に止まる」といったフェイルセーフや、既存の安全基準、法令に準拠した厳格な制御がこれに該当する。

こうした安全性の担保はAIの自由な挙動を制限し、社会実装のハードルを上げる側面もある。しかし吉田は、インフラを担う企業としてセーフティの確立こそが普及の絶対条件だと強調する。

労働力不足を解消し、熟練の「勘」を継承する

フィジカルAIに寄せられる大きな社会的期待の一つといえば、日本が直面している深刻な労働力不足への処方箋となることだろう。生産ラインが動的に最適化されるスマートファクトリー、自律走行する物流ロボット、ドローンを活用したインフラ保守、さらには鉄道の完全自動走行などが具体的なユースケースとして挙げられる。

興味深いのは、フィジカルAIが単なる自動化にとどまらず、日本の製造業が抱える熟練者の技能継承に新たな道筋をつける点だ。熟練の職人が無意識に行っている勘やコツといった暗黙知を、AIは動作のデータとして模倣し、デジタル資産として次世代に継承できる。吉田は「動きを模倣するのはAIの得意分野です。熟練者の動きをフィジカルAIが捉えれば、その知見をデジタル資産として残していけるはずです」と語る。

フィジカルAIの主な活用領域

一方で、吉田は「大本の問いを立てるのは人間」だという原則を説く。AIに全てを委ねるのではなく、人間が「何を解決したいのか」という意志を持ち、その手段としてAIを使いこなす共生モデルを提示する。現場の課題を解くのはあくまで人間であり、AIはその実行能力を飛躍的に高めるためのツールに過ぎない。

ITとOTの融合がもたらす日立の強み

世界中のテック企業がフィジカルAI領域に参入する中で、なぜ日立が勝機を見いだせるのか。吉田はその理由を、IT（情報技術）とOT（制御・運用技術）、そして物理的なプロダクトの三要素を自社で保有している「総合格闘技」的な強みにあると述べる。

現場のドメイン知識を持たないITベンダーがデータだけでフィジカルAIを組もうとしても、複雑な現実世界に安全に適合させることは困難だ。日立には、鉄道など重要インフラをはじめとする多様な現場を知り尽くした技術者と、最新のAIを操るデータサイエンティストが共通言語で語り合える土壌がある。現場の要件を深く理解しているからこそ、AIを安全かつ確実に実装できる。この点こそが日立の真の優位性といえるだろう。

日立は、AIモデルなどの最新テクノロジーを適材適所で取り入れながら、自らが最も得意とする「ITとOTの掛け算」によるソリューション提供に集中している。この現場への深い理解とITを統合したのが、AIで社会インフラを革新する次世代ソリューション群「HMAX™ by Hitachi」だ。同社はこれを強力な基盤とし、視座をすでに「その先」にある実社会の課題解決へと向けている。

社会課題解決に向けた「手段」としてのAI

吉田は、現在のAIブームを俯瞰（ふかん）し、次のように語る。

「私たちは今、世の中の潮流に流されるのではなく、何が社会課題で、どう解かなければならないのかを考えるべきでしょう。AIブームは、あくまで課題を解くための『手段』が増えた状態に過ぎないのですから」

日本の製造業が持つ現場の知恵や経験といった「深さ」と、グローバル企業が持つ仕組み化やオペレーションの強さといった「広さ」を融合させる。この「面積」を最大化することが、日立が進めるフィジカルAIの本質だ。現場の熟練者が持つ暗黙知をデジタル化し、それをグローバルな標準システムに乗せて展開する。この融合が実現したとき、日本の産業競争力は改めて高く評価されることになるだろう。それは実社会の問題を解決し、世界市場で戦うための強力な武器となるはずだ。

HMAXの看板の下で、日立は国内のみならずグローバル市場に向けてフィジカルAIを真の「手段」として社会実装する。それによって築かれる未来は、私たちの想像をはるかに超える強靭（きょうじん）で持続可能なものとなっているに違いない。

監修吉田順

日立製作所
AI＆ソフトウェアサービスビジネスユニット AI CoE
HMAX＆AI推進センター本部長
兼 Chief AI Transformation Officer
AIアンバサダー

*
全ての製品名、サービス名、会社名、ロゴは、各社の商標、または登録商標です。
*
製品の仕様・性能は予告なく変更する場合がありますので、ご了承ください。

フィジカルAIとは何か？AIは「情報処理」から「現実を動かす」存在へ物理世界に作用する仕組みと安全性の考え方