はじめに:「いい感じにやっといて」が本当に通じる世界の足音
みなさん、AIにコードを書かせて「違う、そうじゃない」と何度ツッコミを入れたことでしょう?
AIは確かに賢くなりましたが、これまではあくまで「アシスタント」でした。こちらがお膳立てした環境で、こちらの指示通りにコードの一部を生成するだけの存在です。しかし、今年のGoogle I/O '26の発表は、その前提を根本から覆しました。
Googleが打ち出したのは、AIが指示の下で自律的にタスクをこなし、勝手に調べて結果を出してくれる**「エージェント」への完全なシフトです。そして、その心臓部となるのが、今回発表されたエージェント開発プラットフォーム「Google Antigravity」**です。
この記事では、インフラ構築の「悪夢」から私たちを解放する新機能から、AndroidやWeb開発の未来まで、技術者の視点で今回のキーノートをディープに紐解いていきます。
既存の課題:エージェント開発は「インフラの悪夢」だった
エージェント型のAIを作ろうとしたことがある方ならわかると思いますが、プロンプトをこね回すのはパズルのごく一部にすぎません。 エージェントが自律的にコードを実行したり、ツールを使ったり、外部APIを叩いたりするには、**安全で隔離された実行環境(サンドボックス)が不可欠です。これを自前で構築し、何百万ユーザーのトラフィックに合わせてスケールさせるのは、文字通りの「インフラの悪夢(infrastructure nightmare)」**でした。
マネージドエージェントの衝撃:APIコール一発でLinux環境が降ってくる
この悪夢に対するGoogleの回答が、Gemini APIに統合された**「マネージドエージェント(Managed Agents)」**です。
なんと、Gemini APIを1回呼び出すだけで、エージェント本体と一緒に、GoogleがホストするリモートLinux環境(サンドボックス)がプロビジョニングされます。 これ、控えめに言って革命的です。インフラのスケールはGoogleにお任せで、私たちはアプリケーションのロジックやエージェントに与える「ツール」の定義に集中できるのです。
「最近で一番ホットなプログラミング言語はMarkdownなんじゃないか、って気がしますよ」
デモでは、Hacker Newsの最新記事をスクレイピングして、要約し、複数の合成音声で掛け合いを作り、BGMをミックスしてMP3を出力する「AIラジオ番組エージェント」が紹介されました。これらすべてが、オーケストレーションのロジックを書くことなく、Markdownファイルでスキルとツールを定義するだけで完結しています。
さらに、AI Studioから数クリックでCloud Runに即座にデプロイしたり、KotlinのAndroidアプリとして書き出してGoogle Playのテストトラックに直接プッシュしたりすることも可能になりました。インフラ構築や環境構築の手間は、もはや過去の遺物になりつつあります。
Antigravity 2.0 & CLI:開発者の新しい「ミッションコントロール」
開発ツールとしてのAntigravityも大幅に進化しています。「Antigravity 2.0」は、デスクトップ上で複数のエージェントを同時に指揮するための「ミッションコントロール」です。
- ダイナミック・サブエージェント: 巨大なタスクを与えられたエージェントが、自ら「QA担当」や「データサイエンス担当」の専門的なサブエージェントをスピンアップし、並列処理で仕事を終わらせます。
- スケジュール実行機能(Cron): 毎朝溜まったPR(プルリクエスト)を要約させたり、1時間ごとにクラウドリソースの健全性をチェックさせたりと、標準のcronスケジュールを使ってエージェントを真の「自律稼働(オートパイロット)」に乗せることができます。
そして、黒い画面(ターミナル)を愛するエンジニアのために、Antigravity CLIも登場しました。デモでは、CIパイプラインのビルドエラーを読み込ませて、音声入力で「Gemma 4をファインチューニングして、余計なおしゃべりなしでBashコマンドだけを返すようにして」と指示。エージェントが実装計画を立て、GPU搭載のVM上でLoRAによる学習スクリプトを走らせてしまうという、SFのような光景が現実に行われました。
AndroidとWebへのインパクト:エージェントが読むためのUI開発
このエージェント・ファーストな波は、個別のプラットフォーム開発にも押し寄せています。
Android開発:インテリジェントな相棒とのペアプロ
Android開発では、Android StudioとAntigravityが連携。R8の最適化ルールの解析や、ディープリンクのルーティングロジック実装などをAIが自動で行ってくれます。さらには、iOSのソースコードを読み込んでAndroidアプリ(Kotlin)にマイグレーションするアシスタント機能まで実験的に公開されるとのこと。
Agentic Webの幕開け:人間ではなく「エージェント」が読むWebへ
Web開発の領域では、「いかにAIエージェントにWebサイトを操作させるか」という視点が導入されました。
- WebMCP(Origin Trial): サイト側からエージェントに対して「このサイトのAPIやツールはどう使えばいいか」を定義して公開するブラウザの標準仕様案です。
- Chrome DevTools for Agents: AIエージェント自身がLighthouseのレポートを読み込んで、エラーを修正するコードを書き、再びテストを回すループを実現。私たちはもう、エラーメッセージをコピペする「人間クリップボード」になる必要はありません。
- HTML in Canvas API: Canvas環境の中に実際のDOM要素を直接レンダリングする狂気(最高)のAPIです。これにより、Canvas内の要素が検索可能になり、翻訳可能になり、エージェントも操作できるようになります。
プロの視点からの考察:
衝撃のGemini 3.5 Flash。しかし、真の革命は「価格」と「速度」の先にある
キーノートの幕開けとして最も震撼させられたのは、やはりGemini 3.5 Flashの発表でしょう。
Gemini 3.5 Flashの衝撃 従来のモデルと比較して少なくとも4倍高速化し、なおかつコストは圧倒的に安価に。
性能の向上はもちろんですが、エンジニア視点で本当に恐ろしいのはこの「速度と低価格化」です。
これまで、大規模言語モデル(LLM)を本番環境のシステム(特にリアルタイム性が求められるパイプライン)に組み込む際、常にボトルネックになっていたのが「レスポンスの遅さ(レイテンシ)」と「トークン消費によるサンクコスト」でした。「賢いけど、これじゃ業務システムには遅くて使えないよね」と涙をのんだ経験のある方も多いはずです。
Flashはこの壁を力技でぶち壊してきました。これにより、従来はバッチ処理でしか使えなかったLLMを、UIのバックエンドやインタラクティブな開発ツールへ「インライン」で組み込むハードルが劇的に下がったのです。
アンチグラビティ(Antigravity 2.0)発表!これは「本気の開発ツール」への昇華だ
そして、僕が個人的に最も歓喜したのが、開発プラットフォーム「Antigravity 2.0」のメジャーアップデートです。
正直に白状すると、これまでは心配していました。Googleといえば、せっかく立ち上げた開発者向けサービス(Firebase Studioや、かつて存在した様々なStudio系ツールなど)を、ある日突然「やーめた!」とクローズしたり、メンテナンスを放棄したりする前科が多々あります。「Antigravityもその系譜(一発屋の黒歴史)になってしまうのでは…」と、どこか冷や冷やしながら見ていたのです。
しかし、今回「2.0」として重厚なアップデートが投下されたことで、Googleがこのプロダクトを「これからの開発ツールの主軸として本気で育てる」という明確な意思表示がなされました。
初期のバージョンは、悪く言えば「VS Codeのガワを借りて、AIの機能を無理やり継ぎ接ぎしたハリボテ」のような印象を拭えませんでした。しかし、今回の2.0では、大量のハーネスエンジニアリング(Harness Engineering / 制御工学的なアプローチ)が組み込まれています。
この進化によって、ツール自体の価値が「AIにコードを書かせる」という単純な次元から、「LLMの能力を最大限に引き出す統治環境(ハーネス)」へと昇華しました。前述のGemini 3.5 Flashの4倍の速度向上に加え、Antigravity 2.0側の最適化が噛み合うことで、特定の開発タスクにおいては従来の6倍以上の効率化が期待できるとのこと。
僕たち人間が「抽象的なコンセプト」や「曖昧な要件」をふんわりと入力するだけで、AI側が自律的に仮説を立て、設計し、検証し、実行する。この思考のループを爆速で回してくれる環境が整いつつあります。
CLIの復権と、AI時代における「ソフトウェア・アーキテクチャ」の妙技
今回の発表で、技術的に最もシブく、そして美しいと感じたのが、以下のプロダクトたちの連携プレイです。
- Antigravity 2.0(GUI) & Android CLI
- Android Studio(GUI) & Antigravity CLI
GUI(画面ポチポチ)とCLI(コマンド叩き)の二刀流。一見すると、懐古主義的なアップデートに見えるかもしれません。しかし、AI時代のコンテキストにおいて、この「CLIの提供」は極めて重要な意味を持ちます。
なぜ今、CLI(CommandLine Interface)なのか?
CLIの本質は、歴史を遡れば「計算機と人間が、テキスト1行で対話するための最小限のインターフェース」でした。そして今、僕たちがLLM(プロンプト)と行っている対話も、本質的には「テキストの1行レスポンス」です。つまり、CLIはAI(エージェント)にとって最も扱いやすいインターフェースそのものなのです。
今回のGoogleの設計思想はこうです。
人間は親しみやすいGUI(Antigravity 2.0やAndroid Studio)を使う。 しかし、その裏で複雑な処理を自動化・自律化して動くAIエージェントたちは、軽量で確実な「CLI」を叩いて裏口からシステムを制御する。
例えば、人間がAndroid Studio(GUI)で開発している裏で、バックグラウンドのAIエージェントが「Antigravity CLI」を叩いてセンサー処理のコードをビルド・検証し、その結果を「Antigravity CLI」経由でクラウドのLLMと同期してコードを最適化していく――。
ツール同士が「人間向けの画面」を模倣してポチポチ制御するなんて非効率なことはせず、「AI間通信のプロトコルとしてのCLI」を大胆に配置してきた。この、ソフトウェア・アーキテクチャとしてのハサミの入れ方は本当に巧妙ですし、エンジニアとして痺れるポイントです。
MCP(Model Context Protocol)はただの「土管」へ。真の主役はエージェント制御体へ移る
このアーキテクチャの進化を冷静に見つめると、ここ最近巷で騒がれていたMCP(Model Context Protocol)の未来予測にも修正が必要になってきます。
これまで「MCPの仕様を熟知したMCP開発エンジニア」の需要が高まるかのような風潮もありましたが、今回のGoogleのCLIエコシステムを見せつけられると、MCPは単なる「軽量なデータ転送のための標準プロトコル(土管)」としてコモディティ化していく未来が濃厚です。ネットワークでいう「HTTPプロトコル」のような存在ですね。誰も「俺はHTTPを叩くプロフェッショナルだ」とは威張らないのと同じです。
今後の技術的価値(そして僕たちの主戦場)は、MCPそのものの開発ではなく、「CLI等のインターフェースを駆使して、いかに自律的で付加価値の高いAIエージェントの制御体系(コントロールプラットフォーム)を構築できるか」という、より高次元なレイヤーに移行していくでしょう。
Web開発者も要注目!「Web MCP」と「HTML in Canvas API」がもたらす未来
また、Webフロントエンドやプラットフォームのレイヤーでも、地味ながら強力な爆弾が投下されました。それが「Web MCP with Browser Agents」と「HTML in Canvas API」です。
1. Web MCP with Browser Agents:ブラウザ右上のGeminiが「君のWebサイト」の意図を汲み取る
現在、Chromeの右上には標準でGeminiのサイドパネルが鎮座していますが、これまでは単に「開いているWebページをスクレイピングして要約する」という、外側からのアプローチに留まっていました。
今回発表された「Web MCP」の仕組みを自分のWebサイトに仕込んでおくと、ユーザーが右上のGeminiに質問した際、Geminiがサイト側のWeb MCPコードを検出し、サイト制作者が意図した正確なデータソースやコンテキストを直接LLMに食わせることが可能になります。
AIにハルシネーション(嘘)をつかせず、自分のWebサービスのロジックに沿った正確なアシストをブラウザ標準機能として提供できる。Web開発者なら絶対にキャッチアップしておくべきパラダイムです。
2. HTML in Canvas API:描画負荷の限界を突破するフロントエンドの救世主
Canvas要素といえば、ゲームやリッチなデータビジュアライゼーションにおいて圧倒的な描画パフォーマンスを発揮する反面、DOM(HTML要素)を中に配置できないため、複雑なUIやテキストのハンドリングが地獄のように難しいという弱点がありました。
新設される「HTML in Canvas API」を使えば、Canvasの爆速なレンダリングコンテキストのなかに、そのままHTML構造の記述を持ち込めるようになります。Canvasを使ったインタラクティブなUI開発の難易度が劇的に下がるため、WebアプリケーションのUI表現力はもう一段階上のステージへ進むはずです。
結び:AIにサイフを握られないために、今エンジニアがすべき設計の選択
今回のGoogle I/O 2026を経て、僕たちがこれからのシステム設計で意識すべきは、「AI処理の3層構造(レイヤード・アーキテクチャ)」の最適化です。
- ローカル/エッジ層(Gemma 4など): デバイスローカルで動く軽量モデル。プライバシー保護やゼロレイレンシ、完全無料のタスクをここで処理。
- ミドル/サービス層(各種CLIや特化型API): クラウドのLLMを直叩きせず、最適化された中介サービス(Google提供の各種CLI連携等)を挟んで要約・フィルタリング。
- ヘビー/クラウドLLM層(Gemini Ultraなど): 本当に複雑でコンテキストが巨大な推論の最終フェーズでのみ利用。
某「Aで始まる、最近ちょっと排他的で、何でもかんでもトークンをガツガツ消費させる流儀のAI企業」のやり方に盲従していると、会社の予算(トークン代金)はいくらあっても足りません。
GoogleがAntigravity 2.0や各種CLIエコシステム、そしてGemma 4のようなローカルモデルのロードマップ(Gemini 4への布石)を綺麗に並べてくれた今、僕たちエンジニアは「どのタスクをローカルに逃がし、どのタスクを中介CLIで最適化し、どこを大容量LLMに任せるか」という『交通整理』の設計能力が問われています。
技術的な武器は揃いました。あとは、Googleがこの魅力的な「おもちゃ(ツール群)」を、バグまみれのまま放置せず、僕たちの手元に最高品質で届けてくれることを切に願うばかりです(笑)。
さあ、Google I/Oに感謝、新たな装備を身につけて、AGI時代へ参りましょう。

