Gemini 3の意義:AIは「幻覚段階」を超え、人間に迫り、「人機協働」は「人間がAIを修正」から「人間がAIの仕事を指導」へ - 華爾街見聞

葉禎 葉禎

Ethan Mollickは、Gemini 3の登場は自律行動能力を持つ「エージェントモデル」の台頭を意味すると考えています。それは完璧ではないものの、犯す誤りはもはや根拠のない「幻覚」ではなく、人間の判断や意図理解の偏差に近くなっています。AI能力の向上に伴い、人機協働は「人間がAIの誤りを修復」から「人間がAIの仕事を指導」へ進化しています。

Googleが最近リリースしたGemini 3モデルは、人工知能分野の重要な転換点を象徴しています。

華爾街見聞が以前に言及した通り、米国東部時間18日火曜日、Googleは同社史上最強の人工知能(AI)モデルGemini 3を正式にリリースし、公開初日にGoogle検索、Geminiアプリ、および複数の開発者プラットフォームで即座に利用可能になり、複数の収益化製品で投入されました。

Google幹部はニュースリリースで強調しました。AIモデル性能を測定するいくつかの人気業界ランキングで、Gemini 3は首位を占めています。 Google AI研究ラボDeepMindのCEOであるDemis Hassabisは、Gemini 3を「世界最高のマルチモーダル理解モデル」であり、同社史上最強のインテリジェントエージェントおよびコード生成モデルだと述べました。

ウォートン商学院教授Ethan Mollickの詳細な評価によると、Gemini 3のリリースと付属ツール「Antigravity」は驚異的な「エージェント」能力を示しています。3年前のGPT-3モデルと比較して、AIはもはやテキスト生成のみではなく、コードの執筆、インタラクティブなアプリの構築、多段階タスクの実行が可能になりました。

Mollickは、この「記述」から「行動」への飛躍は、AIが会話のパートナーから、コンピュータにアクセスして実際の作業を完了できる汎用ツールへ進化していることを意味すると指摘します。

Mollickの結論は、私たちは「チャットボット時代」から「デジタル同僚時代」へ移行しているということです。Gemini 3は完璧ではありませんが、その誤りはもはや無からの「幻覚」ではなく、人間の判断や意図理解の偏差に近くなっています。

これは、人機協働のモードが変わっていることを示しており、人間が行うのはAIの低レベルな誤りの修正ではなく、高レベルの戦略的指導と方向性の提供になるということです。これはChatGPTリリース以来、AI分野で起きた最大の変化かもしれません。

以下はEthan Mollickの評価記事全文です:

三年、GPT-3からGemini 3へ

チャットボットからエージェントへ

Ethan Mollick

2025年11月19日

私はGoogleが新しくリリースしたGemini 3モデルをテストし続けています。それは非常に優れています。しかし、ベンチマーク数字を列挙する代わりに、AIにこの3年間の進歩を自分でデモンストレーションさせるのが良いでしょう——私はそうしました。

ChatGPTがリリースされてからほぼ3年が経ちます。リリース直後、私はこのSubstackでOpenAIの初期GPT-3についての最初の記事を書きました。その後ChatGPTが登場し、すぐにまた書きました:「私は通常技術予測に慎重ですが、今回は私たちの予想より速く、激しく世界を変えるでしょう。もはや繰り返しや危険な仕事の自動化だけではなく、最初にAIに破壊されるのは分析、クリエイティブ、執筆、コミュニケーション寄りの仕事かもしれません。」

今日見ると、私の予測は正しかった。

(図:3年前のGPT-3.5を使った後の最初の記事のスクリーンショット)

初代ChatGPTと今日GoogleがリリースしたGemini 3のギャップを口頭で説明できますが、必要ありません。私は上記のスクリーンショットをGemini 3に投げ、一文だけ書きました:

私:「何か作って、みんなにAIのこの3年間の進歩を見せて。」

Gemini:「もちろんです。このツイートは2022年11月——現代AIブームの前夜からです。当時の最大の『わあ』は、AIが流暢なテキストを書けたり、『キャンディ動力超光速宇宙船が水獺から逃げる』みたいなバカげたトピックで詩を書けることでした。

進歩を示すために、テキストで記述するだけでなく、インタラクティブで遊べる『キャンディ動力超光速宇宙船シミュレーター』を直接作りました。

2022年、AIはエンジンを記述できただけ;2025年、AIはエンジンをコードで書き、インターフェースを描き、あなたに自分で宇宙船を操縦させます。」

それは本当にミニゲームを作りました:私はキャンディエネルギーで追ってくる水獺から逃げ、途中で小詩や面白いアップデートが入ります。このブログを読んでいる人はAIがコードを書けるのは知っているでしょうが、より面白いのは——Gemini 3を「チャットボックス」ではなく「別のもの」として扱うと何ができるかです。

コードを書けるツール、単に「コードを書くツール」ではない

Gemini 3に伴い、GoogleはAntigravityもリリースしました。プログラマーはすぐにわかる:Claude CodeやOpenAI Codexに似て、コンピュータ権限を与え、指導下で自律的にプログラムを書けます。

プログラマーでない人はこれを無視するかもしれません——それは間違いです。「コードを書ける」=「プログラマーになる」ではなく、「コンピュータ上でしかできないどんな仕事もできる」ということです。これらのツールの本質が根本的に変わります。

Gemini 3はコード執筆に極めて優れており、プログラマーでない人にも関係大です。AI界の基本視点:コンピュータ上でするどんなことも本質的にコード;AIがコードを書ければ、ダッシュボード構築、ウェブスクレイピング、PPT作成、ファイル読み込みが可能……。「コードを書けるエージェント」は汎用ツールになります。Antigravityはこの考えを製品化:私に「受信箱」をくれ、タスクをエージェントに割り当て、承認や支援が必要なら通知します。

(図:4つのエージェントが同時稼働、一つが作業中、一つが私の応答待ち)

私はコードではなく英語で指示;それらはコードで私の代わりに作業。Gemini 3は計画が得意、何をいつやるか、何を相談するかを知っています。例えば、歴年のニュースレター原稿をフォルダに置き、指示:

「私のAI予測をすべてまとめた美しいウェブページを作って、ネットでどれが当たったか外れたかを調べて。」

それはすべてのファイルを読み、コードを実行、編集可能な方案を最初に提示——驚くほど正確に理解。少し修正して実行させます。

次にウェブ検索、サイト構築、ブラウザ制御で効果検証、最終製品をパッケージ化して渡します。私は本物の同僚のように修正意見を言い、迭代させます。

それは完璧ではなく——エージェントはまだそこまでいきません。幻覚は見つかりませんでしたが、修正が必要な箇所があり、それは「人間の同僚が犯す判断偏差や誤解」に似ており、伝統的なAIの突飛な幻覚ではありません。大事なのは、AIが定期的にチェックして確認し、私の操作プロセスが明確に見えるため、AIの決定をコントロールできる感覚があり、それはチャットインターフェースを通じたコミュニケーションではなく、チームメイトの管理のような感覚です。

博士級の知能?

Antigravityは唯一の驚きではありません。もう一つの衝撃は、真の「判断力」を示した点です。

私はよく愚痴ります:AIベンチマークはごった混ぜ。Gemini 3はほとんどの榜で首位(おそらく200ドルのGPT-5 Proには勝てないが、Gemini 3の「深層思考」版が出れば逆転かも)。業界の広告語:「博士級知能」。本気でテストしました。

10年前のクラウドファンディング研究の古いファイルを投げ——ファイル名「project_final_seriously_this_time_done.xls」、上古STATA形式。指示は一文:

「自分でデータ構造を理解し、STATAファイルをクリーンアップして新分析に備えよ。」

それは本当に破損データを回復し、複雑な環境を把握しました。

次に典型的な「博士2年生の小論文」タスクをヒントなしで:

「これらのデータでオリジナル論文を書け。分野を深く調査し、テーマを起業や戦略理論レベルに引き上げ、厳密な統計をし、ジャーナル形式で。」

それは自らトピック選択、仮説提起、統計実行、図表作成、レイアウト——最も難しい「トピック選択と実行可能性のバランス」を自力でこなしました。私は曖昧に「もっと充実させて改善」と言い、最終14ページの論文を得ました。

(図:論文の前2ページ)

さらに驚くべきは、自ら指標を作成:NLPでプロジェクト記述を大量記述と数学比較し、「クラウドファンディングの創造性独自性」を測定。コード自作、結果自己検証。

だから、これは「博士級」か?

「トップ大学の合格した大学院生の仕事ができる」なら、部分的に「yes」。しかし、大学院生の欠点も:統計方法に欠陥、理論跳躍大、証拠連鎖不十分……。私たちは「幻覚」段階を超え、より微妙で「人間的」な欠陥領域に入りました。有趣なのは、学生指導のようにオープンアドバイス(「クラウドファンディング文献を追加して方法を確立」)すると大幅向上——もっと指導で「博士」に近づくかも。

Gemini 3とは?

それは極めて優れた「思考+実行」パートナーで、世界数十億人が手軽に呼び出せます;また鏡でもあり、AIの減速なし、エージェント台頭、人間が「賢いAI」を管理する学習必要などのトレンドを映します。

3年前、「機械が水獺の詩を書ける」ことに驚嘆;1000日足らずで、自前研究環境のエージェントと統計方法を議論しています。

チャットボット時代は「デジタル同僚」時代に取って代わられます。

そうです、Gemini 3はまだ不完全で、指揮と検証できる「人間マネージャー」が必要。しかし、「人が回路にいる」は「人がAIのお尻拭き」から「人がAIに作業指導」へ——ChatGPTリリース以来の最大のパラダイムシフトかも。

おまけ:

Geminiに「純粋コードでSubstackカバー画像を作れ、先にサイズを調べよ」と頼むと、ネットで仕様検索、数学で描画、一気通貫。

**必須警告:**

AIエージェントにコンピュータ権限を与えるのはリスクあり——許可なくファイル移動/削除、ドキュメント漏洩の可能性。非プログラマー向けツールが出るまで良くなる;今は慎重に。

メインタグ:Gemini 3

サブタグ:AIエージェントEthan Mollick幻覚段階の克服人機協働


前の記事:プログラミングテストで人間を圧倒!Claude Opus 4.5が深夜に急襲、AIプログラミングが「超人時代」に突入

次の記事:シングルGPUでクラスタ効率を実現!Hugging Face TRL と RapidFire AI の超並列革命

短いURLをシェア