サム・アルトマンは年に2〜3本しかブログ記事を公開しません。
昨日公開された「The Gentle Singularity(穏やかなる特異点)」は、先日公開されたイリヤのスピーチと同様に簡素な言葉遣いで、大げさな表現を使っていません。一部の著名人のように「高度な」認識をひけらかすようなものではありません。
しかし、もし私と同じように5、6、7、8回と読み返せば、非常に実践的な価値があることに気づくでしょう。
タイトル:The Gentle Singularity
著者:サム・アルトマン
日付:2025-06-10
私たちは「事象の地平線」を越え、離陸はすでに始まっています。人類はデジタル超知能の構築に近づいており、少なくともこれまでのところ、想像していたよりもずっと奇妙ではありません。
事象の地平線(event horizon):物理学用語。一般相対性理論において、ブラックホールの「事象の地平線」は時空を二つの部分に分ける見えない境界です。一度この線を越えた粒子や情報は、どんなに強力でも速くても、光でさえも二度と戻ることはできません。
ロボットはまだ街を歩いていませんし、私たちのほとんどが一日中AIと話しているわけでもありません。人々は依然として病気で亡くなり、私たちはまだ簡単に宇宙へ行くことができず、宇宙について理解していないことがたくさんあります。
それでも、私たちは最近、多くの点で人間よりも賢く、利用する人々の成果を大幅に増幅できるシステムを構築しました。作業の中で最も実現が難しいと思われた部分はすでに過ぎ去りました。GPT-4やo3のようなシステムに到達するための科学的洞察は苦労して得られたものですが、私たちを非常に遠くまで導いてくれるでしょう。
AIは多くの点で世界に貢献するでしょう。AIが科学的進歩を加速させ、生産性を向上させることによってもたらされる生活の質の向上は計り知れません。未来は現在よりもはるかに良くなる可能性があります。科学の進歩は、全体の進歩の最大の推進力です。私たちがどれだけ多くのものを得られるかを考えると、非常に興奮します。
ある意味で、ChatGPTはすでにこれまで生きてきたどんな人間よりも強力です。何億人もの人々が毎日、そしてますます重要なタスクのためにChatGPTに依存しています。小さな新機能が非常に大きなプラスの影響を生み出すことができますが、小さな不整合が何億人もの人々に波及すると、大きな負の影響を引き起こす可能性があります。
不整合(misalignment):専門用語。例として、アルゴリズムによるショート動画の本質は、不整合なAIです。このAIの目的は、ユーザーであるあなたの価値とは一致していません。
2025年には、真の認知作業を実行できるエージェントが登場しました。コンピュータコードの書き方は二度と同じにはならないでしょう。2026年には、斬新な洞察を発見できるシステムが登場する可能性が高いです。2027年には、現実世界でタスクを実行できるロボットが登場するかもしれません。
簡単に言えば:2025年、L3 AGI;2026年、L4 AGI;
より多くの人々がソフトウェアやアートを創造できるようになるでしょう。しかし、世界はそれら両方をより多く求めており、専門家は新しいツールを受け入れる限り、おそらく初心者よりもはるかに優れているでしょう。一般的に言って、2030年には2020年よりもはるかに多くのことを一人が成し遂げられるようになるという変化は驚くべきものであり、多くの人々がその恩恵を受ける方法を見つけるでしょう。
最も重要な点において、2030年代は大きく異ならないかもしれません。人々は依然として家族を愛し、創造性を表現し、ゲームをし、湖で泳ぐでしょう。
しかし、依然として非常に重要な点において、2030年代はこれまでのどの時代とも劇的に異なるものになるでしょう。私たちは人間レベルの知能をどれだけ超えられるかを知りませんが、まもなくそれを知ることになります。
2030年代には、知能とエネルギー、つまりアイデアとアイデアを実現する能力が非常に豊富になるでしょう。これら二つは長らく人類の進歩を制限してきた根本的な要因でした。豊富な知能とエネルギー(そして良い統治)があれば、理論的には他のすべてを得ることができます。
すでに私たちは驚くべきデジタル知能とともに生きており、最初の衝撃の後、私たちのほとんどはすっかり慣れてしまいました。AIが美しい段落を生成できることに驚いていた私たちは、すぐにAIが美しい小説をいつ書けるようになるのだろうかと疑問を抱くようになります。あるいは、AIが命を救う医療診断ができることに驚いていた私たちは、AIがいつ治療法を開発できるのだろうかと疑問に思うようになります。また、AIが小さなコンピュータプログラムを作成できることに驚いていた私たちは、AIがいつ全く新しい会社を創れるようになるのだろうかと疑問に思うようになります。これが特異点の進み方です。驚異は日常となり、そして「必須条件」となるのです。
テーブルステークス(table stakes):ポーカー用語で、ゲーム開始前に各プレイヤーがテーブルに置かなければならない最低限の賭け金を指します。転じて、基本的な資格、参入のための最低限の条件という意味で使われます。
すでに科学者たちからは、AI導入前と比較して生産性が2〜3倍向上したという声が聞かれます。高度なAIは多くの理由で興味深いですが、おそらく最も重要なのは、AIを使ってAI研究を加速できるという事実でしょう。私たちは新しい計算基盤やより良いアルゴリズム、その他何が発見されるかわかりません。もし10年分の研究を1年や1ヶ月でできるとしたら、進歩の速度は明らかに大きく異なるでしょう。
高度なAI(advanced AI):昨日イリヤが言った「The best AIs(最高のAI)」と同じ。AIは人間と同じく知能体であり、一概には言えず、知能レベルで区別されるべきです。
ここから先、私たちがすでに構築したツールは、さらなる科学的洞察を発見し、より良いAIシステムの創造を助けるでしょう。もちろん、これはAIシステムが完全に自律的に自身のコードを更新することとは同じではありませんが、それでもこれは再帰的自己改善の幼虫版です。
他にも自己強化ループが働いています。経済的価値の創造は、これらのますます強力になるAIシステムを稼働させるためのインフラ整備という加速的な回転を始めました。そして、他のロボットを構築できるロボット(ある意味では、他のデータセンターを構築できるデータセンターも)も、それほど遠い未来ではありません。
もし最初の100万台の人型ロボットを従来の方法で作らなければならないとしても、そのロボットたちが鉱物の採掘や精錬、トラックの運転、工場の稼働など、サプライチェーン全体を操作してより多くのロボットを製造し、それらのロボットがさらに多くのチップ製造施設やデータセンターなどを構築できるようになれば、進歩の速度は明らかに大きく異なるでしょう。
データセンターの生産が自動化されるにつれて、知能のコストは最終的に電気代に近づくはずです。(人々はChatGPTのクエリがどれくらいのエネルギーを使うかよく疑問に思います。平均的なクエリは約0.34ワット時を使用します。これはオーブンが1秒強、または高効率電球が数分間使用するのとほぼ同じです。また、約0.000085ガロンの水、つまりティースプーン15分の1程度の水を使用します。)
技術進歩の速度は加速し続け、人々がほとんど何にでも適応できるという状況は変わらないでしょう。職業の全体がなくなるような非常に困難な部分もありますが、その一方で世界は非常に急速に豊かになるため、これまで考えられなかった新しい政策アイデアを真剣に検討できるようになるでしょう。私たちは一度に新しい社会契約を採用することはないかもしれませんが、数十年後に振り返ったとき、漸進的な変化は大きなものになっているでしょう。
私の理解では、唯一の解決策はUBI(ユニバーサル・ベーシック・インカム)、つまり皆にお金を配ることです。全員がAIを素早く学び、生涯学習し、適応して使いこなすのは難しいでしょう。UBIを望まない、あるいは期待しない人々は、毎日AIを使い、AIの知識とツールを学ぶ必要があるでしょう。
歴史が何らかの指針となるならば、私たちは新しいすること、新しい欲しいものを見つけ出し、新しいツールを素早く同化するでしょう(産業革命後の職業の変化が良い最近の例です)。期待は高まりますが、能力も同じくらい速く向上し、私たちは皆、より良いものを手に入れるでしょう。私たちは互いのためにより素晴らしいものを築き続けます。人間にはAIに対して長期的に重要で興味深い利点があります。私たちは他者や彼らの考え、行動を気にかけるようにできていますが、機械にはあまり関心がありません。
千年前の自給自足の農民が、私たちの多くが今日行っていることを見たら、「偽りの仕事だ」と言い、十分な食料と想像を絶する贅沢があるのだから、ただ自分たちを楽しませるために遊んでいるだけだと思うでしょう。私は千年後の仕事を見たときに、それらが非常に「偽りの仕事」だと感じることを願っています。そして、それらの仕事をする人々にとっては、信じられないほど重要で満足のいくものだと感じるに違いないと確信しています。
新たな驚異が達成される速度は計り知れません。今日、2035年までに何が発見されているかを想像することさえ困難です。もしかしたら、ある年には高エネルギー物理学の問題を解決し、その翌年には宇宙植民地化を始めるかもしれません。あるいは、ある年には主要な材料科学のブレークスルーを達成し、その翌年には真の高速脳コンピュータインターフェースが実現するかもしれません。多くの人々はこれまでとほぼ同じように生活することを選ぶでしょうが、少なくとも一部の人々は「プラグイン」することを決めるでしょう。
将来を見据えると、これは理解するのが難しいように思えます。しかし、実際に体験してみれば、印象的ではあるものの管理可能だと感じるでしょう。相対論的な視点から見ると、特異点は少しずつ起こり、融合はゆっくりと進みます。私たちは指数関数的な技術進歩の長い弧を登っています。それは常に前を向けば垂直に見え、後ろを向けば平坦に見えますが、実際には滑らかな一つの曲線です。(2020年に戻って、2025年までにAGIに近いものが存在すると聞かされたらどう聞こえたか、そして過去5年間が実際にどうだったかを考えてみてください。)
大きなメリットとともに、真剣に取り組むべき課題があります。技術的、社会的に安全性の問題を解決する必要がありますが、その上で、超知能がもたらす経済的影響を考慮すると、そのアクセスを広く普及させることが極めて重要です。最善の道筋は次のようになるかもしれません。
1. アラインメント問題を解決する。つまり、AIシステムが長期的に私たち集合体が本当に望む方向へ学習し行動することを確実に保証できるようにすることです(ソーシャルメディアのフィードは不整合なAIの一例です。それらを動かすアルゴリズムは、あなたをスクロールし続けさせ、短期的な好みを明確に理解することに驚くほど長けていますが、それはあなたの脳内にある何かを悪用し、長期的な好みを上書きすることによって行われます)。
2. 次に、超知能を安価に、広く利用可能にし、いかなる個人、企業、国にも過度に集中させないことに焦点を当てます。社会は回復力があり、創造的で、迅速に適応します。もし私たちが人々の集合的な意志と知恵を活用できれば、多くの間違いを犯し、いくつかのことが本当に悪い方向へ進んだとしても、私たちは迅速に学習し適応し、このテクノロジーを最大限に活用し、最小限のデメリットで利用できるようになるでしょう。社会が決定すべき広範な範囲内で、ユーザーに多くの自由を与えることは非常に重要です。世界がこれらの広範な範囲とは何か、そして集合的アラインメントをどのように定義するかについて議論を始めるのが早ければ早いほど良いでしょう。
私たち(OpenAIだけでなく、業界全体)は世界のための「脳」を構築しています。それは極めてパーソナライズされ、誰もが簡単に使えるようになるでしょう。私たちは良いアイデアによってのみ制限されるでしょう。長い間、スタートアップ業界の技術者たちは「アイデアだけの人間」をからかってきました。アイデアだけを持って、それを実現するためのチームを探している人たちのことです。しかし、今や彼らが陽の目を見る日が来そうだと私には思えます。
OpenAIは今や多くのことを手掛けていますが、何よりもまず、私たちは超知能研究企業です。私たちの前には多くの仕事が残されていますが、その道のりの大部分はすでに照らされており、暗い領域は急速に後退しています。私たちが今していることをできることに、心から感謝しています。
「メーターで計測できないほど安価な知能」は、すでに手の届くところまで来ています。これは狂ったように聞こえるかもしれませんが、2020年に私たちが今日のような状況になると伝えていたら、おそらく2030年の現在の予測よりもはるかに狂った話に聞こえたでしょう。
この記事が公開されたと同時に、OpenAIはo3の価格をGPT-4oよりもさらに引き下げました。トップレベルのAIが底値で提供されています。
私たちが超知能へとスムーズに、指数関数的に、そして何事もなくスケールできることを願っています。
翻訳すると:世界平和を願う。特異点は急速に訪れており、穏やかな特異点であることを願う。
雑感
記事に関連するいくつかの考え。
まず、「天機」を漏洩します。英語翻訳において、最高のツールはOpenAI Deep Researchです。一発で完成し、表現は正確で、言葉遣いは適切であり、修正の余地がほとんどありません(この記事を例にとると、私はいくつかの注釈を加えただけです)。重要なのは、抜け漏れがなく、勝手に変更せず、間違いがないことです。
昔、私は翻訳で生計を立てていました(スティーブ・ジョブズが亡くなった時のブルームバーグ・ビジネスウィークの特集号の3分の2は私が翻訳しました)。料金は非常に高く、国慶節の休暇だけで5万人民元稼ぐことができました。しかし、今Deep Researchの翻訳ワークフローを使っていると、転職しておいて本当に良かったとしか言えません。
この経験は非常に価値があります。基本的に、人間による翻訳や質の低いAI翻訳は、もはや存在すべきではありません。Deep Researchを、直接成果を出せる翻訳エージェントとして扱えばよいのです。
次に、具体的な例を使って恐ろしい見解を証明します。
見解:AI時代において、知能はもはや「独自性」(以前は「ホモ・サピエンス」が高級知能を独占していた)を持たず、電力のような資源の一つに過ぎず、特別なものではなく、しかも超安価です。
どれくらい安いのか?知能のコストは最終的に電気料金に近づき、ほとんど計量する必要がないほど安価になるでしょう。サム・アルトマンは、現在のChatGPTの1回の会話あたりの平均エネルギー消費量を示しました:0.34ワット時の電気+0.000085ガロンの水。
例:サム・アルトマンの最新ブログを例にとると、15年前なら、このような記事の翻訳には約1000元(1000文字あたり400元)かかりました。今ならDeep Researchで10分で完了します。より速く、より良く、そして価格はほぼゼロです。(では、なぜ大学にまだ英文科があるのでしょうか?)
多くの種類の知的労働は、翻訳労働と本質的な違いはありません。
証明完了。