OpenAIポッドキャスト、再びAIプログラミング戦争を語る！開発者は最も恵まれている：特定のニーズに対応したコードモデルが登場する！司会者がうっかり漏らす：「一番好きなのはClaude！」

編集・構成 | 伊風

OpenAIの第2回ポッドキャストが配信されました！豪華な顔ぶれです！

ゲストはOpenAIのチーフ・リサーチ・オフィサー、マーク・チェン（Mark Chen）とChatGPT責任者のニック・ターリー（Nick Turley）。司会は引き続きOpenAI研究員のAndrew Mayneが務めました。

マーク・チェンといえば、現在OpenAIのCTOの実務を担っているような印象です。ちょうど先日、Metaが大規模な人材引き抜きを行い、シリコンバレーのAI人材獲得競争が激化する中、マークは真っ先に立ち上がってチームの士気を固め、社内Slackで強い声明のメモを発表しました。

「今の私は強烈で生理的な感覚を覚えています。誰かが私たちの家に侵入して何かを盗んだようなものです。」「信じてください、私たちは決して傍観しているだけではありません。」

左：ニック・ターリー、右：マーク・チェン

このポッドキャストには、とても衝撃的なエピソードがありました。最強のプログラミングモデルについて話していたとき、司会のAndrew Mayneが、まさか自分がClaude Sonnetが好きだと言ってしまったのです……このポッドキャスト、そんなに正直なんですか？

さて本題に戻りますが、このポッドキャストにはプログラミングに関する多くの貴重な情報が含まれていました。

🔹OpenAIはAIプログラミングの開拓者とも言える存在です。GPT-3が登場した当初、OpenAIはそれが完全なReactコンポーネントを生成できることを発見し、AIプログラミングツールの可能性と需要を捉えました。

🔹Agenticプログラミングは非同期インタラクションであるべきです。モデルに複雑なタスクを与え、バックグラウンドで一定時間処理させ、その後に最適な解決策に近いものを返してもらいます。

🔹 「良いコードを書く」には、やはり「センス」が必要です。OpenAIもコードスタイルを理解するモデルを訓練しています。

🔹 OpenAIの製品開発の考え方：技術から出発し、誰がそこから価値を見出せるかを観察し、その後にそれらのユーザーを中心に反復開発を行います。

🔹Codexはプロのプログラマー向けのAIツールであり、将来的にはより汎用的な消費者向け製品も登場するでしょう。

🔹 「仕事がなくなる」ことに固執するのはやめましょう：タイプライター修理工が確かにいなくなったように、一部の伝統的な開発作業はAIに置き換わるでしょう。しかし、「コードができること」は想像をはるかに超えています。

「コードを書くという領域は、あなたや私が想像するよりもはるかに広大です。」

プログラミングモデルは一つには集約されない、「Agenticプログラミング」に大きな可能性がある

司会者 Andrew Mayne：

多くの驚くべき能力の中でも、コードはずっと非常に興味深い方向性でした。GPT-3が登場した当初、突然それが完全なReactコンポーネントを生成できることに気づき、その時、私たちはそれが実用的な用途を持つことを認識しました。その後、私たちはコードに特化したモデルを専門的に訓練し、それがCodexとCode Interpreterを生み出しました。現在、Codexは新しい形で戻ってきましたが、名前は同じでも、その能力はますます強力になっています。

私たちはコード機能がVS Codeに最初に入った時から、Cursor、そして私がよく使うWindsurfへと進化するのを目の当たりにしてきました。現在、コードの分野では競争が激しいです。もし最強のコードモデルを持っているのは誰かと尋ねたら、おそらく答えは異なるでしょう。

マーク・チェン：

そうです、これはまさに「プログラミング」という言葉自体の指す範囲が非常に広いという事実を反映しています。例えば、IDEでコードを書く際に、関数の補完が必要なことと、Pull Requestを提出してAIにタスク全体を完了させることでは、全く異なる「プログラミング方法」なのです。

司会者 Andrew Mayne：

「Agenticプログラミング」が具体的に何を意味するのか、詳しく説明していただけますか？

マーク・チェン：

もちろんです。これを「リアルタイム応答型モデル」と比較してみてください。例えば、ChatGPTの従来のやり方は、プロンプトを与えるとすぐに返答が来るものです。しかし、Agenticプログラミングはもっと、モデルに複雑なタスクを与え、バックグラウンドでしばらく処理させ、その後に最適な解決策に近いものを返してもらうようなものです。

私たちは、未来はますますこのような非同期的なインタラクションになると考えています。つまり、複雑なリクエストを提出し、モデルに時間をかけて考えさせ、推論させ、最終的に可能な限り優れた結果を出してもらうというものです。コードの分野でも、私たちはこの進化を見ています。将来的には、実現したい機能を記述するだけで、モデルが処理して完全な解決策を返してくれるようになるかもしれません。

私たちの最初のCodexは、この方向性を示していました。それは、新しい機能や大規模なバグ修正など、PRレベルの大きなタスクを受け取り、モデルに単に素早く応答するだけでなく、本当に時間をかけて解決してもらうことを期待していました。

ニック・ターリー：

はい、結局のところ、「プログラミング」の範囲はあまりにも広すぎて、「知識労働」のような大きな言葉に匹敵するほどです。ですから、絶対的な勝者や最高のモデルが一つだけ存在するとは思いません。むしろ、多くの選択肢があるでしょう。開発者は実際、最も幸運な人たちです。彼らは今、非常に多様なツールを選択できます。私たちにとって、「Agenticプログラミング」は現在最もエキサイティングな方向性の一つです。

私が製品を開発する際によく使う評価基準があります。「もしモデルが2倍強力になったら、製品も2倍使いやすくなるだろうか？」 過去のChatGPTは確かにこれを達成しました。しかし、モデルが賢くなるにつれて、ユーザーはもはや博士課程の学生のようなモデルと会話したいとだけは思わなくなり、モデルの個性や実用的な能力なども気にするようになります。

Codexは理想的な製品形態です。タスクを定義し、モデルが時間をかけて考え、結果を生成します。このインタラクション方法は、将来より強力なモデルに特に適しています。現在はまだ早期の研究プレビュー段階ですが、ChatGPTの当初の判断と同様に、フィードバックをできるだけ早く得ることが重要だと考えており、将来に大いに期待しています。

司会者 Andrew Mayne：

以前、Sonnet（Claude）をよく使っていて、とても気に入っていました。その後、Windsurfを試してみましたが、0.4 miniまたはmediumの設定で、非常に良いと感じました。応答速度も速く、体験もスムーズでした。誰もが好きなモデルを持っているのは理解できますが、私が使っているタスクに関しては、これが初めて本当に満足できた経験でした。

マーク・チェン：

私たちがこれを発表するのは、ユーザーに体験してもらいたいからです。コードの分野にはまだ多くの「低い位置にある果実」があることも知っています。コードは私たちが重点的に取り組む方向であり、将来的には特定のニーズに合わせたコードモデルがますます増えるでしょう。

司会者 Andrew Mayne：

今、もし単に構文や書き方を素早く調べたいだけなら、GPT-4.1に直接質問します。しかし、より複雑なタスクになると話は別です。評価方法はすでに飽和状態にあり、個人の基準も異なるため、あらゆるニーズにどのように対応するかが課題です。

マーク・チェン：

特にコードの分野では、「正しい答えを生成できるか」だけではありません。ユーザーはコードスタイル、コメントの詳しさ、モデルが積極的に補助関数を書くなど余計なことをしてくれたかなども気にします。人々の好みも大きく異なるため、私たちは多くの面でさらに改善する必要があります。

ニック・ターリー：

もし過去にAIが最初に変革をもたらす分野は何かと聞かれたら、私は間違いなくコードだと答えていました。数学に似て、検証可能で採点可能であり、強化学習に非常に適しているからです。

プログラミングの「センス」は依然として最も貴重である

ニック・ターリー：

私は今でもそう思いますが、驚いたのは、コードには依然として多くの「センス」の側面が含まれていることです。専門的なソフトウェアエンジニアになるのは、知能が高くなったからではなく、チームでソフトウェアを構築する方法を学んだからです。どのようなテストを書くべきか、どのように良いドキュメントを書くか、他の人が自分のコードに同意しないときにどう対応するか、などです。

これこそが「真のソフトウェアエンジニアリング」に必要な内容であり、モデルにもこれを理解させる必要があります。ですから、AIのコード分野での進歩は速いと信じています。コードはAgentic製品を作るのに非常に適した分野ですが、「スタイル」「センス」「実際の開発プラクティス」なども考慮に入れる必要があります。

司会者 Andrew Mayne：

もう一つ興味深い点があります。ChatGPTが現在直面している課題の一つは、「消費者」と「プロのユーザー」の間でバランスを見つけることです。私は友人にChatGPTをコードモデルに接続できると話したら、彼らは皆、それはすごいことだと感じました。例えば、IDEを制御させたり、自動的にフォルダを作成させたり、ドキュメントを書かせたり、これらは実際にすべて可能です。

現在、画像タグやCodexタグがあり、GitHubを介してモデルを使用することさえ可能です。Soraも統合されました。これらの機能が徐々に融合していくのがわかります。では、消費者向け、プロ向け、企業向け機能をどのように区別すべきでしょうか？

ニック・ターリー：

私たちが作っているのは非常に汎用的な技術であり、様々な人々によって使用されます。他の多くの企業と異なり、彼らが通常特定のユーザータイプから出発し、そのグループの問題を技術で解決するのに対し、私たちはより技術から出発し、誰がそこから価値を見出せるかを観察し、そのユーザー層を中心に反復開発を行っています。

Codexを例にとると、私たちの当初の目的はプロのソフトウェアエンジニア向けの製品を構築することでした。しかし、この「波及効果」は他の多くのユーザー層にも及び、彼らも恩恵を受けることを知っています。私たちは彼らがより便利に使えるよう努力します。

実際、非エンジニアのユーザー向けにも多くの機会があります。個人的には「誰もがプログラミングできる」世界を構築する手助けをしたいと強く願っています。Codexは一般向けの製品ではありませんが、将来的にはそのようなツールが登場するでしょう。しかし全体として、誰がターゲットユーザーであるかを最初から正確に予測することは難しく、これらの汎用技術を世に出してから、実証主義的にどこに価値があるかを観察する必要があります。

マーク・チェン：

はい、さらに深く掘り下げると、一部のユーザーは主にChatGPTを使ってコードを書くかもしれませんが、たまにはモデルと話したり、美しい画像を生成したいと思うかもしれません。したがって、異なるユーザーペルソナが存在するとはいえ、実際には誰もがモデルに多様な能力を求めていることがわかります。

Codexの社内利用：エンジニアの効率を10倍にすることを目指す

司会者 Andrew Mayne：

Codexが発表されたとき、印象的だったのは、ある種のツールが大きな関心を集めるのは、社内チーム自身が強いニーズを持っているからだという感覚でした。このツールは社内でよく使われていますか？

マーク・チェン：

ますます増えています。

ニック・ターリー：

私はCodexの社内利用に非常に興奮しています。適用範囲は非常に広く、例えば開発者はテスト作成の負担を減らすために使用したり、アナリストはログエラーを処理し、問題を自動的にマークしてSlackで関係者に通知するために使用したりしています。中には「ToDoリスト」の入り口として使用し、将来完了したいタスクを事前にCodexに送る人もいます。

私は、このようなツールが「ドッグフーディング」（内部で自社製品を使用すること）に非常に適していると考えており、実際に開発効率を大幅に向上させることができます。私たちの目標は、人員を増やすことなく、既存のエンジニアの生産性を向上させることで、理想的には一人のエンジニアが元の10倍効率的になることです。この観点から、社内での利用状況は、私たちの将来の製品開発の方向性を決定する上で非常に重要な指標となります。

マーク・チェン：

はい、私たちは自分たちが使いたくないツールをリリースすることはありません。Codexが稼働する前には、社内に一部のスーパーユーザーがいて、彼らは毎日Codexを使って何百ものPull Requestを作成していました。これは、私たちが社内で実際に大きな価値を得ていることを示しています。

ニック・ターリー：

さらに、社内での利用には「現実の検証」という役割もあります。人々は皆忙しく、新しいツールを導入するにはある程度の「活性化コスト」がかかります。あるツールを普及させようとすると、皆に新しいワークフローに適応してもらうために時間が必要で、このプロセスは実際にはかなり謙虚なものです。そこから私たちは技術の限界を理解できるだけでなく、「採用経路」における実際の障壁も見えてきます。

AI時代に適応するための秘策：好奇心、主体性

司会者 Andrew Mayne：

確かに、この種のツールを構築する際、チームメンバーは学習と適応に時間を費やす必要があります。今、ホットな話題は「将来どのようなスキルが必要か？」ということです。チームを編成する際に、どのような能力をより重視しますか？

ニック・ターリー：

この問題については、これまで何度も考えてきました。採用は本当に難しいです。特に小さくて強く、謙虚で実行力の高いチームを構築したい場合は。私が最も重視する能力は好奇心です。

多くの学生から、急速に変化する世界でどうすればいいかと尋ねられます。彼らに私が与えるアドバイスは、「好奇心が鍵である」ということです。私たち自身もまだ知らないことがたくさんあり、何が価値があり、何がリスクであるかを理解するために、謙虚な姿勢で深く研究する必要があります。

特にAI関連の仕事においては、コードであれ、その他の分野であれ、真のボトルネックは答えを得ることではなく、適切な質問をすることです。だから、私たちは世界と自分たちのしていることに好奇心を持つ人々を採用する必要があると強く信じています。

AIのバックグラウンドがあるかどうかについては、私はそれほど気にしません。もちろん、マーク（マーク・チェン：）は異なる見解を持っているかもしれませんが。しかし私にとっては、プロダクトチームの成功は、好奇心の強さに大きく依存しています。

マーク・チェン：

私もほぼ同じです。研究分野でさえ、今ではAIの博士号が必須であるという強調はますます少なくなっています。私自身も「レジデント研究員」として参加しましたが、当時、正式なAIの訓練を受けた経歴はありませんでした。

ニックが言ったことは非常に正しいと思います。もう一つの重要な資質は「主体性」です。OpenAIは毎日誰かが「今日はこの3つのことをしなさい」と指示するような場所ではありません。むしろ、自分で問題を見つけ、積極的に解決に飛び込む必要があります。

そしてもう一つは適応力です。この業界の変化は非常に速いため、何が重要か、いつ方向性を調整すべきか、どのように仕事の優先順位を変えるべきかを迅速に判断できなければなりません。

ニック・ターリー：

確かに、「OpenAIはどのようにして製品を継続的にリリースできるのか」とよく聞かれます。多くの人は、私たちがほぼ毎週新しいものをリリースしていると感じています。しかし、私たち自身は、決して十分な速さだと感じたことはありません。むしろ、もっと速くできると常に感じています。

真の理由は、私たちには実行力のある人材が大量にいるからです。製品、研究、政策チームのいずれも、皆がプロジェクトを前進させることができます。「リリース」がチームによって意味合いが異なるとしても、私たちは不必要な官僚的なプロセスを減らし、厳格なプロセスが必要なごく一部の領域を除いて、ほとんどの時間で迅速に進めることができます。これもまた、私たちが採用したい理想的な人材のタイプです。

司会者 Andrew Mayne：

私が会社に入ったのは、GPT-3にいち早くアクセスできるようになり、それで色々なデモを作り、毎週動画を投稿していたからです。たまに迷惑だったかもしれませんが（笑）、本当にワクワクしていました。

マーク・チェン：

迷惑ではありません、むしろ面白いです。

司会者 Andrew Mayne：

あの時期は本当に興奮しました。人に説明する時には、彼らがUFOを作ったのに、私がそれを操れるようなものだと話していました。例えば、それが「ホバリング」するのを見たとき、「うわー、本当に飛ばしたんだ！」と思いました。私はボタンを押しただけですが、その力は本物だと感じました。

私は独学でコードを学び、たくさんのUdemyのコースを見ました。そして、エンジニアリングチームの一員として「自分で何かをやってみろ」と励まされ、それがコアな仕事ではなかったし、何かを壊したわけでもないけれど（笑）、その自由が私に力を与えてくれました。

私はその精神が今も残っていると感じています。それがOpenAIが製品を前進させ続けられる理由の一つです。結局、GPT-4は150人から200人の共同作業で完成したのですから。

司会者 Andrew Mayne：

皆さんはこのことをよく忘れていると思います。

ニック・ターリー：

全く同感です。実際、ChatGPTでさえもこのように「寄せ集められた」ものです。最初は研究チームが「指示に従う」に関する研究を行っていて、その後のモデルもこの路線を継承し、後学習によってモデルが対話に適したものになりました。そして、ChatGPTの製品プロトタイプは、実はハッカソンプロジェクトだったのです。

よく覚えているのは、当時皆に「消費者向け製品を作りたい人はいるか？」と尋ねたことです。すると、様々なバックグラウンドを持つ人々が参加しました。例えば、スーパーコンピューティングチーム出身の人が「以前iOSアプリを作ったことがあるから、私がやります」と言ったり、研究者がバックエンドのコードを書いたりしました。それは「何かをしたい」人々の交差点だったのです。

このようなことが起こる組織文化が、次のChatGPTを生み出す鍵であり、私たちが組織規模が拡大し続けても維持しなければならないものだと私は考えています。

司会者 Andrew Mayne：

私たちは以前、チームが採用時に「好奇心」を重視すると話しました。マークもこれに同意しています。もし私がAI業界外の人間で、例えば25歳や50歳だとして、技術の急速な発展に直面すると、特にChatGPTが文章作成やプログラミングでこれほど優れていると、少し恐れを感じるかもしれません。

しかし、私は個人的に、「コードを書く人」は決して十分な数にはならないと考えています。なぜなら、コードで実現できることは、私たちが想像するよりもはるかに多いからです。

置き換えられることを心配するな：コードを書くという領域は想像をはるかに超えて広大である

司会者 Andrew Mayne：

では、皆さんは一般の人々にどのようなアドバイスをされますか？彼らが人生のどの段階にいようとも、このAIの未来にどのように準備し、適応し、参加すべきでしょうか？

マーク・チェン：

最も重要なのは、自分の能力が強化されるということを認識することだと思います。AIはあなたをより効率的に、より影響力のある存在にすることができます。

将来的には、専門家は依然として存在しますが、AIが最も助けになるのは、元々高度なスキルを持たない人々です。例えば、モデルがより良い医療アドバイスを提供できるなら、それは質の高い医療資源にアクセスできない人々を最も助けることになります。

画像生成も同様で、プロのアーティストを置き換えるのではなく、私やニックのような人間でも創造的な表現をできるようにするものです。

AIが提供するのは、「能力向上インフラ」であり、これにより一般の人々が、本来苦手だった多くのことをこなせるようになります。

ニック・ターリー：

未来は確かに大きく変わるでしょう。ほとんど誰もが、AIがこれまで「神聖で人間固有のもの」だと思っていたことをする瞬間に立ち会うことになると思います。

司会者 Andrew Mayne：

投資をしている知人がいるのですが、彼の仕事内容がAIに置き換えられたとき、非常に脅威を感じていました。

マーク・チェン：

その通りです。今では、コードを書いたり、問題を解決したりする点で、私より優れているモデルもいます。

ニック・ターリー：

それは人間としてごく自然な反応です。このような強力なシステムに直面すると、畏敬の念を抱くと同時に、恐れを感じることもあります。

マークが言ったように、自分で使ってみて初めて、それを真に理解し、恐れを減らすことができます。

私たちの多くは幼い頃から「人工知能」という言葉を聞いてきましたが、当時はアルゴリズムや広告推薦、あるいは映画に出てくるロボットのことで、人によってAIが意味するものは異なりました。ですから、恐れを感じるのは全く不思議ではありません。

他人と建設的な対話をするには、最も良い方法はAIを実際に自分で使ってみることです。

未来に備える方法としては、プロンプトエンジニアリングやAIプログラミングの原理を深く掘り下げる必要はないと思います。

むしろ重要なのは、本質的な人間の能力、例えば「タスクを委任する方法」などです。

あなたは「ポケットの中にいるエージェント」を持つことになります。それはあなたのメンター、アドバイザー、エンジニアになりえます。本当の鍵は、あなたが自分自身を理解しているか、何を解決したいのかを知っているか、そして他人がどのようにあなたを助けられるかを知っているか、です。

ニック・ターリー：

先ほども言いましたが、好奇心は非常に重要です。どのような質問ができるかで、どのような結果が得られるかが決まります。それに加えて、継続的に学習する能力も極めて重要です。

新しい分野や知識を素早く学ぶほど、かつてない速さで変化するこの世界に適応できるようになります。私自身も、いつか今のプロダクトマネージャーという役割がなくなることを受け入れる準備ができています。しかし、私も新しいことを学ぶことを楽しみにしています。もしあなたがそのような心構えを持っていれば、AIをうまく活用できるでしょう。

司会者 Andrew Mayne：

私たちは時々、特定の仕事がなくなることを過度に強調しがちです。例えば、タイプライターの修理工はもう必要ありません。特定の種類のプログラミングの仕事も消滅するでしょう。

しかし、私はやはり言いたいのです。コードを書くという領域は、想像をはるかに超えて広大であると。

先ほど医療業界について触れましたが、AIが医師を代替することを心配する人もいます。しかし、私自身はAIに診断や手術、さらには多くのことを処理してもらっても構いません。

それでも私は、誰かが私と一緒に話して、手術の流れを説明し、手を握ってくれることを望みます。私は毎日たくさんのビタミンを摂取していますが、毎日このような些細なことで医者に質問することはできませんよね？

OpenAIポッドキャスト、再びAIプログラミング戦争を語る！開発者は最も恵まれている：特定のニーズに対応したコードモデルが登場する！司会者がうっかり漏らす：「一番好きなのはClaude！」

短いURLをシェア