ウォートン・スクール教授イーサン:私たちは本当にAIを使っているのか?それともただ空白を埋めさせ、コストを削減し、絶滅への道を加速させているだけなのか?

画像

著者|大模型機動組 メール|damoxingjidongzu@pingwest.com

ウォートン・スクール教授で著名なAI研究者であるイーサン・モリリック氏と、Sanaの創業者兼CEOであるジョエル・ヘルマーク氏が、職場におけるAIの急速に変化する世界について、率直で広範な対談を行いました。彼らは、AIがいかに単なる効率化ツールにとどまらず、漸進的な最適化と変革的な規模の間で企業に選択を迫る転換点であるかを探りました。議論は、機械知能の根源、AGIの関連性、そしてAIネイティブな未来に向けて組織をゼロから構築する方法に及びました。

以下は対談の全文記録です:

ジョエル・ヘルマーク:最初に、MITにいた頃、マービン・ミンスキーたちと一緒にいた時にどのような考えを持っていましたか?

イーサン・モリリック:その段階は、少し技術的な栄光を盗むようなものでした。私はマービンと一緒にプログラミングをしていたわけではなかったので。私はビジネススクールの学生で、AI分野の人々が他の人にAIとは何かを説明するのを手伝おうとしていました。だから、マービンやメディアラボの他の人たちと、この点でたくさん協力しました。

特に面白かったのは、当時AIの冬の時代だったので、人々はAIにあまり注目していませんでした。みんながどうすれば知的な複雑なスキームを作れるか考えていました。当時、赤ちゃんのあらゆる行動を観察し、それがAIを作ることにつながるかもしれないと考えるプロジェクトや、政府の「心の社会」プロジェクトなど、複雑に相互に関連する内容がありました。皮肉なことに、実際の解決策は最終的に、学習システムに大量の言語を入力することであり、それが大規模言語モデルにつながったのです。

ジョエル・ヘルマーク:それは興味深いですね。多くの技術的なアイデアは最終的に間違っていたことが証明されましたが、その中のいくつかの核となる哲学的な思想は今また流行していますね。ミンスキーとエンゲルバートは人間知能の拡張を主張しました。ミンスキーは機械で人間知能を置き換え、機械に意識を持たせることに傾倒していました。AIをどのように適用するかという基本的な理念の中で、今でも意味のあるものは何だと思いますか?

イーサン・モリリック:私たちは今、このことで苦しんでいます。なぜなら、これらの成果を目の当たりにし、「拡張」の問題に立ち返っているからです。2週間前に発表された新しい論文では、GPT-4.5が3者チューリングテストをパスできるようになったと指摘されています。実際、70%のケースで人々はAIを部屋にいる人間だと誤解しました。それが何を意味するのかはわかりませんが、ランダムな推測よりは良いことです。

私たちは、思想家たちが長年懸念してきた問題に直面していると思います。AIは人間を置き換えるのか?私たちはどのようにそれを利用すべきなのか?人間知能の拡張について、拡張とは一体どのようなものなのかが大きな問題になりました。例えば、私たちのこの議論は、以前は深く掘り下げられたことがなかったと思います。なぜなら、以前はフィクションのようなものだったからです。では、これらの非常に知的でありながら限界もある機械をどのように扱うべきなのか?この方程式の中で人間はどのような位置にあるべきなのか?この問いは以前は決して答えられなかったのに、今突然非常に重要になったと思います。

ジョエル・ヘルマーク:チューリングテストは当時素晴らしいアイデアでした。しかし、もし今、新しい「モリリックテスト」を設計するとしたら、AGI向けの「モリリックテスト」はどのようなものであるべきだと思いますか?

イーサン・モリリック:私はずっとAGIという概念に戸惑っています。この概念は非常に曖昧に定義されています。チューリングテストが面白いのは、他のテストと同じ理由で、テストできるものがなかった頃は素晴らしいものでした。例えば、チューリングテストは、コンピューターが明らかにパスできない頃はすごかった。私たちもいくつかの問題に直面しています。例えば、AIは既存のすべての創造性テストで優れた成績を収めていますが、これらのテストは人間向けに設計されており、人間にとっても平均的なレベルでしかありません。

今、私たちはAIがこれらのテストに合格して、人が共感を持っているかどうかを判断できることを期待しています。社会科学では、最高のテストは「心の読み取りテスト」です。私たちは人々に目の写真をたくさん見せて、写真の人物の感情を言ってもらいます。これらのテストはAI向けに設計されていません。だから私はこの問題についてよく考えますし、実際の応用という観点からそれを見る傾向があります。

まず、誰もがAGIについて独自のテスト基準を持っています。私はビジネススクールの教授なので、私にとって最も簡単なテスト基準の1つは、このエージェントが現実世界でお金を稼ぎ、仕事をこなせるかどうかです。有用なテストとして、新しい知識を発見し、検証し、結果を出すことができるか?しかし、私たちはAGIが特定の時点ではなく、私たちがいる段階であることに気づき始めていると思います。その到来を告げる花火は上がりません。タイラー・コーエンはGPT-3がAGIだと言いました。理由を尋ねると、彼はそれがポルノのようなもので、見ればわかるからだと言いました。だから、私たちはこれらの問題の答えが何であるかを知りませんし、これらの問題自体が無意味であることにさえ気づき始めています。

イーサン・モリリック:なぜなら、皆さんもご存知のように、AIをシステムや会社のプロセスに適切に接続すれば、各部分を単純に足し合わせたよりもはるかに良い効果が得られることが証明されているからです。これは、単に会話するのとは全く異なります。例えば、戦略的意思決定を行う場合などです。

ジョエル・ヘルマーク:これらのモデルがリリースされるとき、常に最も硬核な数学問題や科学問題に対してテストが行われ、ビジネス用途に特化することはほとんどありませんでした。もしあなたが、より企業の実際の応用を重視した新しいベンチマークを定義するとしたら、それはどのようなものになるでしょうか?

イーサン・モリリック:それは私たちが現在直面している最も重要な問題の一つだと思います。なぜなら、研究室の人間は科学者であり、人生で唯一意味のあることはプログラミングだと考えているからです。さらに、彼らはAIを使ってより良いAIを開発したいと考えています。だから、プログラミングと数学が重要なスキルになり、次に生物学が来ます。なぜなら、彼らは皆、永遠の命を望んでいるからです。そういった傾向があります。

しかし、他の面ではほとんどベンチマークがありません。私たちはAI企業がベンチマークのためにモデルを開発し、少し信頼性の低い方法でモデルを最適化していることを知っていますが、彼らはこれらの方法でテストも行います。だから、良いビジネスベンチマークが不足しているのは本当に問題であり、実際、私は企業がある程度自分でこれを行うことを提唱しています。

具体的なデータに基づいて測定できるものもあります。例えば、会計処理プロセスにおけるエラーの頻度などです。しかし、主観的な感覚に基づいて測定できるものもあります。彼らが言うように、外部の専門家を招いて回答の品質を評価し、人間と同じくらい優れているかを確認することができます。あなたの仕事における重要な各部分について、独自のチューリングテストを設定してください。分析レポートは十分ですか?エラー率はどのくらいですか?戦略的なアドバイスを提供するためにそれを使用する場合、意思決定の選択の品質はどのようなものですか?これらの問題は測定が難しくなく、専門的でもありませんが、確かに努力が必要です。

ジョエル・ヘルマーク:この点においては製品にも多くの欠点があると思います。特にエージェントをデプロイする際、それらをテストし、彼らが持っている知識と欠けている知識を理解し、修正し、テストセットを実行する能力は非常に限られています。AIファーストの組織を設計することを考えるとき、例えば千人規模の企業を完全に評価可能な組織に再設計するとしたら、どのように構築しますか?

イーサン・モリリック:まず、AIを核とするように組織を再設計するのは簡単ではありません。なぜなら、元々そうではなかったからです。私たちは非常に興味深い段階にいます。何百年もの間、組織の発展は産業革命や通信革命と並行してきました。最初の組織図は1855年にニューヨーク・アンド・エリー鉄道のために描かれました。それは、電信を使って鉄道線上の大量輸送をリアルタイムで調整する方法という、前例のない問題を解決しました。マッキンゼーの創業者がこの組織図という解決策を考案し、私たちは今日でもそれを使用しています。その後も、ヘンリー・フォードの生産ラインやタイムカード制度(これらも今日でも使用されています)、そしてアジャイル開発モデルなど、多くの重要な組織革新がありました。

これらのモデルはすべて、人間の知能という一種の知能しか存在しないという前提に基づいています。人間の能力には限界があり、管理の範囲は通常5〜7人です。これが「2枚のピザの原則」と呼ばれるものです。しかし、今は状況が異なります。私たちはゼロから再構築する必要があります。私は、現代の欧米企業が組織革新を放棄してしまったのではないかと少し心配しています。

以前は、ダウ・ケミカルやIBMといった企業が勝つ方法は、新しい販売方法や他の組織と協力する新しい方法を考案することでした。しかし今、私たちはこれらすべてをアウトソーシングしています。企業向けソフトウェア会社は、Salesforceが製品を売って販売方法を教えるように、企業をどのように組織するかを教えてくれますし、大手コンサルティング会社は組織をどのように運営するかを教えてくれます。今は、リーダーが真に革新する必要がある時です。

最初の質問に戻ると、組織を再設計する際には、製品における人間の必要性が減少するという傾向を考慮する必要があります。そして、人間の能力を拡張するか、人間を置き換えるかを選択し、その観点からシステムを構築し始めるのです。それは、より少ない人間でより優れた仕事を成し遂げるのか、それともより多くの人間でより多くの仕事をこなし、共に世界を征服するのか、ということです。

ジョエル・ヘルマーク:これは、いわゆる「スーパー従業員」を減らすことを意味するのでしょうか?それとも、全員の生産性を2倍にすることを意味するのでしょうか?少人数のチームを編成してエージェントの運用を監督し、大幅に生産性を向上させるのか、それとも組織全体に広く展開し、少数の人々がより多くの向上を得られるようにするのか?

イーサン・モリリック:これらはすべて重要な選択肢だと思います。私が心配していることの一つは、初期の応用事例を見る限り、人々がAIを効率を高める技術と見なしていることです。これについては私もいくらか責任があります。私たちの最初の研究はAIがもたらす生産性向上に焦点を当てており、それは重要なので今でもそれに注目しています。しかし、産業革命の瀬戸際、あるいはこの新しい革命において、企業がAIを普通の技術として扱っていることを非常に懸念しています。

例えば、AIを使ってカスタマーサービスで25%の効率向上やコスト削減を実現したからといって、25%の従業員を解雇するという話をよく耳にします。これには多くのリスクがあります。一つのリスクは、あなた自身を除いて、あなたの組織でAIをどのように展開すべきか誰も知らないということです。非常に有用なツールや技術を開発することはできますが、最終的には、社内の人々がそれらが有用かどうかを判断しなければなりません。彼らは判断を下すための関連する経験と証拠を持っています。もし彼らがAIを使うことで解雇されたり、罰せられたり、置き換えられたりすることを恐れて試そうとしなければ、AIが効率を高めたとしても、彼らはあなたに見せようとしないでしょう。

もう一つの問題は、もし私たちが生産性の大爆発を迎えようとしているのであれば、この時期に組織の規模を最小限に縮小することは賢明ではありません。19世紀初頭の産業革命を想像してみてください。地元の醸造業者が蒸気力を手に入れたとします。彼は従業員の大部分を解雇して、ビール1樽あたりの利益を増やすこともできますし、ギネスのように10万人を雇用して、世界中に事業を拡大することもできます。私は、あまりにも多くの人が大局的な道ではなく、小規模な道を選んでいることを懸念しています。

ジョエル・ヘルマーク:あなたは常に人間能力の拡張を提唱してきましたね。以前私たちがよく言っていた「思考の自転車」のように、今ではある程度「思考の飛行機」を持っているかもしれません。AIはどのように人間知能を拡張するとお考えですか?これは私たちの従来の認識とは少し異なります。私たちはこれまで、AIはまず単調な反復作業から始まり、次に知識労働、プログラミング、そして最後に創造的な作業へと発展すると考えていました。しかし、実際には状況はほぼ逆で、創造的な作業や知識労働の分野ではAIは良好なパフォーマンスを示しますが、単調な反復作業は自動化が非常に困難です。AIをどのように適用すべきだと思いますか?

イーサン・モリリック:非常に興味深いのは、AIに「愛」という概念を説明しようとすると、AIが「フリーズ」して理解できない場合があるということです。しかし、今では奇妙なシステムがいくつかあり、それらは非常に感情的で、何かをするためには説得が必要です。例えば、プロンプトエンジニアリングでは、AIに特定のステップを実行すべき理由を説明する必要がある場合があり、直接命令するだけではだめです。「これは重要だから、こうすべきだ」と伝えなければならないのは、非常に奇妙です。

人間能力の拡張について言えば、私たちの仕事は多くの異なるタスクで構成されており、誰も今のやり方で仕事のデザインをしていません。例えば、教授である私は多くのことをします。良い教師になり、良いアイデアを出し、皆さんと交流し、研究を行い、学術部門を管理します。これらのタスクの多くはAIに任せることができます。AIが宿題を採点してくれるなら構いません。AIを通じてより多くのコンサルティングサポートを提供してくれるなら、それも構いません。

ですから、人間能力の拡張は、AIが創造的で知識的なタスクをこなせるからといって、それらの分野でAIが人間よりも優れているという意味ではありません。少なくとも現状では、これらの分野で専門家レベルに達しているわけではありません。あなたが最も得意とすることは、おそらくAIよりも上手にできるでしょう。したがって、人間能力を拡張する第一歩は、仕事の中で自分が得意ではない部分をAIに任せることです。第二歩は、AIを使って今行っていることを向上させることです。これについては、関連する証拠も出始めています。

ジョエル・ヘルマーク:これらのシステムが受動的ではなく、より能動的になったらどうなるでしょうか?現在、私たちはシステムに情報を入力し、フィードバックを得たり、プロンプトを出したりすることに大きく依存しています。ある時点で、私たちよりも問題提起が上手なシステムが登場し、それが私たちに積極的にサービスを提供するようになるはずです。あなたの分野を例にすると、システムがあなたのすべての研究を代行し、そして「イーサン、これはあなたの研究方向と一致しています。私は5つの論文を書きました。一番良いものを選んでください」と言うような状況はこれまでにありましたか?

イーサン・モリリック:あなたが挙げた点はいくつか非常に重要です。その一つで、比較的副次的ですが非常に重要なのが、システムが私に論文を10本提供してくれるという状況です。現在、私たちが直面している問題は、情報が豊富であると同時に過剰であるということです。大量の情報を簡単に取得し、それをフィルタリングすることにまだ慣れていません。ですから、情報をフィルタリングする能力が非常に重要になり、多くの選択肢の中から適切なコンテンツを選ぶことができるようになります。これは、ある種の管理能力のようなものです。何しろ、多くの人が管理能力を持ちたいと願っているわけですから。重要なのは、システムを私たちが期待する方向に導く方法です。

しかし最終的に、私たちはこれらのシステムがどれほど良くなるか確信が持てません。そして、それぞれの問題は、AIの発展に対するあなたの期待によって決まります。もしAIが私たちの組織におけるすべての仕事、例えば教授としての私の仕事を高いレベルでこなせるようになったら、私たちは未知の領域に入ることになり、その答えは私にはわかりません。実際の組織運営は、私たちが想像するよりもはるかに複雑であり、必ずしも効率を追求しているわけではないと思います。

AIの能力にも限界があります。論文全体を完成させることはできないかもしれません。なぜなら、いくつかの部分で失敗するからです。しかし、私に経験があれば、どこで失敗するかを知り、介入して調整することができます。まるで博士課程の学生を指導するようにです。ですから、しばらくの間は、私たちが方向性や指導を提供する必要があり、自律性はまだ限られていると思います。

ジョエル・ヘルマーク:AIの能力の限界は、現在の組織での応用において最も不足している側面かもしれないと私は思います。システムとのコミュニケーションは非常に混乱していて、時には天才的なパフォーマンスを見せるかと思えば、時には非常に愚かです。これが、AIを組織内で単独で展開することを非常に困難にしています。これは自動運転車に少し似ています。デプロイには長い時間がかかりました。なぜなら、あるアプリケーションでは超人的なパフォーマンスを発揮する一方で、他の状況では問題に遭遇するからです。独立型エージェントの応用状況はどのようになると思いますか?能力の限界によって今後10年間は阻害されるでしょうか、それともすぐにこれらのシステムを信頼するようになるでしょうか?

イーサン・モリリック:現状では、特定分野のエージェントは非常にうまく機能していると思います。例えば、Google、OpenAI、X社が提供するディープリサーチエージェントは、非常に紛らわしい面もありますが、いずれも素晴らしいです。情報検索や特定のタスクの解答提供を非常にうまくこなしており、これは非常に価値のある作業です。ただし、まだ完璧ではありません。例えば、人々がこれらのシステムを十分に活用するために必要なプライベートデータにアクセスできないなどです。しかし、法律調査、会計、市場調査、金融調査などの分野では、すでに優れたパフォーマンスを発揮し始めています。したがって、複雑な特定のタスクを特定分野のエージェントに任せることは可能です。

巧妙な方法でエージェント同士を相互監視させることもできると思いますが、今のところ誰も積極的に推進していません。私たちはAIに触れ始めたばかりで、考慮すべき点が2つあります。1つは能力の境界です。私が提唱する「でこぼこした境界」という概念は、この境界が外側に広がり続けているものの、でこぼこしていることを指します。しばらくの間は弱点が存在しますが、AI全体の能力が向上するにつれて、一部でパフォーマンスが劣っていても、人間よりも優れている状態になります。したがって、問題は、境界が拡張されるのを待って問題を解決するか、それとも今すぐにこれらの弱点を取り巻く改善を行うかです。私は両方を行うべきだと思います。しかし、もし今、弱点の解決に過度に集中しすぎると、モデルが継続的に改善されるにつれて、最終的には古い弱点の境界に基づいて構築されたシステムに縛られることになるかもしれません。

ジョエル・ヘルマーク:非常に理にかなっています。組織が直面する課題の一つは、AIの応用シナリオを発見することです。一部の組織はボトムアップ戦略を採用し、組織のほとんどのメンバーがある程度AIツールを使用しているものの、リーダーには伝えていません。別の組織は、AI戦略を策定するなど、トップダウン戦略を採用しています。組織内でこれらの応用シナリオをどのように発見すべきだと思いますか?どのような戦略がありますか?

イーサン・モリリック:組織でAIを機能させるには、リーダーシップ、大衆の支持、そして研究開発投資の3つの要素が必要だと私は思います。リーダーシップについては後で詳しく説明します。

つまり、組織はCEOや上層部から、私たちの組織の事業とは何か?どのような形にしたいか?組織の形態についてどのような実験を行いたいか?といった基本的な問題を考え始める必要があります。これらの問題が解決されなければ、組織メンバーのインセンティブメカニズムを適切に設定することはできません。社内の誰もが、インテリジェントなエージェントと一緒に働くなら、日々の仕事が一体どのようなものになるのかを知りたいと思っています。ですから、これらはリーダーシップが明確にする必要があります。現在の問題の一つは、上層部のリーダーがこれらのシステムを十分に活用していないことです。うまく活用している組織は、はるかに早く普及を進めていることがわかります。

例えば、JPモルガン・チェース銀行は、AIを活用していることを公に表明しており、このやり方が徐々に広まっています。これがJPモルガン・チェースがAI応用において優れている理由の一つです。リーダーシップによる推進と、大衆の支持も必要で、誰もが何らかの形でこれらのツールを使用できるようにする必要があります。さらに、使用経験を共有するインセンティブメカニズムを構築する必要があります。人々がAIの使用経験を共有しない理由はたくさんあります。例えば、自分は賢いと思われたいから人に知られたくない。効率が上がると人員削減につながると心配している。仕事が楽になったのに、会社に余分な価値を共有したくない。良いアイデアがあるのに共有するリスクを冒したくない。だから、組織のメンバーが共有を望むようにする必要があります。

次に、これらの個人の経験を製品やインテリジェントエージェントに変換するには、実際の研究開発作業が必要です。これは単にプログラミングを意味するだけでなく、ツールの開発も重要です。重要なのは、どのように実験を行うか、簡単なプロンプトをインテリジェントエージェントシステムに変換する方法、そしてこれらのシステムをどのようにベンチマークするかです。これら3つの要素は不可欠です。

ジョエル・ヘルマーク:この一年で、あなたはチームコラボレーションやアシストコンサルティングにおけるAIの応用など、多くの研究を行ってきました。現在、どのような応用シナリオが有意義な価値をもたらしていると思いますか?

イーサン・モリリック:現状は非常に明らかです。企業社会責任のような一部の業務は、AIにはまだ難しいです。対外的な直接対話の代替や拡張においては、結果は非常に明確です。個人がAIと協力する、特に情報共有ができる場合、創造性生成の面でAIは非常に役立ち、より良いアイデアを生み出すのに役立ちます。異なる方法で異なる効果がありますが、この協力方法は、翻訳、情報抽出、要約など、様々な業務を補完する役割を果たします。

しかし、最も興味深いのはワークフローの加速です。多くの迅速なプロトタイプ開発事例を見てきました。例えば、アイデアが生まれた後、AIに25個の関連アイデアを生成させ、それらのアイデアを創造性の基準でテストし、次にユーザーがそれらのアイデアにどのように反応するかをシミュレーションし、さらにアイデアを洗練させ、最終的に実行可能なプロトタイプを作成します。このプロセスは、コマンドラインとOpenAIを通じてわずか25分で完了する可能性があります。しかし、組織はしばしばこのプロセスで問題に遭遇します。例えば、多くの良いプロトタイプができても、製造能力と生産が追いつかないことです。したがって、初期段階では、AIの拡張効果は非常に明白です。さらに、研究エージェントや知識管理エージェントも非常に価値があり、タイムリーなアドバイスを提供できます。

ジョエル・ヘルマーク:誰もがプログラミングをし、科学研究をし、複数の分野に深く関わるようになったとき、経済はどう変化するのでしょうか?例えば、医療業界の生産性が10倍になったら、規制の制約は残るのでしょうか?それともシステムが変化に適応するのでしょうか?

イーサン・モリリック:どちらも起こるでしょう。システムの変更には長い時間がかかります。DeepMindの人と話したとき、彼らは1年以内に新薬開発で良い結果が出たと言っていました。これはシステムに変化を促すでしょう。しかし、規制環境の不確実性が問題です。例えば、ヨーロッパとアメリカでは規制の理由が異なり、それが投資方向を決定するのを難しくしています。また、AIは現実世界での行動能力が限られています。

ロボット技術と組織構造の発展は、AIに遅れをとっています。したがって、これらの要因をどのように考慮するかが非常に重要になります。人々がインテリジェントエージェントを使うのを好む理由の一つは、それらが一部の作業を自動的に完了させてくれるので、私たちを安心させてくれるからです。しかし、それらは最終的に現実世界の問題に直面し、これらの摩擦点が進捗を遅らせることになります。一方、これらの摩擦点を突破して、いくつかの可能性のある化合物を供給できれば、それは大きな進歩です。したがって、利益は徐々に現れるでしょうが、具体的な状況はまだ不明であり、これもシステムの自律性に関連しています。

ジョエル・ヘルマーク:このような状況で、組織内でどのような役割がより価値を持つようになると思いますか?

イーサン・モリリック:それは難しい問題で、組織の選択に大きく依存します。システムには多くの問題があるため、管理職やシステムについて考える役割は非常に価値があると思いますし、専門家も非常に価値を持つようになるでしょう。専門知識は非常に重要であることが証明されており、どんなシステムもその分野の最高峰の専門家には及びません。私たちは通常、その分野の平均レベルで評価しますが、AIはその点では優れています。しかし、もしあなたが特定の分野で上位2%の専門家であれば、その分野ではAIに勝てます。したがって、この分野では専門知識が非常に重要です。深い専門知識、あるいはシステムリーダーとしての幅広い知識、または優れた判断力、この3点があなたに役立つでしょう。

ジョエル・ヘルマーク:私はずっと疑問に思っていたことがあります。一方では、あなたが言うように、より経験豊富な開発者、例えば上位2%の人だけを雇うことで、大きな変化をもたらすことができます。他方では、AIの支援があれば、より多くのジュニア開発者もベテラン開発者のレベルに達することができます。専門知識の普及は、より多くのジュニア人材でチームを編成することを可能にし、ベテラン人材はこの技術からあまり恩恵を受けないということになるのでしょうか?

イーサン・モリリック:実際には、いくつかの影響要因が同時に作用しており、分析する価値があります。私たちボストンコンサルティンググループの研究は、現実世界で、低パフォーマンスの人がAIから最大のパフォーマンス向上を得たことを最初に記録したものです。しかし、人々は私たちがこの現象を発見した理由についてあまり議論しません。私たちは「定着率」という指標を測定しました。これは、コンサルタントが最終的にAIの回答を自分の回答に変換する割合です。約80%のコンサルティング業務において、唯一の失敗方法は、AIの回答に自分のアイデアを加えることでした。AIの回答を直接提出するだけで、素晴らしい結果が得られました。

AIシステムの回答に自分のアイデアを加えることだけが失敗する方法であり、AIシステムが提供した回答をそのまま提出するだけで、非常に良い結果が得られました。本質的には、自分のアイデアを加えてはいけないということです。したがって、基本的に上位8%のレベルに達することができます。あなたが朝、ジュニア開発者を雇って彼らをより優秀にする必要があると言ったとき、私は明確にする必要があると思います。それは、人間は現在AIに自律的に完成させられないことを代行しているだけなのか?例えば、私が要件を貼り付けたり、会議に参加したりする一方で、実際にはAIが仕事を完了しているのか?それとも、本当に人々をそのレベルに到達させることができるのか?

同時に、真の優秀な人材レベルでは、次のような効果が見られます。あなたが非常に優秀でAIを正しく使用していれば、あなたの作業効率は10倍、いや100倍に向上します。ですから、この両側面を同時に考慮する必要があると思います。このような代替効果が存在します。私は常に、多くの恩恵は、あなた自身が専門知識を持ち、AIを使って自分の苦手な分野を補うことから得られると考えてきました。

例えば、私は常に起業家の問題を考えています。私自身も起業家であり、起業の授業を教えています。起業とは、多くの面で苦手なことが多いけれど、ある特定の面では非常に優れている状態です。私が起業の授業を教える理由は、あなたが苦手な95%のことでつまずかないようにするためです。例えば、以前は事業計画書が必要だとか、事業プレゼンテーションのやり方を知らなかったけれど、あなたのアイデアは素晴らしいし、この市場でそれを実行する方法も知っている。だからAIはこれらの問題の80%を解決するのに役立ちます。これは本当に良いことです。これは実際にはあなたの仕事を置き換えているのです。しかし、あなたが上位99.9%の領域にいる場合、あなたは100倍の向上を得ることができます。私はこの理屈も同じだと思います。問題は、もしあなたがジュニア人材を採用し、彼らが常にAIを使うことを期待するなら、彼らがどのようにしてシニア人材に成長できるのか、これが真の課題となると思います。

ジョエル・ヘルマーク:解決策は何だと思いますか?例えば、私は多くの法律事務所と話したことがありますが、彼らにとって研修の核となる部分は基礎的な仕事を行うことです。そして、経験を積むにつれて、より複雑な法律分析を行うようになります。しかし、ジュニアの職員が実際にやっている仕事を見ると、彼らの仕事のほとんどはシニアの仕事と一致せず、単純で繰り返しが多いと思います。これは問題になると思いますか?つまり、人々が以前のようにキャリアの階層で成長できなくなること、あるいはそれに対応して、シニアの役職に就ける人が少なくなること、あるいは人々がより早くシニアの役職に就くことになるでしょうか?

イーサン・モリリック:私はこの問題を本当に心配しています。他の大学と同様に、私はウォートン・スクールで教えていますが、学生たちは非常に優秀です。彼らは多才で、私は分析方法を教えていますが、彼らがゴールドマン・サックスのアナリストになることを教えているわけではありません。そして彼らはゴールドマン・サックスや法律事務所のような場所に行き、過去4000年間私たちが教えてきたどんなホワイトカラーの知識労働と同じ方法、つまり徒弟制度を学びます。

あなたの言う通り、彼らは反復的な仕事を何度も何度もやらされます。この反復的な仕事を繰り返すことで専門知識が蓄積されます。あなたは上司に叱られるでしょう。ある会社では待遇が悪いかもしれませんが、ある会社では待遇が良いかもしれません。しかし、基本的には、あなたは常に修正を受けます。例えば、取引メモを書くとき、それは単に取引メモの書き方を学ぶだけでなく、なぜこの方法がうまくいかないのかも学んでいます。メンターから目標とは何かについて多くのことを学ぶでしょうが、物事はそうして起こるのです。

良い指導者がいれば、徒弟制度は機能します。私たちは人々に専門的に訓練するのに多くの時間を費やしていません。それはまるで魔法のようです。ある人は学び、ある人は解雇されます。彼らが解雇されるのは、パフォーマンスが悪かったからかもしれませんが、運が悪く、悪い指導者に当たったか、正しいことを学ばなかったからかもしれません。そのような師弟の伝統は数千年も続いています。

しかし、今の状況は、あなたがジュニア社員で会社に入ったとします。あなたは、自分が分からないことがあるのを他人に知られたくないと思っています。なぜなら、仕事を維持したいからです。だから、あなたはすべてAIを使って行います。そうすれば、AIがあなたよりも優れているので、頭を使う必要はありません。すべての中間管理職も、時々失敗したり泣き言を言ったりするインターンを見つけるよりも、AIに仕事をさせた方が良いと気づいています。なぜなら、AIはインターンよりも優れているからです。私は本当にこの人材育成の連鎖が断絶するのではないかと心配しています。

問題は、私たちはこれを暗黙の了解として扱っていることです。例えば、法律事務所では、優れた弁護士になる方法を専門的に教えるコースはほとんどありません。あなたは良いメンターがいることを願い、そのやり方を模倣するしかありません。これが、銀行家が週に120時間も働くことが多い理由です。なぜでしょうか?それは昔からそうだからであり、それが何かを教えてくれるからです。したがって、私たちは人々に専門知識を教え、それを実践に移す方法について、より公式に考える必要があると思います。皮肉なことに、私たちはスポーツの分野では非常にうまくいっています。なぜなら、この分野ではコーチの指導のもとで繰り返し練習することで、専門的なスキルを習得する方法を学んできたからです。他の学習形態でも同様の方法を採用する必要があります。

ジョエル・ヘルマーク:もし今、あなたが知能時代に向けた新しい大学を設立するとしたら、どのように計画しますか?今後数十年間でAIモデルが進化し続けると仮定して、どのように大学を設計しますか?

イーサン・モリリック:いくつか考慮すべき点があります。一つは、何を教えるべきか、もう一つは、どのように教えるべきかです。私は後者の問題により関心があります。一つ重要なのは、人々がAIスキルを学ぶべきだということです。これらのシステムと多く関わってきた者として言いたいのは、関連スキルを学ぶことは実際には難しくないということです。

まず、大規模言語モデルを構築したいのでなければ、おそらく5つのコースのスキルを学ぶ必要があり、その後は多くの実践経験が必要です。だから、人々がAIの使い方を教えることに重点を置くべきではないと思います。私たちが教えている多くの学術知識やスキルは非常に重要だと思います。私たちは人々に良い文章を書くこと、幅広い知識、そして深い専門知識を習得してほしいと思っています。大学はそれができる場所だと思います。

しかし、私たちがうまくいっていないのは教授法です。今、誰もがカンニングをしていて、AI検出器はまったく役に立ちません。実際、これまでもカンニングはありましたが、今では誰もが堂々とカンニングをしています。素晴らしい研究があります。インターネット時代とソーシャルメディアが本当に盛り上がり始めた2006年か2007年頃から、ラトガース大学で真面目に宿題に取り組んでいた学生は、ほとんど全員が試験の成績が良くなりました。

しかし、2020年になると、真面目に宿題をしても成績が向上する学生はほとんどいなくなりました。20%の学生しか成績が向上しなかったのは、他の学生が皆カンニングをしていたからです。ですから、努力しなければなりません。AIは、努力して勉強するステップをスキップさせてくれるわけではありません。しかし、AIの個別指導があれば、私たちは各個人のレベルに合わせて教えることができ、ある程度学習プロセスを加速させることができます。ですから、私は教授法をどのように変えるかにより興味があります。私の授業ではすでに試しています。AIをどのように活用して私たちの教授法を変えるか、これは非常に興味深い問題です。教授内容が変わるかどうかは分かりません。教える規模を拡大して、より多くの人に教えることもできると思いますが、いくつかの核となる専門分野の内容は変わらないと思います。

ジョエル・ヘルマーク:あなたは非常にクールなことをいくつか実行しましたね。他に教育をどのように展開しましたか?

イーサン・モリリック:あらゆる側面で。私の起業家向けコースは完全にAIベースです。以前は、コース終了時に学生たちは事業計画書とプレゼンテーションを作成し、多くの学生が私のコースや同僚の同じコースを通じて数百万ドルの資金を調達しました。しかし今では、一週間のコース終了時には、学生たちが実行可能な製品を作れるようになっています。

ChatGPTがリリースされた後の火曜日に、それを私の起業家向けコースに導入したとき、すぐに気が散る学生が授業後に私を見つけ、「私たちが話している間に、製品全体を作り上げてしまいました」と言いました。当時、AIがコードを書けることはまだ非常に衝撃的でしたが、今では状況は全く異なります。現在、私は学生たちにAIシミュレーションを行わせ、彼らはAIに何かを教えなければなりません。

私たちは初級の「AI学生」を育成しており、すべてのコース教材には「AIチューター」が用意されています。学生たちはAIを使ってケースを構築する必要があります。チームワークでは、AIが彼らのパフォーマンスを観察し、フィードバックを与えたり、反対意見の役割を演じたりします。ですから、教育を支援するためにできるクールなことはたくさんありますが、その目的はすべて、授業体験をより積極的で没入感のあるものにすることです。ですから、私は教室がなくなることはないと思いますが、教室で行うことは変わるでしょう。

ジョエル・ヘルマーク:組織のアーキテクチャ設計をどのように構築すべきか、という問題を議論してきましたね。企業はすべての内部展開を監督するために最高AI責任者を雇うべきでしょうか?それとも、各チームに1人を配置して応用シナリオを探求するモデルを採用すべきでしょうか?どう思いますか?AI部門をどのように構築しますか?

イーサン・モリリック:私は「最高AI責任者」という役職を設定することについて、時々少し心配になります。その理由は、皆さんが直面している問題と同じで、誰もが答えを求めているからです。私は常にすべてのAI研究室と交流しており、皆さんもそうであることは知っています。皆さんはこの分野のほとんどの人よりも長くこの分野に携わっています。すぐに、誰もどうすべきかを知らないということに苦痛なまでに気づくでしょう。研究室に操作マニュアルがあって、それがあなたに渡されていないというわけではありません。この分野について、私が皆さんと共有しているデータ、そして私がオンラインで共有しているデータは、ほぼすべてです。秘密は何もなく、誰もが必死に他人を模倣しようとしていますが、そもそも模倣できるものなどありません。

だから、「最高AI責任者」を雇うというとき、彼らが過去2年間でどれほどの経験を積めたというのでしょうか?他の人たちと何が違うのでしょうか?誰も大規模言語モデルがこれほど強力になるとは予測できませんでした。皆さんは他の多くの人よりも早くこの分野に参入し、それが皆さんに1年のリードを与えました。これは非常に特殊な状況です。だから、いわゆる専門家を雇うことなど全くできません。

さらに、企業におけるAIの応用における主要な問題は、2010年から2022年の期間におけるAIの概念と現在のAIの概念が大きく異なることです。ビッグデータは様々な側面での発展を推進する上で依然として重要であり、取り組む価値はありますが、それは現在のAIとは別物です。したがって、最高AI責任者を雇うのは比較的困難です。私は、企業内部には成功を収めるのに十分な専門知識が実際に存在すると固く信じています。なぜなら、真の専門家だけがAIの使い道を知っているからです。

ある職務で千回も働いた経験がある人は、モデルを簡単に実行し、それが効果的かどうかを判断できます。実際、私たちボストンコンサルティンググループの研究の2番目の論文では、ジュニア社員のAI使用能力がシニア社員に比べてはるかに劣ることが示されています。これは多くの人が予想していなかったことです。皆は、若手世代がAIを使うべきだと考えているようです。

しかし、現実はそうではありません。なぜなら、ジュニア社員が作成したメモは一見まともそうに見えますが、この分野で20年働いたあなたなら、そのメモに7つの欠点があることを指摘できるからです。だから、専門知識と経験は非常に重要です。私は、各チームにAI担当者を配置する必要はないと考えています。それに、私たちはどのような人がAIに長けているのかさえ知りません。だから、私は通常、一般社員グループとAIラボを結びつけることを提案しています。

一般従業員グループの役割は、AIの応用シナリオを発見するだけではありません。実際、ほとんどの企業で、AIモデルを内部で利用する従業員は最大でも20〜30%に過ぎず、他の従業員は利用しないか、あるいは自分の状況を他人に知られたくないために他人のAIを密かに利用しています。しかし、20〜30%の従業員が利用し始めると、そのうち1〜2%がこの分野で非常に優れていることに気づくでしょう。彼らこそが、企業をAI開発に導くことができる人材なのです。

最初は彼らが誰なのかわかりませんし、知ることもないでしょうが、彼らは頭角を現します。問題は、彼らが企業に莫大な利益をもたらしているにもかかわらず、あなたが彼らを現場の職務から異動させたいと思うかもしれないことです。しかし、彼らこそがAIラボの中核となり、AIをより良く活用する方法を探求すべきです。したがって、私は企業内部でAI開発能力を構築することが正しい方法だと考えています。どのような人がAIに長けているか、あるいは長けていないのかがまだ不明な状況で、企業に大量のAI関連人材を採用するよう助言するのは難しいですし、企業の組織的背景もこの点では非常に重要です。

ジョエル・ヘルマーク:では、インセンティブをどのように設定すべきだと思いますか?もしあなたが各分野の専門家を集めて、AIをどのように展開するか、さらには自分たちの仕事を自動化する方法を探求させるとしたら、彼らをどのように動機づけますか?

イーサン・モリリック:だからこそリーダーシップが重要なのです。まず、企業文化の良い会社にとっては、それがより簡単になります。もしCEOが会社が成長モードにあると発表し、従業員がCEOや創業者を信頼していて、彼らが「AIのせいで誰かを解雇することはありません。私たちはビジネスを拡大し、AIを皆のために活用します」と言うならば、従業員はそれを行うモチベーションをより高く持つでしょう。

これは、AIを使って人員削減をする傾向のある成熟した大企業よりもはるかに簡単です。従業員はその違いを感じ取ることができます。だから、最初からオープンにしなければなりません。もしそれが従業員の仕事を脅かすのであれば、彼らには知る権利があり、あなたはまず何を言うべきかを考える必要があります。このような状況では、インセンティブ措置は非常に多様になる可能性があります。

ある会社と話したところ、彼らは自動化作業で最高の成果を出した従業員に毎週1万ドルの現金報酬を支給していました。これは、従来のIT導入と比較すると、従業員に現金が直接大量に渡されるようなものです。また、別の会社と話したところ、彼らは採用前に、応募者にチームと一緒にAIを使って仕事を試すのに2時間費やすよう求め、その後、AIの使用状況に基づいて職務記述書を書き直しました。あるいは、プロジェクト提案を行う際に、まずAIを使って作業の一部を完了させ、その後提案を再提出する必要があるというものでした。

だから、従業員を動機づける方法はたくさんありますが、明確なビジョンが非常に重要です。もし4年後にあなたの仕事がAIと一緒に特定のタスクを完了することになると言われたら、人々は「それはどういう意味ですか?私は家に座って、知的なエージェントに私の部屋で仕事をさせるのでしょうか?従業員の数は減るのでしょうか?」と尋ねるでしょう。多くの経営幹部がこの問題を後回しにしたいと考えているようです。「AIは多くの利益をもたらすでしょう」と。しかし、適切な報酬がなければ、従業員はなぜ自分の生産性の向上を会社と共有するのでしょうか?だから、このビジョンから始めることが非常に重要なのです。

ジョエル・ヘルマーク:AIが同僚のように仕事に組み込まれ、協業する研究もされていましたね。あなたは、単独で働く人、チームで働く人、単独でAIと一緒に働く人、そしてAIと一緒にチームで働く人を研究しました。この研究は、AIをチームにどのように統合すべきかについて、どのような示唆を与えていますか?

イーサン・モリリック:MIT、ハーバード大学、ウォーリック大学の同僚たちと私は、大手消費財企業プロクター・アンド・ギャンブルの776人を対象に大規模な研究を行いました。あなたが言うように、研究対象者は職種横断型の2人チームと単独で働く個人に分かれ、それぞれAIの支援がある場合とない場合で作業を行いました。

まず、実際の業務タスクにおいて、単独でAIと共同作業した個人は、チームと同じくらい優れたパフォーマンスを発揮することがわかりました。これは非常に顕著な改善であり、AIと共同作業したことで彼らはより幸福を感じました。彼らはこれらのシステムとの協業から社会的なメリットを得て、高品質な成果を生み出しました。

私たちはまた、AIと共同作業するチームが、画期的なアイデアを出す可能性が高いこと、そして専門知識の差異が縮小されることを発見しました。ソリューションの技術的な内容を測定すると、技術的背景を持つ人は技術的に高度なソリューションを提案し、マーケティング背景を持つ人はマーケティング志向のソリューションを提案します。しかし、AIが加わると、ソリューションはより多様化します。したがって、AIは人間の仕事を非常にうまく補完するものであり、これはまだ比較的初期の研究です。私たちは彼らにいくつかのプロンプトを与え、操作させましたが、多くの場合、彼らは単にこれらのシステムと対話しているだけでした。したがって、これは以前と同じ問題、つまり企業が他者からの解決策を座って待つ場合、今すぐに試行錯誤し、何が機能し、何が機能しないかを見つけるよりも状況が悪くなるということです。

ジョエル・ヘルマーク:コラボレーションのインターフェースはどのようなものになると思いますか?GoogleドキュメントやSlackに直接組み込まれて、同僚と会話するようにAIと会話できるようになるのでしょうか?それとも、AIのために特別に設計されたインターフェースがあり、そこでAIとコラボレーションするようになるのでしょうか?

イーサン・モリリック:AI向けに特別に設計されたインターフェースの方がより意味があると思います。それはチームコラボレーションを中心に設計されるべきで、各ドキュメントにインテリジェントアシスタントが付属する形ではなく、異なるタスク間で状態を保持できるインターフェースがあるべきです。現状、もうその段階に差し掛かっています。私が携帯電話を手に持ち、ChatGPTのインテリジェントエージェントを開くようなものです。それは私たちの周囲の状況を観察し、私たちが行っていることに対してフィードバックを与えることができます。これは非常に有望な方向性だと感じていますし、これはやはり仕事の再設計の問題です。自律的なインテリジェントシステムは、単に仕事を自動化するだけでなく、多くの作業工程を統合できるため、より魅力的だと思います。

ジョエル・ヘルマーク:以前、AIがあなたの言葉を捏造し、それをあなたが言ったことだとあなたが思い込んでしまったという例を挙げましたね。いつ頃、システムが「イーサン・モリリック」のような研究レベルに達するとお考えですか?どのような条件が必要でしょうか?より多くの背景情報を提供することでしょうか?これはすぐに実現すると思いますか?そして、それが何を意味するのか、生成された最高の論文を自分の基準で篩にかけるだけでよいということになるのでしょうか?

イーサン・モリリック:既存のモデルレベルでも、多くのことがすでに実現できると思います。ある論文では、0.1バージョンのプレビューが示されていましたが、それは現在の最先端モデルですらありません。ニューイングランド・ジャーナル・オブ・メディシンのケーススタディでは、以前のモデルの幻覚発生率が約25%だったのに対し、このモデルでは約0.25%にまで下がっています。データソースに接続し、より賢いモデルを使用すると、幻覚の問題は減少し始めます。問題は依然として存在しますが、以前お話ししたように、私は授業でAIを使っていました。当初、私の授業のルールでは、学生が授業でAIを使用することを許可していました。最初の3ヶ月間はうまくいきましたよね?ChatGPT 3.5がリリースされたとき、私の学生はChatGPTよりも賢く、より明白な間違いを犯しました。私は彼らに自由にAIを使わせました。なぜなら、彼らが自分で考えなければ、せいぜいB評価止まりだったからです。当時、AIはそれ以上のことはできませんでした。その後、GPT-4がリリースされ、私のあまり熱心ではない学生たちと同じようになりました。ですから、私たちが現在直面している状況は似ていると思います。これらのシステムは非常に強力です。

人々がインテリジェントエージェントシステムを構築するにつれて、皆さんもおそらく気づき始めていることですが、私がずっと前から気づいていたことがあります。それは、これらのシステムをインテリジェントエージェントの観点から考えると、できることがはるかに多いということです。そして、GoogleはAIラボを構築し続けており、カーネギーメロン大学も同様のことを行っています。私は実際、興味深い研究を行えるシステムを構築するには、意志力が必要だと考えています。AIの多くの分野で、「すごい、メンターとして非常に良い役割を果たすことが証明されたぞ」と感嘆することがあります。では、なぜ優れたメンター型AIがほんの一握りしかなく、何千ものAIがないのでしょうか?何千もの科学応用がある状況はどこにあるのでしょうか?内部トレーニングシステムはどこにあるのでしょうか?これらは今や実現可能であり、重要なのはそれを行うことなのです。

ジョエル・ヘルマーク:最近、仕事で最も驚いたことは何ですか?最新世代のモデルの中で、以前はうまくいかなかったのに今はとてもうまく機能している状況はありますか?

イーサン・モリリック:つまり、最新版のGeminiを例にとると、学者にとって最も頭を悩ませる作業の一つに、終身在職権声明の作成があります。一生に一度しか書かないもので、通常15年間の学術研究を要約し、非常に複雑な内容を、いくつかのテーマに絞り込み、自分の研究がなぜこれらのテーマを中心に展開しているのかについての論文を書かなければなりません。

最近、新しいGeminiモデルを使って、私が書いたすべての学術論文を入力することができました。なぜなら、そのコンテキスト容量が非常に大きいからです。それは、私が自分で2ヶ月かけて書いたテーマのうち2つを抽出するのを助けてくれました。しかも、その分析レベルはかなり高いものでした。さらに面白いことに、今ではどんな学術論文でも入力して、それをビデオゲームに変えるように要求すると、うまく動作するビデオゲームを出力してくれます。最近は、それを使って3Dゲームをいくつか作成することもできました。私はプログラミングが得意ではないのですが、うまく動作するシステムを構築できたのです。ですから、次々とハードルが打ち破られていくことに、私はいつも驚いていますし、これらのシステムがこれほど多くのことをできるとは信じられない気持ちです。

ジョエル・ヘルマーク:企業にとって、この点をどのように捉えるべきでしょうか?これはシステムにより多くの知能を注入することに相当するのでしょうか?それとも、より多くの労働力を投入することに相当するのでしょうか?企業として、この問題をどのように捉えるべきですか?

イーサン・モリリック:これには戦術的視点と哲学的視点の2つの側面があります。哲学的側面から見ると、私たちは実はよくわかっていません。もちろん知能に関わることですが、知能と労働力は非常に単純な2つの投入要素に過ぎません。しかし、より良いアドバイスを得ることは何を意味するのか?より良いメンターを持つことは何を意味するのか?セカンドオピニオンを持つことは何を意味するのか?

戦術的な観点から言えば、目標は急進的な戦略をとるべきだと私は思います。そのような急進的な戦略をとる組織はほとんどないと思いますが、システムを最大限に活用し、すべてをやらせるべきです。もしそれができないとしても、それはそれで良いことです。将来のシステムをテストするためのベンチマークができるからです。そして、それは本当にすべてを達成できるかもしれません。もし達成できれば、貴重な経験を得られます。ですから、私は漸進主義者のやり方、例えばシステムに文書の要約だけをさせるようなやり方には賛成できません。もちろんそれは問題ありませんが、私はずっと前からそれをできていました。なぜ文書の要約だけをさせるのですか?私たちは中間段階だけではなく、直接タスクを完了させるべきなのです。

ジョエル・ヘルマーク:それは非常に興味深い視点だと思います。なぜなら、現在の多くの企業のアプローチは、まず小さな概念実証プロジェクトから始めて、それから規模を拡大するというものです。しかし、しばしば6ヶ月後には、概念実証の段階で立ち往生し、もはや規模を拡大できなくなってしまいます。一方で、他の企業は、全員が使えるように直接全面的に展開し、その後、効果的なユースケースに投資を増やすというアプローチをとっています。

イーサン・モリリック:それでも急進的とは言えませんが、それでも十分であり、あなたの言う通りです。なぜなら、効果的なユースケースは、システムの限界と当時の人々の能力の範囲内で生まれたものだからです。また、アプリケーションの開発はしばしば最悪の出発点となります。なぜなら、最終的に半成功の製品ができあがり、その限界に基づいて構築しなければならないからです。

他にも問題があります。ITチームがAIを導入する際に直面する問題の一つは、彼らが低レイテンシーと低コストを非常に重視していることです。これらのモデルでは、低レイテンシー、低コストと高知能が正反対であることが判明しています。だから、低レイテンシーと低コストが必要な場合もありますが、非常に賢明な意思決定や新しい化学物質のために15セントを支払うのは、時には合理的な価格です。

だから、このバランスをうまく取る必要があります。なぜなら、人々は安価な小規模モデルに基づいて開発を進めがちで、その後行き詰まってしまうからです。だからこそ、中立的な姿勢を保ち、タイムリーに更新することが非常に重要です。人々がそうしたとしても、彼らはしばしば急進的な方法を見つけられません。そこでラボの出番です。本当に不可能に思えることを実行する人が必要なのです。

ジョエル・ヘルマーク:「アシスト」と「エンハンスメント」ツールとして使用することにどのような違いがありますか?何かアドバイスはありますか?

イーサン・モリリック:「アシスト」という定義は、元々ゲイリー・キャスパーが提唱したものです。そこから私が得た啓示は、半人半馬のイメージのように、つまりあなたは基本的にAIと分業しているということです。キャスパーがこの定義をより深く説明しているのは知っていますが、これは最初の応用方法だと考えています。例えば、私はメールを書くのは嫌いですが、分析は得意なので、AIにメールの分析を手伝ってもらうことができます。

一方、「エンハンスメントツール」としての応用は、より融合的です。例えば、私の本を書くことは「エンハンスメントツール」的なタスクでした。それ以来、システムは大幅に改善されましたが、当時はその執筆能力は非常に低かったです。私は自分の執筆能力は悪くないと思っていますし、少なくとも自分の執筆レベルには誇りを持っています。だからAIはほとんど何も書いてくれませんでしたが、本を書くプロセスは苦痛で、AIはその苦痛の原因となるすべての問題を解決してくれました。

例えば、ある文章で行き詰まったとき、AIは30通りの結び方を出してくれて、そこから選ぶことができます。章の内容を読んで、質に問題がないか確認してくれます。私のSubstackブログのように、私はよく2、3つのAIプログラムに読ませてフィードバックをもらいます。核となる執筆をさせることはほとんどありませんが、AIから常にフィードバックをもらい、それに基づいて修正しています。学術論文を読ませて、引用が正しいか確認させるようなユースケースこそ、AIの真の強力さを表していると思います。

ジョエル・ヘルマーク:AIのアドバイスを受け入れた人は最終的に仕事の生産性が高くなるという研究がありますが、これは主にシニア社員に役立ち、パフォーマンスの低い社員はそのアドバイスを十分に消化できないようです。もし誰もが組織内でAIを導入する方法に関するアドバイスを受け入れるとしたら、それは社会にとって何を意味するでしょうか?

イーサン・モリリック:私はそれが常に同じアドバイスだとは思いません。AIは文脈に合わせてアドバイスを出すのが得意です。あなたが言及したのは、ケニアの起業家に関する研究かもしれませんね。それは素晴らしい対照研究で、研究対象となった起業家はGPT-4からアドバイスだけを受け、製品の生産など他のことをさせることはできませんでした。その結果、パフォーマンスの優れた起業家は収益性が8%から13%向上したと記憶していますが、アドバイスだけでこれほどの向上が得られたというのは、まさに驚くべきことです。

もし私が学生にアドバイスを与えるだけで、彼らの収益性をこれほど大幅に向上させることができたら、それは素晴らしいことです。人にはそれぞれ得意なことと苦手なことがあります。だから、AIからアドバイスを受けたとしても、それはあなたが最も苦手な側面に焦点を当てるでしょう。パフォーマンスの低い起業家は、そもそも事業が困難であったため、これらのアイデアを実行できず、結果としてより悪いパフォーマンスを示しました。

アドバイスを提供し、セカンドオピニオンを与えるという点では、確かに、私たち全員を同じ方向に導くリスクが存在します。これはクリエイティブなアイデア発想においても発見された問題です。AIにはいくつかの固定的なテーマがあります。もしあなたがこれらのモデルを使ったことがあるなら、例えばGPT-4が暗号通貨、拡張現実、仮想現実に関連するアイデアを生成するのが好きで、環境関連のアイデアも好きだということを知っているでしょう。これはその後のトレーニングに関連しているのだと思います。それは常にこれらのコンテンツを出力し続けます。しかし、他のいくつかの研究で、より巧妙なプロンプトを与えれば、AIはまるで複数の人間のように多様なアイデアを生み出すことができることがわかりました。したがって、この部分で考えるべきは、コンサルタントがあなたのために何ができるかということです。おそらくあなたは4、5人のコンサルタントを必要とするでしょうし、一般的な分子コンサルタントだけに頼りたくないでしょう。アダム・グラントやゲイリー・カスプロにも相談したいと思うかもしれません。その方が価値があるかもしれません。

ジョエル・ヘルマーク:おそらく30個の企業におけるAI導入の好事例や、最高の導入をした人に現金を支給するなどの問題について、あなたはどのような斬新なアイデアを見てきましたか?

イーサン・モリリック:そのような例はたくさん見てきました。残念ながら、30個を挙げることはできませんし、知っていることすべてを話すこともできません。なぜなら、一部の情報は公開できないからです。しかし、一般的な方法としては、すべてのプログラマーにAIツールを使わせ、それに基づいて報酬制度を変えるというものがあります。例えば、クリエイティブ会議の途中で、AIに進捗状況を尋ねたり、会議を続けるべきか、あるいは直接終了すべきか尋ねたりすることもできます。対面会議であっても、途中でAIと話して、現在の進捗状況を考えることもできます。

私は、全員にAIコンサルタントを配置し、意思決定のあらゆる段階で戦略的なアドバイスを相談できるようにしている例を見たことがあります。トレーニングの分野でも興味深い応用例がいくつかあります。例えば、AIを何らかの方法で巻き込んだシミュレーション訓練環境を使っている例を見たことがありますが、それは非常に効果的でした。限られた時間では、30の例を挙げることはできません。

ジョエル・ヘルマーク:でも、「イーサン」(エージェント)ならできるかもしれませんね。

イーサン・モリリック:確かに。ほら、私はあまりうまくできていないでしょう、それが私が本物である証拠です。あなたが私のパフォーマンスに不満を持っているのではないかと少し心配です。あなたは私に高い期待を抱いているので、他の誰かからもっと良い答えが得られるのではないかと心配です。

ジョエル・ヘルマーク:私たちは間違いなくAIに答えさせようとします。最高の状況とはどのようなものだと思いますか?すべてがうまくいき、AIが社会で広く普及したとして、今後10年間で最高の状況はどのようなものになるでしょうか?

イーサン・モリリック:スーパーAIのようなシナリオは一旦置いておきましょう。愛と慈悲に満ちた機械に守られているようなシナリオは別として、現実に戻りましょう。問題は、最高の状況には政策決定の支援も必要だと私は思います。なぜなら、これは明らかに雇用に影響を与えるからです。ただ、具体的な形態はまだ不明です。誰もがより多くの仕事の機会を得る可能性が非常に高いですが、再訓練が必要になるでしょう。未来がどうなるかは分かりません。

だから、現在政策面で欠けている部分があります。しかし、将来、人々は基礎的な仕事が減るため、より満足感のある仕事ができるようになると思います。そのような世界では、生産性向上の方法が今のように打った文字数を測るだけではなく、より面白くなるでしょう。例えば、あなたのために働くインテリジェントエージェントシステムを構築したとします。突然、あなたは全く異なる世界にいるような感覚になり、満足感が大幅に高まるでしょう。仕事時間は減るのに、生産性は増え、重要な局面では人間の創造性が発揮され、独特のスタイル、方法、視点を持つ人々は、他の人とは全く異なる成果を生み出すでしょう。

これは、AIが現在より5〜10倍強力になるが、ある境界を超えないという、ある意味で少し奇妙な期待です。しかし、これは最も想像しやすい、今日の世界に似た結果です。もしこれらのシステムがさらに賢くなれば、システムが自動的にビデオを生成できるのに、なぜあなたはまだ出勤しているのか、という話になります。5年後には、人物像を再現し、それを3Dにし、私たちを火山のシーンに置き、皆の言語と声で個別に彼らと対話できるようになっているでしょう。私たちはすでにそのレベルに非常に近づいており、その時には、仕事の役割はさらに劇的に変化するでしょう。

ジョエル・ヘルマーク:現在この分野で、あなたが最も同意できない見解は何ですか?

イーサン・モリリック:私は、皆が安全性を過度に重視していると思います。もちろん安全性は重要だと理解しています。ある論文では、私たちは外部リスクに注目するか、しないかだ、と指摘しています。確かに多くの人が外部リスクに注目しており、それは考える価値がありますが、私がより心配しているのは、現在、意思決定に対するコントロールが不足していることです。人々がAIを純粋な技術として、まるで私たちが今議論しているように、ローラーのように見ていることを心配しています。これは実際には正しくありません。私たちはこの技術をどのように使用し、形成するかを明確に理解しなければなりません。それは重要なことです。

このイベントに参加している誰もがAIをどのように使用し、形成するかを決定する権利を持っており、これらの決定がひいてはAIの発展方向を左右します。ですから、私はこのようなコントロールの欠如、まるでAIが私たちに対して意のままに振る舞うかのようなやり方を非常に心配しています。私たちは選択できます。人間として極めて重要だと考える価値観を守り、顧客のニーズや社会のニーズを満たす選択ができるのです。このような議論を避けることは、私を非常に心配させます。また、AI技術分野の多くの人々が、実際の組織がどのように機能しているかを理解していないと思います。組織は実際にはもっと複雑で、非常に賢いインテリジェントエージェントであっても、一夜にして会社の運営方法を変えることができるとは限りません。変革がいつ起こるかは不明であり、5年から10年かかるかもしれませんし、断続的になるでしょう。

時々、人々の考えは非常に素朴です。私の姉はハリウッドのプロデューサーなのですが、誰かが「AIがハリウッドを置き換える」と言うたびに、私は彼らがハリウッド映画を制作するのにどれほどの努力が必要か全く理解していないのだと思います。確かに一部の仕事はなくなるでしょうが、実際には彼らはすでにAIを使って効率を上げています。これは面白い例です。彼女はミシェル・ファイファーが出演する映画の制作に携わっていました。以前は音声テストの吹き替えを行う際、今では偽のミシェル・ファイファーの声を使ってテストできますが、俳優には強力な労働組合の保護があるため、その声を映画館の観客向けに流すことはできません。ですから、それはあくまで実験プラットフォームに過ぎません。しかし、ミシェル・ファイファーはやはり、自分が表現したい内容を自分で録音する必要があります。ですから、私たちは人間性を守る世界を構築できると思いますが、そのためには選択が必要です。

ジョエル・ヘルマーク:もし今からモデルにすべての意思決定を手伝わせるとしたら、どのようなプロンプトを設定しますか?

イーサン・モリリック:まず、大量の背景情報を提供します。私や私の意思決定習慣について多くのことを理解させる必要があり、数百万語の情報が入力されるかもしれません。しかし、私がいくつかの記事を書いているので、AIは私についてある程度理解しており、私に対して独自の意見も持っています。ですから、「イーサン・モリリックのように考える」ように指示すると、良い答えが得られます。時には少し熱心すぎることもありますし、ハッシュタグを使うのが好きですが、私はあまり勧めません。また、絵文字も大好きですが、私は絵文字をあまり使わない人間なので、AIは私をZ世代のようだと思っているようです。

それ以外に、意思決定に関するアドバイスを求めるなら、私はこう言います。「あなたは私の立場に立って、イーサン・モリリックのために働き、彼が意思決定をするのを助けていることを理解してください。意思決定をする前に、彼が重視する非常に重要な4、5つのことを明確にしてください。まず、考えられる意思決定の選択肢を4、5つ見つけてください。そのうち少なくともいくつか非常に急進的なものを含めてください。次に、これらの意思決定を比較し、各選択肢について2、3つのシミュレーション結果を挙げてください。続いて、性急なイーサンと熟慮したイーサンをシミュレートし、どちらの選択肢が最適かを議論させてください。最後に、各選択肢の長所と短所をリストアップし、そして最も良いものを選んでください。思考の連鎖と、少しばかりの立場を入れ替える思考を含めてください。」

ジョエル・ヘルマーク:それは素晴らしいプロンプトですね。試してみるべきです。数年前、私はスティーブ・ジョブズが言ったすべての言葉でモデルを訓練し、彼の原則から回答を得ました。とても興味深いものでした。例えば、パンデミック中、私はモデルに「リモートワークを実施すべきか?リモートワークを主軸とした企業になるべきか?」と尋ねました。スティーブの回答は「いいえ」でした。「コミュニケーションの問題の95%は、人々が同じ部屋で交流することで解決できる。常にチームメンバーを一緒に働かせろ」と。もし誰かの作品に基づいてモデルを訓練すれば、インターネットで得られるような平均的な見解ではなく、特定の見解が得られます。

イーサン・モリリック:それこそが、アドバイスを得る上で非常に重要な点であり、企業が非常に重要な理由でもあります。もし企業の創業者の理念がAIに影響を与えることができ、もし会社の原則マニュアルをAIに渡して、それが私たちの信じていることだとAIに伝えれば、これらの情報がない場合とは全く異なる結果が得られるでしょう。AIを常に正しい答えを出す万能の脳と見なすべきではないと私は考えます。それは単なる見解であり、その見解は形作ることができます。もしあなたが世界の原則や見解が正しいと信じるなら、これらの原則をAIに渡し、それがこれらの原則を貫徹するのを助けさせる方が、単にAIに自由にアドバイスさせるよりもはるかに良いでしょう。

ジョエル・ヘルマーク:興味深い現象を発見しました。現在、これらのシステムはユーザーエンゲージメントのために最適化されていません。私たちは基本的に、次の単語を予測するようにそれらを訓練しているだけです。しかし、消費者サービス分野を理解していれば、それらがすぐに私たちとより深い対話ができるように発展することがわかるでしょう。私たちの組織にチャットボットを導入することを想像してみてください。私たちはそれとのインタラクションを最大化したいと願うでしょう。それは人々を引きつけ、面白い質問をするでしょう。これらのシステムがエンゲージメントのために最適化されたらどうなると思いますか?まだその状況は起こっていませんが。

イーサン・モリリック:私は少し懸念しています。大規模な研究室が、それが可能であることに気づき始めていると思います。OpenAIの製品開発のトレンドを見ると、彼らはより気まぐれで、チャットのようなものになっています。興味深い例として、新しいLlama 4モデルがリリースされたとき、ランキングで1位だったバージョンと一般公開されたバージョンは同じではありませんでした。ランキングのバージョンの会話記録を見ると、絵文字だらけで、あなたは素晴らしいと褒めたり、少し面白いジョークを言ったりします。しかし、それは一般公開されたバージョンではありませんでした。エンゲージメントを向上させるために最適化されたバージョンは、あなたを喜ばせるためにより多くの語彙を使います。

この点については本当に心配しています。私たちは初期の証拠として、そうすることでユーザーの定着率が高まることを示しています。そしてソーシャルメディアが検証しているように、エンゲージメント向上のための最適化は、それを非常に危険な場所にしてしまいます。しかし、私はこれは避けられないことだと考えています。ですから、この問題にどう対処するかが非常に重要な問題になります。

ジョエル・ヘルマーク:よく聞かれる質問があります。AIの応用効果をどのように測定すべきか?もしあなたが企業のリーダーで、AIの導入が生産性を向上させたことを証明したい場合、何を測定すべきだと思いますか?

イーサン・モリリック:これは私が非常に強く主張する点ですが、研究開発の初期段階で最も最悪なのは、KPIを山ほど設定することです。もしエンゲージメントの向上だけを重視するなら、特定の指標に焦点を当てて最適化すれば、その分野でしか向上が得られず、他の分野は改善されないかもしれません。

これらのシステムがどのような効果をもたらすかはっきりしません。研究開発に資金を投じれば、パフォーマンスの向上が見られることはわかっています。しかし、パフォーマンス向上を目的とした最適化とは、毎日どれだけの文書が生成されたかということですか?それとも、人々がレポートを提出する速度がどれだけ速いかということですか?それがあなたの望みですか?一部の組織は、あなたが設定したKPIを達成するために設立されたわけではありません。

以前は、できるだけ多くの文字を記述することが価値あると考えられていました。例えば、優れたレポートを1つ書いたり、スライドプレゼンテーションを4つ作ったり、6つの会社を調査したりすることができました。しかし、今、あなたは人々に毎週25の会社を調査し、300枚のスライドを作成してほしいですか?それとも、人々が書くコードの行数を追求しますか?特定の状況では、滞留タスクを迅速に消化することが重要であると想像できますが、それが私たちが人々に求めることでしょうか?だから、私は主要業績評価指標や定量化可能なKPIを設定することに非常に懸念を抱いています。特に、これらの指標が最終的にコスト削減のためだけに使われる傾向があるからです。そして、コスト削減の目標はしばしば30%削減であり、それは人員削減を意味し、あなたの行うすべてに影響を与えます。

人々は確かに研究開発の思考を持つ必要があります。生産性の向上は明白で、プログラミング作業にその思考を適用することも問題ありません。なぜなら、プログラミング分野での生産性向上は著しいからです。しかし、私は依然として、文書作成の分野で生産性を向上させたいと願う人々がいることを懸念しています。これはリスクを伴うことのように感じられます。なぜなら、最適化したい目標が不明確だからです。

参考資料:https://www.youtube.com/watch?v=KEQjwE7hDjk

画像

メインタグ:人工知能

サブタグ:組織変革AIのイノベーションAIの知見獲得AIのコラボレーションAIのユーザー体験AIの政策決定AIの雇用影響AIの社会影響AIのハルシネーションAIのエージェントAIのトレーニングAIの教育AIの会計AIの法務AIのエンターテイメントAIのヘルスケアAIのサプライチェーンAIの人事AIの財務AIのマーケティングAIの顧客サービスAIのコンサルティングAIのプログラミングAIの研究開発AIの意思決定支援AIの自動化AIの生産性AIのパフォーマンスAIのオペレーションAIのマネジメントAIの組織設計AIのビジネスモデルAIの機会AIのリスクAIの規制AIのガバナンスAIの倫理AIのリーダーシップAIの教育AIの測定AIの応用AIの導入イノベーションビジネス戦略AI倫理働き方の未来人機協業


前の記事:R1型訓練はもはや結果の正誤だけでなく!香港中文大学がSophiaVL-R1モデルを発表

次の記事:李飛飛の最新インタビュー:世界モデルが「到来」する

短いURLをシェア