OpenAIの「AI in the Enterprise」レポート:企業向けAI導入における7つの主要な教訓

OpenAIは、「AI in the Enterprise」と題するレポートを発表しました。このレポートは、AIを業務に導入する方法、AIが新しい働き方をどのように再構築するか、AIが開発者の能力をどのように解放するか、およびモデルの評価とファインチューニングの方法など、非常に内容が豊富です。7社の「最前線の企業」との協力から得られた教訓が共有されています。技術的なデモンストレーションだけでなく、具体的な導入戦略も含まれています。このレポートをいち早く読み込み、重要なポイントをまとめました。

アドレス:

https://cdn.openai.com/business-guides-and-resources/ai-in-the-enterprise.pdf

OpenAIは、AIが企業に3つの主要な側面で顕著で測定可能な改善をもたらしていることを観察しています。

一つ目は、従業員のパフォーマンス向上です。従業員がより短時間でより高品質な仕事の成果を出せるようになります。

二つ目は、日常業務の自動化です。人々を反復的な作業から解放し、高価値なタスクに集中させます。

三つ目は、製品イノベーションの促進です。より関連性が高く、迅速な応答が可能な顧客体験を提供します。

ただし、AIを使うことは従来のソフトウェアやクラウドアプリケーションとは異なります。成功している企業は、AIを新しいパラダイムとして捉え、実験的なマインドセットとイテレーションの手法を取り入れています。これにより、より早く価値を実感し、ユーザーや意思決定者からの支持を得ることができます。

OpenAI自身も、イテレーション開発を採用し、迅速な展開、フィードバックの収集、モデルのパフォーマンスと安全性の継続的な改善を行っています。これは、協力企業がより早く新しい技術を利用でき、そのフィードバックがAIの将来の形に直接影響することを意味します。

7つの核心的な教訓:最前線の企業からの実践的な知見

レポートは、7つの重要な教訓をまとめており、それぞれ具体的な事例が添えられています。実用的な情報が満載です。

レッスン1:評価 (Evals) から始め、品質と安全性を確保する

核心的な考え:本番環境に投入する前に、体系的な評価プロセスを用いて、特定のシナリオにおけるAIモデルの性能を測定しなければなりません。これは単なる「テスト」ではなく、継続的な改善の基盤です。

事例:モルガン・スタンレー (Morgan Stanley)

シナリオ:金融サービス、非常に機密性が高く個別化されている。核心的な要求は、フィナンシャルアドバイザーの効率向上です。

方法:各AIアプリケーションを厳格に評価 (evals) します。具体的には、言語翻訳の正確性と品質の評価、コンテンツ要約の正確性、関連性、一貫性の評価、そしてAIの出力と人間の専門家を比較し、正確性と関連性を判断することを含みます。

効果:アドバイザーの98%が毎日OpenAIを使用;文書情報取得率が20%から80%に向上し、検索時間が大幅に短縮;アドバイザーは顧客関係の維持により多くの時間を費やすことができ、以前は数日かかっていたフォローアップが数時間で完了。

Evalsとは? これはモデルの出力を検証・テストするプロセスです。厳格なEvalsは、アプリケーションが安定して信頼性が高く、変化にも強いことを保証します。特定のタスクを中心に、ベンチマーク(正確度、コンプライアンス、安全性など)に照らしてモデル出力の品質を測定します。

レッスン2:AIを製品に組み込み、新しい体験を創造する

核心的な考え:AIを活用して膨大なデータを処理し、煩雑なタスクを自動化することで、より人間的でパーソナライズされた顧客体験を創造します。

事例:Indeed (世界最大の求人サイト)

シナリオ:求人マッチングの最適化、ユーザー体験の向上。

方法:GPT-4o miniモデルを使用し、求人を推奨するだけでなく、求職者になぜその求人が自分に適しているのかを説明することがより重要です。AIは候補者の経歴と経験を分析し、個別化された「応募の招待 (Invite to Apply)」理由を生成します。

効果:旧エンジンと比較して、新しいバージョンでは求人応募開始率が20%向上、下流の成功率(雇用主が雇用する傾向)が13%向上しました。Indeedが毎月2000万件以上のメッセージを送信し、月間アクティブユーザーが3億5000万人であることを考えると、この改善の商業的な影響は巨大です。

最適化:コストを抑え、効率を向上させるため(呼び出し量が多いため)、OpenAIはIndeedがより小さなGPTモデルをファインチューニングするのを支援し、トークン消費を60%削減しながら、同様の効果を達成しました。

レッスン3:即座に行動し、早期に投資し、複利を享受する

核心的な考え:AIはすぐに使えるソリューションではなく、その価値はイテレーションを通じて継続的に増加します。早く始めるほど、組織は「知識の複利」から多くの利益を得られます。

事例:Klarna (グローバル決済・ショッピングプラットフォーム)

シナリオ:カスタマーサービスの最適化。

方法:AIカスタマーサービスアシスタントを導入しました。継続的なテストと最適化を通じて、数ヶ月以内にAIがカスタマーチャットの3分の2を処理し、数百人の人間のオペレーターの作業量に相当し、平均解決時間が11分から2分に短縮されました。

効果:4000万ドルの利益向上が見込まれ、同時に顧客満足度は人間のカスタマーサービスと同等です。さらに重要なのは、Klarnaの従業員の90%が日常業務でAIを使用しており、全従業員がAIに慣れることが内部革新と顧客体験の継続的な最適化を加速させ、AIの利益は事業全体で「複利成長」を実現しました。

レッスン4:モデルをカスタマイズ・ファインチューニングし、特定の価値を解放する

核心的な考え:特定の業務データとニーズに合わせてモデルをカスタマイズまたはファインチューニングすることで、AIアプリケーションの価値を著しく向上させることができます。

事例:Lowe's (ホームセンター)

シナリオ:Eコマースプラットフォームでの商品検索の正確性と関連性を改善する。

課題:多数のサプライヤー、不完全または不一致な製品データ。

方法:OpenAIと協力し、モデルをファインチューニングしました。これには正確な製品説明とタグだけでなく、異なるカテゴリーにおける消費者検索行動の動的な変化を理解することも必要です。

効果:製品タグの正確性が20%向上し、エラー検出能力が60%向上しました。

ファインチューニングとは? GPTモデルが「既製服」だとすれば、ファインチューニングは「オーダーメイド」です。独自のデータ(製品カタログ、内部FAQなど)を使用してモデルを学習させ、業務用語、スタイル、シナリオをより深く理解させ、より関連性が高く、ブランドのトーンに合った結果を出力させます。これにより、手作業での編集やチェックを減らし、効率を向上させます。

レッスン5:AIを最前線の専門家の手に委ねる

核心的な考え:業務プロセスと課題を最もよく知っている人が、AIの活用方法を最もよく見つけることができます。最前線の専門家に直接AIを使わせることが、汎用的なソリューションを構築するよりも効果的です。

事例:BBVA (スペイン対外銀行)

シナリオ:世界中の12万5千人以上の従業員にAIアプリケーションを普及させる。

方法:法務、コンプライアンス、ITセキュリティチームと緊密に連携し、責任ある使用を確保した上で、世界中にChatGPT Enterpriseを導入しました。その後、従業員が自らアプリケーションシナリオを探索し、カスタマイズされたGPTs (Custom GPTs) を作成することを奨励しました。

効果:5ヶ月以内に、従業員は2900以上のカスタマイズされたGPTsを作成し、多くのプロジェクトやプロセスのタイムラインを数週間から数時間に短縮しました。アプリケーションは複数の分野に及びます:信用リスクチームはそれを使用して信用評価をより迅速かつ正確に行い、法務チームはそれを使用してポリシーやコンプライアンスに関する年間4万件の質問に回答し、カスタマーサービスチームはそれを使用してNPS調査の感情分析を自動化しました。AIの成功事例は、マーケティング、リスク管理、運営など、より多くの分野に拡大しています。

レッスン6:開発者を「解放」し、イノベーションを加速する

核心的な考え:開発者リソースは、多くの組織におけるイノベーションのボトルネックです。AIを活用して開発プラットフォーム層を構築することで、AIアプリケーションの構築を統一し加速できます。

事例:Mercado Libre (ラテンアメリカ最大のEコマース・フィンテック企業)

シナリオ:エンジニアリングチームの負担過多とイノベーションの遅延という問題を解決する。

方法:OpenAIと協力し、GPT-4oとGPT-4o miniに基づいて「Verdi」という開発プラットフォーム層を構築しました。このプラットフォームは言語モデル、Pythonノード、APIを統合し、自然言語を核心的なインタラクション方式として、1万7千人の開発者がソースコードに深く立ち入ることなく、高品質なAIアプリケーションをより迅速かつ一貫して構築できるよう支援しています。セキュリティ、ガードレール、ルーティングロジックはすべて組み込まれています。

効果:AIアプリケーション開発が著しく加速し、複数の業務に貢献しています。例えば、GPT-4o mini Visionを通じて在庫能力を100倍向上、不正検出精度をほぼ99%に向上、異なる方言に適応する製品説明のカスタマイズ、レビュー要約の自動化による注文増加、通知の個別化によるエンゲージメント向上などです。

今後:Verdiを使用して物流を最適化し、遅延配送を削減し、組織全体でより影響力の高いタスクを引き受ける計画です。

レッスン7:大胆な自動化目標を設定する

核心的な考え:多くのプロセスには大量の反復的な作業が存在し、自動化の肥沃な土地です。非効率な現状に満足せず、大胆で高い目標を設定することを恐れないでください。

事例:OpenAI自身

シナリオ:社内サポートチームは、システムへのアクセス、問題の理解、回答の作成、操作の実行に大量の時間を費やしていました。

方法:既存のワークフローとシステムの上に重ねる形で内部自動化プラットフォームを構築し、反復的な作業を自動化し、洞察と行動を加速しました。最初のユースケースはGmailの上で動作し、顧客への返信を自動的に作成し、後続の行動(顧客データやナレッジベースへのアクセス、アカウント更新、チケット作成など)をトリガーします。

効果:このプラットフォームは毎月数十万件のタスクを処理し、人間をより高価値な作業から解放しています。このシステムは他の部門にも展開されています。

最後に

これらの事例に共通するのは、オープンで実験的なマインドセット、厳格な評価、そして安全ガードレールです。成功した企業は、一夜にしてすべてのプロセスにAIを注入するのではなく、まず高リターンで敷居の低いシナリオに焦点を当て、イテレーションを通じて学習し、その経験を新しい分野に展開しています。

結果は明らかです:より迅速なプロセス、より高い正確性、よりパーソナライズされた体験、そしてより価値のある仕事です。

OpenAIはまた、新しいトレンドも観察しています。企業がAIワークフローを統合し始め、ツール、リソース、そしてエージェントを活用して、ますます複雑化するプロセスを自動化しています。レポートでは、Operatorに言及しています。これは、ウェブを自主的に閲覧し、ボタンをクリックし、フォームに入力し、システムを跨いで動作できる「仮想従業員」であり、カスタム統合やAPIなしでエンドツーエンドの自動化を実現できます。例えば、ソフトウェアテストとQAの自動化、実際のユーザーのようにインタラクションしてUIの問題をマークすること、そして技術的な指示やAPI接続なしでユーザーに代わって記録システムを更新することなどです。

OpenAIが共有したこれらの経験が、あなたに何らかのインスピレーションをもたらすことを願っています。

参考:

https://cdn.openai.com/business-guides-and-resources/ai-in-the-enterprise.pdf

いいね!お願いします👇👇

メインタグ:企業向けAI

サブタグ:AI導入製品イノベーション業務自動化従業員の生産性


前の記事:AI推論の「学ぶだけ」と「実践だけ」の課題を克服する新手法:LUFFY

次の記事:LLMエージェントのパフォーマンスが低い理由:Google DeepMindの研究が3つの失敗モードを明らかに、RLファインチューニングで緩和可能

短いURLをシェア