OpenAI放大招!核心API支援MCP,一夜改變智能體開發

圖片

今天凌晨,OpenAI 全資收購 io 的消息佔據了大部分頭條。同時 OpenAI 也“悄悄地”放出了另外一個重磅消息,用於開發智能體的核心 API——Responses API 支援 MCP 服務。

傳統方法,我們在開發智能體需要透過函數呼叫與外部服務交互,每次操作都涉及從大模型到後端再到外部服務的網絡傳輸,導致多次跳轉、延遲會很高,並增加擴展和管理的複雜性。

現在 Responses API 支援了 MCP,開發者無需為每個函數呼叫手動連接特定服務,而是可以將模型配置為指向一個或多個 MCP 服務。

圖片

Responses API 支援 MCP

自 OpenAI 發佈 Responses API 以來,已有數十萬開發人員透過該 API 處理了數萬億 token 資料,並開發了各種各樣的智能體應用,包括 Zencoder 的編碼智能體、Revi 用於私募股權和投資銀行的市場智能體,以及 MagicSchool AI 的教育智能體。

為了進一步簡化智能體開發,Responses API 支援了 MCP 服務,開發人員只需幾行程式碼即可將智能體連接到強大的外部工具和服務。

例如,只需要 9 行程式碼,就能將你的智能體連結到電商平台 Shopify。

在過去,我們需要編寫自訂 cart_add 或 create_payment_link 包裝器並託管自己的中繼伺服器。現在全部簡化了,一個指向輕鬆搞定。

圖片

圖片

只用了 13 行程式碼將智能體連接到雲端通訊平台 Twilio。而之前,需要在你的後端中整合兩個工具呼叫,並自行批處理最終的簡訊負載。

圖片

圖片

支援 MCP 後,還有一個好處就是可以集中管理工具,使得智能體能夠高效地呼叫外部服務。我們可以使用 allowed_tools 參數精確控制智能體能夠訪問的工具,從而避免不必要的工具呼叫、上下文膨脹以及縮短響應時間。

圖片

例如,在處理用戶查詢時,智能體可以根據預設的規則選擇最合適的工具進行呼叫,而不是盲目地嘗試所有可能的工具。

在使用 MCP 時,還可以透過精確的權限控制確保智能體的安全性。例如,可以限制智能體只能呼叫某些特定的工具,或者在呼叫工具時需要顯式批准。這種權限控制機制不僅防止了智能體濫用工具,還保護了外部服務的安全性。

透過在每次呼叫中傳遞授權金鑰和伺服器 URL,MCP 確保了身份驗證和授權的安全性,同時避免了敏感資訊在響應物件中的洩露。

此外,MCP 支援動態工具列表的導入和快取機制。當智能體首次連接到一個 MCP 伺服器時,會從伺服器導入工具列表,並將其快取到模型上下文中。在後續的呼叫中,智能體可以直接使用快取的工具列表,而無需再次從伺服器獲取,從而減少了延遲並提高了響應速度。

當然,支援 MCP 後還有很多其他好處,這裡就不列舉了,有興趣的小夥伴可以自己去嘗試一下,或者參加「AIGC 開放社群」在線下舉辦的 MCP 公開課,為大家真實演示一下。

Responses API 其他新增功能

除了支援 MCP 外,OpenAI 還對 Responses API 中的圖像生成、Code Interpreter 和文件搜尋工具進行了重大更新,進一步增強了智能體的功能。

圖像生成:開發者現在可以在 Responses API 中直接訪問 OpenAI 的最新圖像生成模型(如 <gpt-image-1>),並將其作為工具使用。該工具支援實時流傳輸,允許開發者在圖像生成過程中查看預覽,並支援多輪編輯,使開發者能夠逐步精細調整圖像。

Code Interpreter:Code Interpreter 工具現在可以在 Responses API 中使用,支援資料分析、解決複雜的數學和編碼問題,甚至幫助模型深入理解和操作圖像。例如,在處理數學問題時,模型可以利用 Code Interpreter 運行程式碼來得出答案,從而顯著提升效能。

文件搜尋:文件搜尋工具得到了增強,允許開發者根據用戶查詢將文件中的相關內容塊提取到模型的上下文中。此外,該工具還支援跨多個向量儲存執行搜尋,並允許使用陣列進行屬性過濾。

圖片

同時 OpenAI 也在 Responses API 引入了全新的功能。

背景模式:對於需要較長時間處理的任務,開發者可以使用背景模式非同步啟動這些任務,而無需擔心超時或其他連接問題。開發者可以透過輪詢這些任務來檢查是否完成,或者在需要時開始流式傳輸事件。

圖片

推論摘要:Responses API 現在可以生成模型內部思維鏈的簡潔自然語言摘要。這使得開發者更容易調試、審計和構建更好的最終用戶體驗。

加密推論項:符合零資料保留(ZDR)條件的客戶可以在 API 請求之間重複使用推論項,而無需將任何推論項儲存在 OpenAI 的伺服器上。這不僅提高了智能性,還減少了標記使用量,降低了成本和延遲。

本文素材來源 OpenAI,如有侵權請聯繫刪除

END

圖片

圖片

圖片

圖片

圖片

主標籤:人工智慧

次標籤:API開發機器學習OpenAI智能體


上一篇:一文搞懂:RAG、Agent與多模態的產業實踐與未來趨勢

下一篇:比Gemini Diffusion更全能!首個多模態擴散大語言模型MMaDA發布,同時實現強推理與高可控性

分享短網址