Fellou 2.0全面提升,成功率從31%到80%!AI開啟批次化生產

Fellou 瀏覽器 2.0: 比以往更快、更驚人、更可靠。

唯一能與之匹敵的,只有昨天的 Fellou。

圖片

在漫威電影宇宙中,賈維斯(Jarvis)是鋼鐵人東尼·史塔克(Tony Stark)的私人人工智慧助手,幾乎無所不在,隨時隨地為東尼提供支援和幫助。賈維斯不只是一個簡單的語音助手,它深入融入東尼的生活,管理他的日常事務,控制他的高科技設備,甚至在戰鬥中提供即時的戰術建議。賈維斯的存在讓東尼能夠專注於更重要的事情,因為他知道有一個可靠的助手在背後支持他。

在過去的一個月裡,我們對 Fellou 瀏覽器進行了深層次的架構調整和全面優化。這一系列的改進不僅提升了效能和穩定性,還為使用者帶來了更流暢的體驗。今天,我們非常自豪地宣布,Fellou 2.0 已經向我們夢想中的類賈維斯通用智慧代理(Jarvis-like general intelligent agent)邁出了重要的一步。

我們希望 Fellou 不只是一個工具,而是一個可以融入使用者日常生活的智慧夥伴。我們的願景是讓 Fellou 成為使用者生活中不可或缺的一部分,隨時隨地為使用者提供幫助和支援,而不只是一個飄在雲端的虛擬助手。

從這篇文章中,你將了解:

  1. 我們為什麼要以代理瀏覽器(Agentic Browser)為中心構建夢想中的賈維斯(Jarvis)?
  2. Fellou 2.0:開啟 AI 的批次化生產
  3. Fellou 2.0 獲得成功的關鍵 —— Eko 2.0,一個關鍵的開源瀏覽器使用(Browseruse)基礎設施
  4. Fellou 的下一步計畫

代理瀏覽器(Agentic Browser)的緣由?

代理瀏覽器(Agentic Browser)代表一種以瀏覽器為載體的通用智慧代理,不只能夠存取網際網路,更能理解使用者的需求,並自動拆解複雜的任務。其設計初衷是為了讓智慧代理在擁有使用者完整上下文的前提下為使用者交付更好的結果,我們希望徹底改變使用者與網路和電腦互動的方式。

Fellou 仰賴其獨特的「瀏覽器 + 工作流程 + 代理」(Browser + Workflow + Agent)架構,開創了代理瀏覽器(Agentic Browser)這一新品類,打造了一個像「自動駕駛汽車」一樣可以「自動上網」的瀏覽器智慧代理。

想像一下,你不再需要在多個應用程式之間切換來完成一項任務。Fellou 可以為你自動化整個流程,從資訊收集、資料分析,到最終的任務執行和結果交付。無論是進行市場調查、報告生成,還是製作音樂、生成 3D 設計環境、製作商標,Fellou 都能為你提供端到端的解決方案。

Fellou 的目標是讓使用者能因為 Fellou 的存在而找到幸福,這種幸福是釋放雙手的幸福,解放重複勞動的幸福,脫困於格子間、電腦前和辦公大樓的幸福 —— 但並非不勞動。人們會從勞動中獲得滿足感,Fellou 的存在是讓人們去做有更多多巴胺的工作,而那些消磨精神、耐心和體力的工作都可以留給 Fellou。

圖片

時間對於每個人來說都是不可再生資源,讓人有時間且有做自己的自由 —— 是 Fellou 的初心。

這也是我們設計開發 Fellou,以及堅持代理瀏覽器(Agentic Browser)方向的最基礎原因 —— 我們相信 AI 的發展會加速更多人的創造需求,而不是減少人們的工作機會,人類和 AI 是協作與成就的關係而非對立的關係,而 Fellou 作為一個瀏覽器客戶端,在使用者本地的裝置裡,就是那個有人們最多記憶、最多偏好、最了解使用者、無所不在、有求必應的、融入使用者生活的通用智慧代理。

我們帶著這份期許,為了給使用者交付更多更好的結果,完成了 Fellou 2.0 的升級。

Fellou 2.0:開啟 AI 的批次化生產

總結 Fellou 2.0 的升級概要如下:

  1. 更快:減少等待,多任務並行,交付更多;
  2. 更驚人:多樣任務交付,7 * 24 全天候執行;
  3. 更可靠:生產級多樣化場景覆蓋,成功率大幅提升,從 31% 到 80%;

更快:減少等待,多任務並行,交付更多

歸功於大量、全面、多維度的優化,Fellou 2.0 在速度上取得了突破性進展,相較於 Fellou 1.x 的版本,Fellou 在不同任務的執行速度上提升了 1.2 - 1.5 倍,相較於某些通用代理,我們在不同任務上皆有非常大的速度優勢,例如:

任務 1:生成一個 3D minecraft 的場景,裡面有艾菲爾鐵塔。

Fellou 耗時:1 分 20 秒

Fellou 交付物:https://chat.fellou.ai/sites/3d-minecraft-eiffel-tower-NdSWZGi_

某通用代理耗時:4 分 30 秒

任務 2:把“Fellou 是世界首個 Agentic Browser” 轉換成摩斯密碼,然後生成一個音訊,用 MP3 格式。

Fellou 耗時:1 分 30 秒

Fellou 交付物:

某通用代理耗時:2 分 30 秒

任務 3:用 HTML 做一個貪吃蛇遊戲

Fellou 耗時:1 分 20 秒

Fellou 交付物:https://chat.fellou.ai/sites/snake-game-classic-retro-fun-aiz5HkaM

某通用代理耗時:6 分鐘

行銷任務(跨應用程式生產力工作流程):搜尋 Reddit/ Twitter / Youtube / Tiktok 上近 1 個星期發布的關於瀏覽器的貼文,在貼文下發布評論推廣 Fellou AI.

Fellou 成功執行。

某些通用代理執行失敗,沒有能將生成的推廣資訊分別發布到 Twitter、Linkedin 、等平台中,只生成了推廣資訊。

同時,我們優化了多任務並行的功能,使得使用者能同時給 Fellou 下達多個任務,大大提升使用者的多執行緒工作能力:

任務 A:根據{@Youtube AI 相關影片},建立為一個網站,網站內總結這段影片的核心知識,內容包括影片的主要觀點、他是如何解釋 AI 代理和代理推理的,以及這在 AI 發展的意義和應用趨勢。網站最後需要出幾個考題,來檢驗是否習得了這些知識。

任務 B:將這個{@Google Sheet 帳單}作為資料來源, 並生成一個帳單分析網站。網站需要可以從各個維度做自訂篩選。

註:並行任務目前仍處於 Alpha 階段,在正式版本中會大不相同。

更驚人:多樣任務交付,7 * 24 全天候執行

透過提供多樣化代理(如瀏覽器代理、程式碼代理、檔案代理、終端機代理、電腦使用代理等)協作,提供除了跨應用程式生產力工作流程之外的文字、圖片、網站、PPT、CSV、Excel、Word、MP3、影片轉語音、商標生成以及總結 YouTube 影片等多樣化的交付物。

音樂交付任務:今天晚上我們要開 Party,大家想唱周杰倫的歌,所以幫我找幾首他的熱門歌曲,然後在中間寫點串聯和弦之類的,把這些歌串聯起來,最後返回串聯好的完整伴奏。需要鋼琴版。加點複雜音效,我喜歡實驗性音效比如 Pink Floyd,或者 Nujabes 喜歡用的那些。

音訊交付任務:為智慧家居裝置生成整一套回饋音效。

(因公開帳號限制原因此任務不提供影片)

圖片

商標交付任務:搜尋尤溪縣的建築風格、文化和形象,幫我製作一個商標,文字:尤溪縣城市文旅,元素包含朱熹的形象,金柑的造型,八山一水一分田的山水風光形象,最好是在一個元素中體現三種意思。元素要少,避免複雜如徽章,背景白色、扁平簡潔。中文的佔比是 2x,英文是 1x,圖形是 6x。顏色嚴格控制在 2 種顏色以內,向量,扁平,美觀,產出 10 個陳幼堅的設計風格,其中一個要有尤溪縣的文化底蘊和形象在其中,另外一個要有劉伯溫故居的商標設計風格,還有一個將朱熹的頭像融入進去。

Fellou 交付物:https://chat.fellou.ai/sites/youxi-county-urban-tourism-logo-design-bLN_gEIw

除此之外,Fellou 2.0 還提供了超長上下文管理,特別是監聽類任務(如:Slack、Discord 新訊息監聽、郵件監聽、網頁內容變化監聽)實現了無限步長,真正解決長流程和複雜場景的問題。

監控 Gmail 任務:監控我的 gmail,當有使用者產品回饋相關的郵件時,用友善的方式回覆郵件表達感謝。同時拆解使用者郵件中提到的需求和 Bug,並填入 {airtable 的回饋表} 中。

跨境電商監控議價任務:監控 SalesSmartly,回答使用者的問題,引導使用者完成下單,當使用者詢問價格的時候,按價格表給到報價,當使用者詢問物流時間的時候,根據物流時間表給到預計的配送時間,當使用者議價的時候,不能低於我們的底價,持續與使用者溝通,力求達成最低價,使用者確認訂單後立即生成一個下單的 CSV 表(包含:商品名稱 + 商品數量 + 商品單價)。

更可靠:生產級多樣化場景覆蓋,成功率大幅提升,從 31% 到 80%

生產級的意思是更加貼近使用者的實際需求,更加端到端,更加無人化,更貼近“現實”,例如:資訊填報、資訊搬運、社群媒體營運、招募流程閉環、跨境電商自動議價等多樣化場景應用。

  1. 尋人任務:找到我上傳的 PDF 裡面前五位作者,再幫我找到他們的全部背景資訊和聯絡方式,背景資訊包括個人網站、GoogleScholar 連結、Github 連結,聯絡方式包括信箱以及電話,你可以透過他們的 Github 專案提交歷史 URL 和 .patch 拼接後找出他們的提交 Email,以及在 contact out(www.contactout.com) 上找出他們的 Email 和電話,所有的連結要求是完整的 URL。

受限於公開帳號,以下案例無法提供影片或 GIF,可供參考:

  1. 行銷任務:找到 Twitter / Instragram / Youtube / Tiktok 上分別找到粉絲數量在 10k+ 的 20 個寵物部落客,同時私訊詢問她們是否可以合作推廣 A 品牌貓糧。YouTube 無法私訊忽略。將部落客資訊整理成網頁報告。
  2. 求職任務:在 BOSS 直聘上找到最新發布的前端工程師的職位,結合對應的職位描述和我上傳的履歷內容寫一段自我介紹,並透過“立即溝通”將自我介紹發送給招募者,發送 10 次。

以上任務還只是冰山一角,更多任務等待發現,這歸因於 Eko 2.0 的新架構,在 Online-mind2web 榜單中,任務完成率從 31% 提升到了 80%。

圖片

Fellou 2.0 獲得成功的關鍵 —— Eko 2.0,一個關鍵的開源瀏覽器使用(Browseruse)基礎設施

圖片

基於全新 Eko 2.0 架構,任務成功率由 31% 提升至 80%(在 Online-Mind2web 基準測試中實現 SOTA 表現)。

Eko 的定位是一個瀏覽器使用(Browseruse)和電腦使用(Computeruse)的框架,在 Eko 2.0 中,我們提供了多代理(Multi Agent)、DOM 狀態變化監聽、迴圈任務管理、工作流程規劃等多項必須的基礎建設能力,將 Eko 2.0 開源給社群的決定深深植根於我們的技術信仰,這種信仰不只是對技術本身的熱愛,更是對更好地塑造 GUI 代理未來的堅定信念。

Fellou 的下一步計畫

Fellou 正在加速變得更加聰明。

重點摘要:

  1. Fellou 很快會推出 Windows 版本;

  2. Fellou 很快會取消邀請碼機制;

  3. Fellou 的模型智慧會飛快提升,將會有更豐富的交付物;

  4. Fellou 將持續優化使用者體驗,體現在:

    • 更快的速度,代理工作流程(Agentic Workflow)和瀏覽器效能兩者兼備;
    • 更好的互動,更完整的對話上下文感知/理解/記憶/多輪對話,以及更好融合 AI 能力的互動介面;
    • 更多大家期待功能的補足,比如移轉工具、密碼管理器等;

關於你的下一步:

  1. 對於未使用過 Fellou 的使用者,可造訪 fellou.ai 申請使用 Fellou,我們會持續發放邀請碼;

  2. 對於 Fellou 的老使用者:

    • 本次升級架構更新較大,2.0 以下的版本已不可用,開啟已經安裝好的 Fellou 將會收到我們逐步推送的更新,也可以到官網(fellou.ai/download)手動下載最新版本;
    • 目前 Fellou 2.0 仍處於內測階段,對話框中可使用 "Use Workflow: " 啟用最新版能力;
    • 在執行長任務時,推薦提示 Fellou 進行搜尋,搜尋的內容越多、提示詞越精確,產出效果會越好;

歡迎掃描 QR Code 加入社群,獲取內測碼

圖片圖片圖片圖片

主標籤:智能代理瀏覽器

次標籤:人工智慧軟體升級生產力工具自動化


上一篇:萬字追問:如何用「時間的本質」,丈量人腦、意識與人工智慧?

下一篇:Cursor 1.0 重磅登場:BugBot 智慧糾錯、背景智慧代理全面開放

分享短網址