騰訊科技《AI未來指北》特約作者 |曉靜
編輯|萌萌
2025年上半年,Agent成為大模型領域討論最多的主題之一。
在這波Agent浪潮中,產品已然形成兩大陣營:專注特定領域深耕的垂直型Agent,和試圖覆蓋全場景的通用 Agent。這場"誰才是Agent 的終極形態"的爭論或許為時尚早——底層模型能力才是產品能力的真正瓶頸:通用型難稱全能,垂直型的深度也受限。
當下對用戶決策而言,更為關鍵的是:Agent能否精準地嵌入工作流程?提供的價值是否配得上用戶付出的費用?當試用期結束,用戶是否會自發認可其不可替代性?
拋開技術路線之爭,回歸實用視角。騰訊科技將實測現在最熱門的三個產品:Manus、Flowith(Agent Neo)、Lovart,展示它們的最佳使用場景,為讀者提供第一手的實用參考。
省流版
讀懂三個產品的差異
首先,這三款Agent產品從定位上有明顯差異:
雖然Manus和Flowith同為通用型Agent,但Manus更像可以獨立交付成品的“數位同事”,主打把任何想法直接穿過瀏覽器、終端、程式碼編輯器等一整套工具鏈,自動分解為子任務並跑到結果落地。
而Flowith(Agent Neo)則更強調“視覺化協作”及無限步驟:無限畫布裡一次對話可以開出多條並行執行緒,團隊成員把素材、評論和分支隨手拖曳,Oracle Mode 會動態重排優先順序、持續幾千步完成網站、小程式或 3D 互動頁面的製作。
Lovart深度垂直於設計場景,它像一支外包工作室,把用戶需求拆成主題、風格、素材、排版四段流水線,再調用圖-動-聲多模態模型,把 Logo、海報、短影片乃至印刷刀版一次性產出,並保持圖層可編輯、可直接匯入 Figma 及 PS 繼續精修。
其次,在典型的應用場景上:
Manus的“交付型”能力最適合需要完整成果物的知識工作:市場研究報告、財務模型、長篇法律備忘錄都能在十分鐘級別跑完並附帶引用和源文件。
Flowith擅長資訊量巨大且需要多人迭代的創作場景:比如我們把千頁文獻或社媒數據匯入“知識花園”,系統即時檢索、標註並在畫布上呈節點關係,開發者還能直接在同一平面協作,讓“想法-草圖-產品”在一個介面裡閉環。
Lovart的重點則在高附加值的品牌視覺與內容行銷上,比如創作者用一句話請求“為植物基護膚品牌做某社交網站的啟動宣傳方案”,它便按品牌色、排版模板、社媒尺寸一鍵輸出五張海報和 30 秒預熱影片。
我們把關鍵資訊總結到了下面的表格中:
應用實測
場景一:簡單的創意場景,不如直接用GPT-4o
在這個場景中,我們用了兩個提示詞來對比簡單的創意場景下的展示效果。
由於Lovart、Manus調用的底層模型均包含GPT-4o,所以為了測試的完整性,我們也使用了GPT-4o作為對比。
從最終的生成效果來看,大家不分伯仲,且風格十分類似。但在圖片的質感和圖文混排效果上,Lovart要優於Manus、Flowith及GPT-4o。但是GPT-4o的生成速度,要比這三個 Agent 都快。
提示詞一:
簡潔而富有創意的廣告,背景為乾淨的白色背景。
一個真實的[機器人]被融入到手繪的黑色墨水塗鴉中,線條流暢,趣味十足。塗鴉描繪了[AI Real]。在頂部添加粗體黑色“[We Are Friends]”字樣。將[AI]的標誌清晰地放置在底部。視覺效果應簡潔、有趣、對比度高,且概念巧妙。
以下為實測結果:
提示詞二:
設計一個巨物崇拜風格的圖片,比例9:16,風格神秘,並有故事感
以下為實測結果:
場景二:根據分鏡腳本繪製完整的連環畫,Manus風格更統一
三個 Agent 因為底層模型一樣,生成圖片的風格都比較類似。
其中,中文圖文混排能力Lovart的最強,文字清晰、在整個構圖中顯示和諧;Manus的文字會壓在圖片上,有一些中文錯亂;Flowith整體表現中規中矩;基礎模型GPT-4o的中文顯示會出現錯亂。
在風格統一性上,Manus和GPT-4o的風格最統一,Flowith 其次。
場景三:用英文Prompt輸出綜合創意場景:Flowith給自己瘋狂加活
這次我們用英文Prompt進行測試,要求 Agent根據提示詞的要求,輸出完整的數位巴洛克風格的設計,應用場景為品牌推廣、線上虛擬服裝宣傳以及社交媒體宣傳。以下為Prompt原文,提出了內容主題、風格、顏色、質感、尺寸。
提示詞:
Content:
Theme: "Digital Luxury and Future Fashion." Combines Digital Baroque and trendy fashion to showcase virtual clothing, digital models, and futuristic accessories, conveying a bold and luxurious brand identity.
Style:
A mix of Digital Baroque and modern trends with intricate 3D patterns, futuristic geometric lines, and dynamic lighting.
Color Palette:
Deep metallics (rose gold, bronze) + vibrant neon hues (electric blue, fluorescent purple, neon pink) for strong contrast.
Mood/Material:
Dreamy, surreal, with materials like digital metallic textures, holographic gradients, and glossy glass effects.
Proportion/Size:
16:9 HD horizontal, optimized for mobile screens.
Usage Scenario:
Perfect for digital fashion branding, virtual clothing promotion, and social media campaigns.
Lovart返回了三張圖片,分別是一張身穿巴洛克風格服飾的模特、巴洛克風格的配飾、巴洛克風格的背景。在最終的介面中,我們也可以選擇對圖片進行二次編輯。在頂部的工具列中,可以進行擴圖、消除背景、增加某些配件等操作。
圖:Lovart輸出結果
Manus的最終交付結果只有一張圖片及文字說明,但是圖片的質感不錯,風格也符合數位巴洛克。
圖:Manus輸出結果
在這次實測中,Flowith的輸出超出預期,它給自己瘋狂加活,在自由畫布中,對數位巴洛克風格進行了超級詳細的分析,最終生成了10張圖片,和一個帶有互動的網站頁面,以及網站的原始碼。
圖:Flowith輸出結果
圖:Flowith生成的網站
場景四:綜合場景:均有特色,也有缺失
給出Agent一個綜合性的任務,通過一段提示詞引導它完成複雜的目標。任務示例:模擬一家初創飲料公司,僅提供一句品牌定位口號,避免過多資訊干擾,要求Agent在一次對話中完成提示詞中列出的所有內容。
提示詞:
角色:你是品牌設計總監。
目標:用一句話“銀河柚氣——把星空裝進汽泡”完成如下交付:
1. 生成 Logo、三色配色、兩張 A3 豎版海報排版;
2. 製作 15 秒豎屏開屏影片,含品牌 Slogan 動效與原創配樂;
3. 輸出 TikTok 發佈腳本(3 段)和 7 天發佈時間表;
4. 提供 Figma/PSD 源文件下載連結。
Manus輸出了一個壓縮文件包,文件包中包括了品牌logo和配色方案、A3豎版海報、15s的開屏影片、一個有動態展示效果的網頁(HTML5版本)、TikTok行銷方案。
但是,只提供了Figma/PSD結構說明,並沒有可下載的源文件或源文件連結。這個要求其實十分複雜,Figma 和 Photoshop 的源文件就像是包含所有設計步驟和可編輯元素的複雜“工程藍圖”,而 AI 目前更擅長畫出“最終效果圖”(比如一張圖片),還很難直接創造並打包這種結構極其精密的“藍圖文件”。Manus將這個藍圖如何設計進行了詳細說明,也算是完成了任務。但是,最終的展示效果還比較半成品,可能還需要多輪修改。
圖:Manus輸出的網頁效果
Lovart交付結果如下圖所示,TikTok的行銷方案是用一張視覺化的圖呈現出來,並生成了一個可以動態展示的網頁。同樣沒有生成可以下載的Figma 和 Photoshop 的源文件,但是生成了多張圖片,從背景到主體都覆蓋,可以用頂部的工具列進行二次編輯,或者是下載下來,用PS等軟體進行二次編輯。影片也展示出了把星空裝進氣泡的動態效果。整個方案的完成度比較高。
宣傳方案網頁:
Flowith最終的交付物也是缺少了 Figma/PSD 源文件下載連結,在最終的視覺呈現上,有比較濃的GPT-4o感覺。影片生成有些偏差,沒有呈現出與飲料的關聯,和之前的主視覺色調、風格不太匹配。
文字版配色方案:
主色 宇宙深藍 #0A1F3C 象徵深邃浩瀚的星空,奠定品牌的科技感和夢幻基調。適用於大面積背景、品牌文字主色,營造沉穩、神秘的視覺效果。
輔色 氣泡銀 #C0C0C0 代表汽泡的跳躍和光澤,強調飲品的活力和清新口感。適用於Logo中的氣泡、輔助圖形元素,以及與宇宙深藍搭配使用,增加層次感和時尚感。
點綴色 柚子黃 #FFD700 提取柚子色澤,象徵清新自然的果味,為整體配色注入活力。適用於Logo中的柚子元素、重要資訊突出、以及與深藍和銀色搭配,形成視覺焦點。
圖:Flowith生成的宣傳影片
場景五:深度研究場景:Lovart缺席,Flowith和Manus各有所長
深度研究場景中,Agent的核心競爭力在於一套相互銜接的"長鏈"能力:將模糊主題分解為可執行步驟,在海量資訊中精準檢索融合,為結論提供可驗證來源,並能在執行過程中自我糾正。
只有這些能力形成閉環,Agent才能應對持續數十分鐘、涉及上百操作的複雜研究任務。因此,能力強大的Agent產品必須整合長程規劃、超長上下文理解、增強檢索、工具調用、自我反思和可信溯源六大核心能力,構建一個可靠且可擴展的系統,以確保在複雜研究場景中的輸出既準確高效,又可追溯驗證。
由於Lovart是專注於設計能力的Agent,在這個場景不適配。我們重點評測了Manus和Flowith。
以下為實測案例:
提示詞:
調研Claude 4可以連續編碼7小時,Flowith可以超長上下文+持續自製,這背後的主要技術原理是什麼?在基礎模型仍然有上下文限制的情況下,這是如何做到的?大模型的長程自自治對人類的意義是什麼?智慧體的長時間工作能力,在之前從未被作為一個評測模型或AI產品的指標,為什麼現在被持續提及。聯網調研arxiv等網站,查看相關論文,是否有相關論述?從社交媒體、機構媒體上,看行業內的Kol如何表達。輸出一個完整的報告:需要有基本原理的解讀、產業的實用意義、目前的卡點、未來的發展路線研判。
Flowith和Manus的耗時差不多都是5分鐘左右。Flowith生成了12375字的最終版報告,以及32個節點文檔。
Manus生成了最終12813個字的最終報告,以及9個拆分主題的文檔,比如技術背景研究。
從最終生成的深度報告品質來看,兩個Agent難分高下。但是,他們不同的工作過程和工作原理,可以讓我們使用到不同的場景中。
Flowith 和 Manus 都能把“先檢索、再推理、再執行”整合進一條流水線,但它們的實現側重點不同:Flowith 依賴“Oracle Mode + Knowledge Garden”把大量原始資料沉澱到視覺節點,再以幾千步的無限鏈條完成深度分析;
圖:Flowith的工作介面
Manus 強調“瀏覽器/終端/程式碼編輯器”三合一工具編排,追求把研究結果直接變成可交付成品。
圖:Manus工作介面
當研究材料海量、需要多人協作並頻繁迭代時,Flowith 的“知識花園 + 視覺鏈”更合適。
如果我們更看重快速產出、結果必須落地為網站、腳本或成品文檔,且數據合規風險可控時,Manus 的工具編排會更省心。
若場景既要求超長上下文又需本地或私有雲部署,當前兩個方案都不夠完備,都需要混合自主檢索框架或專業研究代理補位。
寫在最後
用戶願意為Agent花錢嗎?
Lovart 仍處於邀請碼免費試用階段;Flowith 將入門訂閱定在 19.9 美元/月;Manus 5 月 13 日開放註冊後,基礎版定價為19 美元/月,與 Flowith 看齊。按當前匯率折算,這一價位一年約需 1700 元人民幣。
對不同用戶群體而言,同樣的價格意味截然不同的決策邏輯:
普通用戶以輕度體驗和興趣驅動為主,只有在某項功能顯著提升個人效率時,才會考慮從免費轉向付費。
專業用戶(內容創作者、自由職業者)把高品質輸出與穩定性視為剛需,如果工具能節省製作時間、提高交付水準,則 20 美元級別的月費相對容易接受。
B 端用戶(團隊、企業)更看重安全合規、權限管理和 API/工作流集成;只要產品在這些環節可靠,月費並非付費的阻礙。
因此,決定性拐點可能不在於模型性能再提升幾個百分點,而在于產品能否憑明確的效率紅利,把“好奇心流量”轉化為“月復購 GMV”。只有當個人或小團隊心甘情願地把每月的“咖啡錢”變成“Agent 提效費”,這些 Agent 產品才算真正邁過商業化門檻。
圖:Manus價格
圖:Flowith價格
ima知識庫
AI能量站匯集AI應用實踐的基礎科普與教程,覆蓋全球熱門公司、頂尖科學家、研究員以及市場機構輸出的人工智慧的基礎理論、技術研究、價值對齊理論和產業發展報告,以及全球的AI監管政策。幫助AI小白入門,替進階選手追蹤最新的AI知識。
推薦閱讀
Google 2025 I/O大會:重回智慧眼鏡戰場,用AI革自己的命
微軟一晚上發了50個新東西,要建一個Agent互聯的“伊甸園”
打字即出圖!混元圖像2.0讓AI生圖進入“零延遲”時代