5つのシナリオでManus、Flowith、Lovartを実測:20ドルでAgentの効率を100倍にできるか?

图片

Tencent Tech 『AI未来指北』特集著者 | 曉静

編集|萌萌

2025年上半期、Agentは大規模言語モデル分野で最も議論されるテーマの一つとなりました。

このAgentブームにおいて、製品はすでに2つの大きな陣営を形成しています。特定の分野に特化した垂直型Agentと、あらゆるシナリオをカバーしようとする汎用Agentです。この「Agentの究極の形は何か」という議論は時期尚早かもしれません。製品能力の真のボトルネックは、基盤モデルの能力にあります。汎用型は万能とは言えず、垂直型の深さも制限されています。

現在のユーザーの意思決定にとって、より重要なのは:Agentがワークフローに正確に組み込まれるか?提供される価値がユーザーが支払う費用に見合うか?試用期間終了後、ユーザーはその代替不可能性を自発的に認めるか?

技術的な論争はさておき、実用的な視点に戻りましょう。Tencent Techは、現在最も注目されている3つの製品、Manus、Flowith (Agent Neo)、Lovartを実際にテストし、それらの最適な使用シナリオを紹介し、読者の皆様に直接的な実用的な参考情報を提供します。

图片

要約版

3つの製品の違いを理解する

まず、これら3つのAgent製品は、その位置付けに明確な違いがあります。

ManusとFlowithはどちらも汎用Agentですが、Manusは独立して成果物を納品できる「デジタル同僚」のようなものです。ブラウザ、ターミナル、コードエディタなど一連のツールチェーンを通じて、あらゆるアイデアを直接実行し、自動的にサブタスクに分解して結果を出すことを得意とします。

一方、Flowith(Agent Neo)は「ビジュアルコラボレーション」と無限のステップをより強調しています。無限のキャンバスで一度の会話から複数の並行スレッドを開始でき、チームメンバーは素材、コメント、分岐を自由にドラッグ&ドロップできます。Oracle Modeは優先順位を動的に再配置し、数千ステップを経てウェブサイト、ミニプログラム、または3Dインタラクティブページの制作を完了します。

Lovartはデザイン分野に深く特化しており、まるで外部委託スタジオのようです。ユーザーの要求をテーマ、スタイル、素材、レイアウトの4つのパイプラインに分解し、画像-動画-音声のマルチモーダルモデルを呼び出して、ロゴ、ポスター、ショートビデオ、さらには印刷用データまで一度に生成し、レイヤーを編集可能に保ち、FigmaやPSに直接インポートしてさらに調整することも可能です。

次に、典型的なアプリケーションシナリオについてです。

Manusの「成果物生成型」能力は、市場調査レポート、財務モデル、長文の法的メモなど、完全な成果物が必要な知識作業に最適です。これらは引用やソースファイル付きで数分で完了できます。

Flowithは、膨大な情報量があり、複数人での反復作業が必要なクリエイティブなシナリオに優れています。例えば、数千ページの文献やソーシャルメディアデータを「知識ガーデン」にインポートすると、システムがリアルタイムで検索・注釈を行い、キャンバス上にノード関係を提示します。開発者は同じ平面で直接共同作業ができ、「アイデア-スケッチ-製品」を1つのインターフェース内で完結させることができます。

Lovartの重点は、高付加価値のブランドビジュアルとコンテンツマーケティングにあります。例えば、クリエイターが「植物ベースのスキンケアブランドのソーシャルメディアサイト向けプロモーション計画を作成してほしい」と一言でリクエストすると、ブランドカラー、レイアウトテンプレート、ソーシャルメディアサイズに従って、5枚のポスターと30秒のプレビュービデオがワンクリックで出力されます。

主要な情報を以下の表にまとめました。图片

图片

アプリケーションテスト

シナリオ1:シンプルなクリエイティブなシナリオでは、GPT-4oを直接使用する方が良い場合がある

このシナリオでは、シンプルなクリエイティブな場面での表示効果を比較するために、2つのプロンプトを使用しました。

LovartとManusが呼び出す基盤モデルはいずれもGPT-4oを含んでいるため、テストの完全性を期すため、GPT-4oも比較対象として使用しました。

最終的な生成効果を見ると、どれも甲乙つけがたく、スタイルも非常に似ています。しかし、画像の質感とテキストと画像の混在レイアウト効果では、LovartがManus、Flowith、GPT-4oよりも優れています。ただし、GPT-4oの生成速度は、これら3つのAgentよりも速いです。

プロンプト1:

クリーンな白い背景を持つ、シンプルでクリエイティブな広告。

本物の[ロボット]が手描きの黒いインクの落書きに溶け込んでおり、線は滑らかで遊び心に富んでいる。落書きは[AI Real]を描いている。上部に太字の黒い「[We Are Friends]」の文字を追加する。[AI]のロゴを明確に下部に配置する。視覚効果は、簡潔で、面白く、コントラストが高く、コンセプトが巧妙であること。

以下は実測結果です。图片

プロンプト2:

巨大物崇拝スタイルの画像をデザイン。比率9:16、神秘的なスタイルで、物語性があること。

以下は実測結果です。

图片

シナリオ2:絵コンテに基づいて完全な連続画を描画する:Manusのスタイルがより統一されている

3つのAgentは基盤モデルが同じであるため、生成される画像のスタイルは比較的似ています。

この中で、中国語のテキストと画像の混在レイアウト能力はLovartが最も優れており、テキストが鮮明で、全体の構図に調和して表示されます。Manusのテキストは画像の上に重なり、一部の中国語が乱れることがあります。Flowithの全体的なパフォーマンスは平均的です。基盤モデルであるGPT-4oでは中国語の表示が乱れることがあります。

スタイルの一貫性では、ManusとGPT-4oのスタイルが最も統一されており、Flowithがそれに続きます。

图片

シナリオ3:英語プロンプトによる総合クリエイティブシナリオ出力:Flowithが驚くべき追加作業を実行

今回は英語のプロンプトを使用してテストを行いました。Agentにプロンプトの要求に基づいて、ブランドプロモーション、オンライン仮想アパレル宣伝、ソーシャルメディアプロモーションを応用シナリオとした完全なデジタルバロック様式のデザインを出力するよう求めました。以下はプロンプトの原文で、コンテンツのテーマ、スタイル、色、質感、サイズが提示されています。

プロンプト:

Content:

Theme: "Digital Luxury and Future Fashion." Combines Digital Baroque and trendy fashion to showcase virtual clothing, digital models, and futuristic accessories, conveying a bold and luxurious brand identity.

Style:

A mix of Digital Baroque and modern trends with intricate 3D patterns, futuristic geometric lines, and dynamic lighting.

Color Palette:

Deep metallics (rose gold, bronze) + vibrant neon hues (electric blue, fluorescent purple, neon pink) for strong contrast.

Mood/Material:

Dreamy, surreal, with materials like digital metallic textures, holographic gradients, and glossy glass effects.

Proportion/Size:

16:9 HD horizontal, optimized for mobile screens.

Usage Scenario:

Perfect for digital fashion branding, virtual clothing promotion, and social media campaigns.

Lovartは、それぞれバロック様式の服を着たモデル、バロック様式のアクセサリー、バロック様式の背景の3枚の画像を返しました。最終インターフェースでは、画像の二次編集を選択することもできます。上部のツールバーでは、画像の拡大、背景除去、特定のアクセサリーの追加などの操作が可能です。

图片

図:Lovartの出力結果

Manusの最終的な成果物は1枚の画像とテキストの説明のみでしたが、画像の質感は良く、スタイルもデジタルバロックに合致していました。

图片

図:Manusの出力結果

今回の実測では、Flowithの出力が期待を上回りました。自由なキャンバス上でデジタルバロック様式を非常に詳細に分析し、最終的に10枚の画像、インタラクティブなウェブサイトページ、およびウェブサイトのソースコードを生成しました。

图片

図:Flowithの出力結果

图片

図:Flowithが生成したウェブサイト

シナリオ4:複合シナリオ:それぞれ特徴があり、欠けている部分もある

Agentに複合的なタスクを与え、プロンプトを通じて複雑な目標を達成させます。タスク例:創業期の飲料会社をシミュレートし、ブランドのスローガンを一句提供するだけで、情報過多を避け、Agentにプロンプトに記載されたすべての内容を一度の会話で完結させるよう求めます。

プロンプト:

役割:あなたはブランドデザインディレクターです。

目標:「銀河柚気——星空を炭酸に詰める」という一句で以下の成果物を完成させる:

1. ロゴ、3色のカラーパレット、A3縦型ポスター2枚のレイアウトを生成する。

2. ブランドスローガンアニメーションとオリジナル音楽を含む15秒の縦型オープニングビデオを制作する。

3. TikTok投稿スクリプト(3パート)と7日間の投稿スケジュールを出力する。

4. Figma/PSDソースファイルのダウンロードリンクを提供する。

Manusは圧縮ファイルパッケージを出力し、その中にはブランドロゴと配色案、A3縦型ポスター、15秒のオープニング動画、動的な表示効果のあるウェブページ(HTML5版)、TikTokマーケティングプランが含まれていました。

しかし、Figma/PSDの構造説明のみ提供され、ダウンロード可能なソースファイルやリンクはありませんでした。この要件は実際には非常に複雑です。FigmaやPhotoshopのソースファイルは、すべてのデザインステップと編集可能な要素を含む複雑な「エンジニアリングブループリント」のようなものです。一方、AIは現在、「最終的な効果図」(例えば一枚の画像)を描くことには長けていますが、このような非常に精密な構造を持つ「ブループリントファイル」を直接作成し、パッケージ化することはまだ困難です。Manusは、このブループリントをどのように設計するかを詳細に説明したため、タスクは完了したとみなせます。しかし、最終的な表示効果はまだ半完成品であり、さらなる複数回の修正が必要になる可能性があります。

图片

图片

図:Manusが出力したウェブページ効果

Lovartの納品結果は以下の図の通りです。TikTokのマーケティングプランは視覚化された図として提示され、動的に表示可能なウェブページが生成されました。同様に、ダウンロード可能なFigmaやPhotoshopのソースファイルは生成されませんでしたが、背景から主要部分まですべてをカバーする複数の画像が生成されており、上部のツールバーで二次編集したり、ダウンロードしてPSなどのソフトウェアで二次編集したりできます。動画も星空が泡に変わるダイナミックな効果を示していました。全体のプランは比較的完成度が高いです。

图片

プロモーションプランのウェブページ:

图片

Flowithの最終的な納品物もFigma/PSDソースファイルのダウンロードリンクが欠けており、最終的な視覚表現はGPT-4oの雰囲気が強く感じられました。動画生成には若干のずれがあり、飲料との関連性が示されておらず、以前のメインビジュアルのトーンやスタイルとはあまり一致しませんでした。

テキスト版の配色案:

メインカラー 宇宙の深青 #0A1F3C 深く広大な星空を象徴し、ブランドのテクノロジー感と夢のようなトーンを確立します。広範囲の背景やブランドのメインテキストに適しており、落ち着いた神秘的な視覚効果を生み出します。

アクセントカラー バブルシルバー #C0C0C0 泡の弾けるような輝きを表し、飲み物の活力と爽やかな口当たりを強調します。ロゴ内の泡、補助的なグラフィック要素、そして宇宙の深青と組み合わせて使用することで、階層感とファッション感を高めます。

装飾色 ユズイエロー #FFD700 ユズの色合いから抽出され、フレッシュで自然な果物の味を象徴し、全体の色合いに活力を注入します。ロゴ内のユズ要素、重要な情報の強調、そして深青とシルバーと組み合わせて視覚的な焦点を作り出します。

图片

圖片

図:Flowithが生成したプロモーション動画

シナリオ5:深層研究シナリオ:Lovartは不参加、FlowithとManusはそれぞれ得意分野がある

深層研究シナリオにおいて、Agentの核心的な競争力は、相互に連携する「長鎖」能力にあります。曖昧なテーマを実行可能なステップに分解し、膨大な情報の中から正確に検索・統合し、結論に検証可能な情報源を提供し、実行プロセス中に自己修正できる能力です。

これらの能力が閉ループを形成して初めて、Agentは何十分も続く、数百の操作を含む複雑な研究タスクに対応できます。したがって、強力なAgent製品は、長距離計画、超長文脈理解、強化された検索、ツール呼び出し、自己反省、信頼できるトレーサビリティという6つの主要な能力を統合し、信頼性があり拡張可能なシステムを構築する必要があります。これにより、複雑な研究シナリオでの出力が正確で効率的であるだけでなく、追跡・検証可能であることを保証します。

Lovartはデザイン能力に特化したAgentであるため、このシナリオには適していません。私たちはManusとFlowithの評価に重点を置きました。

以下は実測ケースです。

プロンプト:

Claude 4が7時間連続でコーディングできること、Flowithが超長文脈+継続的な自己生成ができることについて調査してください。この背後にある主要な技術原理は何ですか?基盤モデルにまだ文脈の制限がある中で、これはどのように実現されているのですか?大規模モデルの長距離自律性とは人類にとってどのような意味がありますか?AIエージェントの長時間作業能力は、これまでモデルやAI製品の評価指標として挙げられたことがなかったのに、なぜ今継続的に言及されるようになったのですか?arXivなどのウェブサイトをオンラインで調査し、関連論文を調べて、関連する議論があるか確認してください。ソーシャルメディアや機関メディアから、業界のKOLがどのように表現しているかを見てください。完全なレポートを出力してください:基本原理の解釈、産業の実用的な意義、現在のボトルネック、将来の発展路線に関する判断が必要です。

FlowithとManusの所要時間はどちらも約5分でした。Flowithは最終版レポート12375字と32個のノード文書を生成しました。

Manusは最終版レポート12813字と、技術的背景研究などの9つの分割テーマ文書を生成しました。

最終的に生成された詳細レポートの品質を見ると、両Agentは甲乙つけがたいです。しかし、彼らの異なる作業プロセスと作業原理は、異なるシナリオでの使用を可能にします。

FlowithとManusはどちらも「まず検索、次に推論、次に実行」を一つのパイプラインに統合できますが、その実現の重点が異なります。Flowithは「Oracle Mode + Knowledge Garden」に依存して、大量の生データを視覚的なノードに沈着させ、数千ステップの無限のチェーンで詳細な分析を完了します。

图片

図:Flowithの作業インターフェース

Manusは「ブラウザ/ターミナル/コードエディタ」の三位一体ツール編成を強調し、研究結果を直接納品可能な成果物に変えることを追求しています。

图片

図:Manusの作業インターフェース

研究資料が膨大で、複数人での共同作業と頻繁なイテレーションが必要な場合、Flowithの「知識ガーデン+視覚チェーン」の方が適しています。

迅速な成果物生成、結果がウェブサイト、スクリプト、または完成文書として確定される必要があり、データコンプライアンスのリスクが管理可能な場合、Manusのツール編成の方が手間がかかりません。

シナリオが超長文脈を要求し、かつローカルまたはプライベートクラウドでのデプロイが必要な場合、現在の両方のソリューションは不完全であり、どちらもハイブリッド自律検索フレームワークまたは専門的な研究エージェントによる補完が必要です。

图片

最後に

ユーザーはAgentにお金を払うのか?

Lovartはまだ招待コードによる無料試用段階です。Flowithは入門サブスクリプションを月額19.9ドルに設定しており、Manusは5月13日の登録開始後、基本版を月額19ドルとFlowithと同額に設定しました。現在の為替レートで換算すると、この価格帯は年間約1700人民元になります。

異なるユーザー層にとって、同じ価格は全く異なる意思決定ロジックを意味します。

一般ユーザーは軽い体験と興味駆動が主であり、特定の機能が個人の効率を顕著に向上させる場合にのみ、無料から有料への移行を検討します。

プロフェッショナルユーザー(コンテンツクリエイター、フリーランス)は、高品質な出力と安定性を必須要件としています。ツールが制作時間を節約し、納品水準を高めることができるなら、月額20ドル程度の費用は比較的受け入れやすいです。

BtoBユーザー(チーム、企業)は、セキュリティとコンプライアンス、権限管理、API/ワークフロー統合をより重視します。これらの点で製品が信頼できる限り、月額料金は支払いの障害にはなりません。

したがって、決定的な転換点は、モデル性能がさらに数パーセント向上するかどうかではなく、製品が明確な効率利益によって「好奇心からのトラフィック」を「月間リピート購入GMV」に転換できるかどうかにあります。個人や小規模チームが毎月の「コーヒー代」を「Agentによる効率化費用」に進んで支払うようになって初めて、これらのAgent製品は真に商業化の敷居を越えたと言えるでしょう。

图片

図:Manusの価格

图片

図:Flowithの価格

ima知識ベース

图片

AIエネルギーハブは、AIアプリケーションの実践に関する基本的な一般科学とチュートリアルをまとめており、世界の主要企業、トップ科学者、研究者、市場機関が発表する人工知能の基本理論、技術研究、価値整合理論、産業発展レポート、および世界のAI規制政策をカバーしています。AI初心者の方の学習を支援し、上級者の方には最新のAI知識を追跡するのに役立ちます。

おすすめ記事

圖片

Google 2025 I/Oカンファレンス:スマートグラス市場に再参入、AIで自らを革新する

圖片

マイクロソフトが一晩で50の新機能を発表、Agent連携の「エデン」を構築へ

圖片

テキストから即画像生成!混元画像2.0でAI画像生成が「ゼロ遅延」時代へ

メインタグ:AIエージェント

サブタグ:生成AIビジネスソフトウェアデザインツール生産性向上


前の記事:All-In Podcast 議事録:Geminiが「無限のコンテキスト」を牽引、AIはツールから認知コラボレーターへ昇格

次の記事:Qwenチームが長文コンテキスト推論モデルQwenLong-L1を発表、o3-miniを凌駕

短いURLをシェア