Fellou 2.0が大幅に向上、成功率は31%から80%に!AIが大量生産を開始

画像

Fellou ブラウザ 2.0: かつてない速さ、驚き、そして信頼性。

唯一比較できるのは、昨日の Fellou だけです。

画像

マーベル・シネマティック・ユニバースにおいて、ジャービスはアイアンマンであるトニー・スタークの個人AIアシスタントであり、ほぼどこにでも存在し、いつでもトニーをサポートし助けを提供します。ジャービスは単なる音声アシスタントではなく、トニーの生活に深く溶け込み、日常業務を管理し、ハイテク機器を制御し、さらには戦闘中にリアルタイムの戦術的アドバイスを提供します。ジャービスの存在により、トニーは信頼できるアシスタントが背後で支えていることを知っているため、より重要な事柄に集中できます。

この1ヶ月間、私たちはFellouブラウザのアーキテクチャを深く調整し、全体的な最適化を行いました。この一連の改善は、パフォーマンスと安定性を向上させただけでなく、ユーザーによりスムーズな体験をもたらしました。本日、Fellou 2.0が私たちの夢であるジャービスのような汎用エージェントへ向けて、重要な一歩を踏み出したことを誇りに思います。

私たちはFellouが単なるツールではなく、ユーザーの日常生活に溶け込むスマートなパートナーになることを願っています。私たちのビジョンは、Fellouが雲の中に漂う仮想アシスタントであるだけでなく、ユーザーの生活に不可欠な一部となり、いつでもどこでもユーザーに助けとサポートを提供することです。

この記事から、あなたは以下を学びます:

1. なぜAgentic Browserを中心に、夢のようなジャービスを構築するのか?

2. Fellou 2.0:AIによる大量生産の開始

3. Fellou 2.0の成功の鍵 — Eko 2.0、重要なオープンソースBrowseruseインフラストラクチャ

4. Fellou の今後の計画

Agentic Browserとは?

Agentic Browserは、ブラウザを媒体とする汎用インテリジェントエージェントであり、インターネットにアクセスできるだけでなく、ユーザーのニーズを理解し、複雑なタスクを自動的に分解することができます。その設計意図は、エージェントがユーザーの完全なコンテキストを保持することで、より良い結果をユーザーに提供できるようにするためであり、私たちはユーザーがネットワークやコンピューターとやり取りする方法を根本的に変えたいと考えています。

Fellouは、独自のBrowser + Workflow + Agentアーキテクチャに依存し、Agentic Browserという新しいカテゴリを確立しました。これにより、「自動運転車」のように「自動サーフィン」ができるブラウザエージェントを構築しました。

想像してみてください、タスクを完了するために複数のアプリケーション間を切り替える必要がなくなります。Fellouは、情報収集、データ分析から、最終的なタスク実行と結果の提供まで、プロセス全体を自動化できます。市場調査、レポート作成、音楽制作、3Dデザイン環境の生成、ロゴ作成など、Fellouはエンドツーエンドのソリューションを提供します。

Fellouの目標は、Fellouの存在によってユーザーが幸福を見つけることです。この幸福は、両手を解放する幸福、繰り返しの労働から解放される幸福、オフィスやコンピューターの前、高層ビルから解放される幸福です — しかし、労働をしないということではありません。人々は労働から満足感を得ます。Fellouの存在は、より多くのドーパミンが分泌されるような仕事をするためであり、精神、忍耐力、体力を消耗するような仕事はFellouに任せることができます。

画像

時間とは誰にとっても再生不可能な資源であり、人々に時間を与え、自分らしくいられる自由を与えること — これがFellouの初心です。

これが、私たちがFellouを設計開発し、Agentic Browserの方向性を堅持する最も基本的な理由です — 私たちは、AIの発展がより多くの人々の創造的ニーズを加速させ、人々の仕事の機会を減らすのではなく、人間とAIは対立関係ではなく、協力と達成の関係にあると信じています。そしてFellouは、ユーザーのローカルデバイス上のブラウザクライアントとして、ユーザーの最も多くの記憶、最も多くの好み、最もユーザーを理解し、どこにでも存在し、要求に応え、ユーザーの生活に溶け込む汎用エージェントなのです。

この期待を胸に、ユーザーにより多くのより良い結果を提供するため、Fellou 2.0へのアップグレードを完了しました。

Fellou 2.0:AIによる大量生産の開始

2.0のアップグレードの概要は以下の通りです:

1. より速く:待ち時間を短縮し、マルチタスクを並行処理し、より多くの成果を提供します。

2. より驚くべき:多様なタスクを、年中無休24時間体制で実行します。

3. より信頼性高く:多様な生産レベルのシナリオをカバーし、成功率を31%から80%に大幅に向上させます。

より速く:待ち時間を短縮し、マルチタスクを並行処理し、より多くの成果を提供します

Fellou 2.0は、大規模かつ包括的で多次元的な最適化のおかげで、速度において画期的な進歩を遂げました。Fellou 1.xバージョンと比較して、Fellouは異なるタスクの実行速度を1.2〜1.5倍向上させました。一部の汎用エージェントと比較しても、異なるタスクにおいて非常に大きな速度的優位性があります。例えば:

タスク1:エッフェル塔のある3Dマインクラフトシーンを生成する。

Fellou所要時間:1分20秒

Fellou成果物:https://chat.fellou.ai/sites/3d-minecraft-eiffel-tower-NdSWZGi_

ある汎用エージェントの所要時間:4分30秒

タスク2:「Fellouは世界初のエージェントブラウザです」をモールス信号に変換し、MP3形式で音声ファイルを生成する。

Fellou所要時間:1分30秒

Fellou成果物:

ある汎用エージェントの所要時間:2分30秒

タスク3:HTMLでスネークゲームを作成する。

Fellou所要時間:1分20秒

Fellou成果物:https://chat.fellou.ai/sites/snake-game-classic-retro-fun-aiz5HkaM

ある汎用エージェントの所要時間:6分

マーケティングタスク(クロスアプリケーション生産性ワークフロー):Reddit / Twitter / Youtube / Tiktokで過去1週間に投稿されたブラウザに関する投稿を検索し、その投稿にFellou AIを宣伝するコメントを投稿します。YouTubeではDM機能がないため無視します。ブロガー情報をウェブレポートとして整理します。

Fellouは正常に実行されました。

一部の汎用エージェントは実行に失敗し、生成されたプロモーション情報をTwitter、Linkedinなどのプラットフォームに個別に公開できず、プロモーション情報のみが生成されました。

同時に、私たちはマルチタスク並行機能も最適化し、ユーザーが同時にFellouに複数のタスクを割り当てられるようにすることで、ユーザーのマルチスレッド作業能力を大幅に向上させました。

タスクA:{@Youtube AI関連動画}に基づいてウェブサイトを作成します。ウェブサイトには、動画の主要なポイント、AIエージェントとエージェント推論をどのように説明しているか、AI開発におけるその意味と応用トレンドなど、動画の中核的な知識を要約します。ウェブサイトの最後に、これらの知識を習得したかどうかをテストするためのいくつかの質問を出題します。

タスクB:この{@Google Sheet請求書}をデータソースとして、請求書分析ウェブサイトを生成します。ウェブサイトは、さまざまな側面からカスタムフィルタリングができる必要があります。

注:並行タスクは現在もアルファ段階であり、正式版では大きく異なる可能性があります。

より驚くべき:多様なタスクを、年中無休24時間体制で実行します

多様なエージェント(ブラウザエージェント、コーディングエージェント、ファイルエージェント、シェルエージェント、コンピューター利用エージェントなど)の協調により、クロスアプリケーション生産性ワークフローに加えて、テキスト、画像、ウェブサイト、PPT、CSV、Excel、Word、MP3、動画から音声への変換、ロゴ生成、YouTube動画の要約など、多様な成果物を提供します。

音楽生成タスク:今夜はパーティーなので、周杰倫の人気曲をいくつか見つけて、その間にコード進行などを書き加えて、曲を繋ぎ合わせ、最後に完成した伴奏を返してください。ピアノバージョンで。Pink FloydやNujabesが好んで使うような実験的な音響効果も少し加えてください。

音声生成タスク:スマートホームデバイス用に一連のフィードバック音響効果を生成します。

(WeChat公式アカウントの制限により、このタスクの動画は提供できません)

画像

ロゴ生成タスク:尤渓県の建築様式、文化、イメージを検索し、ロゴを作成してください。テキストは「尤渓县城市文旅」で、朱熹のイメージ、キンカンの形、八つの山、一つの水、一分の田からなる山水風景のイメージを含みます。できれば一つの要素で3つの意味を表すものが良いです。要素は少なく、複雑なバッジのようにならないようにし、背景は白でフラットでシンプルにしてください。中国語の比率は2x、英語は1x、グラフィックは6xです。色は厳密に2色以内に抑え、ベクター、フラット、美しく、陳幼堅のデザインスタイルで10個のロゴを生成してください。そのうち1つは尤渓県の文化的背景とイメージを含み、もう1つは劉伯温故居のロゴデザインスタイルを含み、さらに1つは朱熹の顔を組み込んでください。

Fellou成果物:https://chat.fellou.ai/sites/youxi-county-urban-tourism-logo-design-bLN_gEIw

さらに、Fellou 2.0は超長文のコンテキスト管理、特にリスニングタイプのタスク(Slack、Discordの新メッセージリスニング、メールリスニング、ウェブページコンテンツ変化リスニングなど)を提供し、無限のステップ長を実現し、長いプロセスや複雑なシナリオの問題を真に解決しました。

Gmail監視タスク:私のGmailを監視し、ユーザー製品フィードバック関連のメールが届いた場合、友好的な方法で返信して感謝の意を伝えます。同時に、ユーザーメールで言及された要件とバグを分解し、{airtableのフィードバックシート}に入力します。

越境EC交渉監視タスク:SalesSmartlyを監視し、ユーザーの質問に答え、注文を完了するようユーザーを誘導します。ユーザーが価格を尋ねた場合、価格表に基づいて見積もりを提供し、ユーザーが物流時間を尋ねた場合、物流時間表に基づいて予想配送時間を提供します。ユーザーが値下げ交渉をした場合、最低価格を下回らないようにし、最低価格でユーザーと継続的にコミュニケーションを取ります。ユーザーが注文を確認したら、すぐに注文CSVファイル(商品名+商品数量+商品単価を含む)を生成します。

より信頼性高く:生産レベルの多様なシナリオをカバーし、成功率を31%から80%に大幅に向上させます

生産レベルとは、ユーザーの実際のニーズにより近く、よりエンドツーエンドで、より自動化され、「現実」に近づくことを意味します。例えば、情報入力、情報転送、ソーシャルメディア運用、採用プロセス完結、越境EC自動交渉などの多様なシナリオでの応用です。

1. 人材検索タスク:アップロードしたPDFの中から最初の5人の著者を見つけ、その全員の背景情報と連絡先情報を見つけてください。背景情報にはホームページ、Google Scholarリンク、Githubリンクを含み、連絡先情報にはメールアドレスと電話番号を含みます。彼らのGithub Repoのコミット履歴URLと.patchを結合してコミットメールを見つけたり、contact out(www.contactout.com)でメールアドレスと電話番号を見つけたりすることができます。すべてのリンクは完全なURLである必要があります。

WeChat公式アカウントの制限により、以下の事例では動画またはGIFを提供できませんが、ご参考までに:

1. マーケティングタスク:Twitter / Instagram / Youtube / Tiktokでそれぞれフォロワー数1万人以上のペットブロガーを20人探し、同時にAブランドのキャットフードのプロモーションに協力できるかDMで問い合わせます。YouTubeではDM機能がないため無視します。ブロガー情報をウェブレポートとして整理します。

2. 求職タスク:BOSS直聘で最新のフロントエンドエンジニアの求人を見つけ、その求人記述とアップロードした履歴書の内容を組み合わせて自己紹介文を作成し、「すぐに連絡」機能を使って採用担当者に自己紹介文を10回送信します。

これらのタスクは氷山の一角に過ぎず、Eko 2.0の新しいアーキテクチャから、さらに多くのタスクが発見されるのを待っています。Online-Mind2webベンチマークでは、タスクの完了率が31%から80%に向上しました。

画像

Fellou 2.0 成功の鍵 —— Eko 2.0、重要なオープンソースBrowseruseインフラストラクチャ

画像

新しいEko 2.0アーキテクチャに基づき、タスク成功率は31%から80%に向上しました(Online-Mind2webベンチマークでSOTA性能を達成)。

EkoはBrowseruseおよびComputeruseフレームワークとして位置づけられており、Eko 2.0ではマルチエージェント、DOM状態変化監視、ループタスク管理、ワークフロー計画など、多数の必須インフラ機能を提供しています。Eko 2.0をコミュニティにオープンソース化する決定は、私たちの技術的信念に深く根ざしています。この信念は、技術そのものへの愛情だけでなく、GUIエージェントの未来をより良く形作るという揺るぎない信念でもあります。

Fellouの今後の計画

簡単にまとめると:

1. Fellouは間もなくWindows版をリリースします。

2. Fellouは間もなく招待コードメカニズムを廃止します。

3. Fellouのモデルインテリジェンスは急速に向上し、より豊富な成果物を提供できるようになります。

4. Fellouはユーザーエクスペリエンスを継続的に最適化します。具体的には:

より速い速度:Agentic Workflowとブラウザパフォーマンスの両方を兼ね備えます。

より良いインタラクション:より完全な対話コンテキストの感知/理解/記憶/複数回対話、およびAI機能をより良く統合したインタラクションインターフェース。

多くのユーザーが期待する機能の補完:移行ツール、パスワードマネージャーなど。

あなたの次のステップについて:

1. Fellouをまだ使用していないユーザーは、fellou.aiにアクセスしてFellouの使用を申請できます。招待コードは継続的に発行されます。

2. Fellouの既存ユーザーへ:

今回のアップグレードアーキテクチャ更新は大規模であり、2.0以下のバージョンは利用できません。すでにインストールされているFellouを開くと、段階的に更新がプッシュされます。または、公式サイト(fellou.ai/download)から最新版を手動でダウンロードすることもできます。

現在Fellou 2.0はまだクローズドベータ段階です。ダイアログボックスで"Use Workflow: "を使用して最新の機能を有効にできます。

長時間のタスクを実行する際は、Fellouに検索を促すことをお勧めします。検索するものが多ければ多いほど、プロンプトが正確であればあるほど、より良い結果が得られます。

QRコードをスキャンしてグループに参加し、クローズドベータコードを入手してください。

画像

画像

画像

画像

メインタグ:エージェントブラウザ

サブタグ:AIエージェントブラウザ技術生産性向上自動化


前の記事:時間の本質で、人間の脳、意識、人工知能をどう測るか?

次の記事:Cursor 1.0 が登場:BugBotによるインテリジェントな修正、バックグラウンドエージェントを全面開放

短いURLをシェア