すごい!MobiAgent 登場、GPT-5 を超えるというモバイルエージェント✨

みんな、上海交通大学の IPADS ラボのチームが大きなことをやってきました!彼らは新しいモバイルエージェントツールチェーン「MobiAgent」を発表しました🎉。これは大事件で、個性化されたインテリジェントアシスタントの開発の壁を一気に打ち破り、実際のシーンでのパフォーマンスが GPT-5 や他のトップクラスのクローズドソースモデルよりも優れていると言われています👍

MobiAgent は本当にすごいです。誰もが自分だけの AI アシスタントを作る機会を得られます。このツールチェーンは、ユーザーがゼロからモバイルエージェントを構築できるようにしており、操作データの収集、モデルのトレーニング、そして携帯電話への展開まで、一連のプロセスを完了できます。そして、オープンソースです。ユーザーは独自のデータを取得し、モデルを学習させ、個人のデバイスでインテリジェントアシスタントを使うことができます。とても便利です🥰

その性能を検証するため、研究チームは国内の人気のある 20 のアプリでテストを行いました。結果は、70 億パラメータ規模の MobiAgent モデルがタスク完了スコアで多くの有名なクローズドソースの大規模モデルを上回り、同じ規模のオープンソースの GUI エージェントの中でもリードしていることを示しています👏。その独自の「潜在記憶加速器」は過去の操作を学習し、エージェントが反復的なタスクを迅速に完了できるようにし、性能を 2~3 倍向上させます。

MobiAgent の核心は、効率的なデータ収集とインテリジェントなトレーニングプロセスにあります。軽量のツールを使ってユーザーの携帯電話の操作を記録し、次に汎用的な VLM モデルを使って高品質のトレーニングデータを生成します。洗練された調整を経て、トレーニングされたエージェントは優れた汎化能力を持つようになります。その「脳」は 3 つの部分に分かれています:「計画策定者」はタスクの計画を担当し、「意思決定者」は画面に基づいて意思決定を行い、「実行者」は具体的な操作を実行します。このアーキテクチャにより、モデルの学習がより効率的になり、応答速度も大幅に向上します😎

また、革新的な AgentRR 加速フレームワークがあり、過去の操作経験を活用して反復的なタスクの実行効率を大幅に向上させることができ、アクションの再利用率は最高で 60%~85%に達することができます。インテリジェントアシスタントは日常の事務を迅速かつ正確に処理できます。

MobiAgent の登場は、個人用インテリジェントアシスタントのカスタマイズを容易にするだけでなく、モバイルエージェントエコシステムの発展を促進しています。「声でやれば手を動かさなくていい」というインテリジェントな時代が本当にやってくる気がします🤩

皆さん、MobiAgent に期待していますか?コメント欄で話し合いましょう🧐

论文地址:https://arxiv.org/pdf/2509.00531

#MobiAgent #上海交通大学 #AI アシスタント #モバイルエージェント #オープンソースツールチェーン #性能超える

Share This Article

Buy me a coffee

解説

%s へ返信する

メールアドレスが公開されることはありません。 必填项已用 标注