<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:media="http://search.yahoo.com/mrss/"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>2025年，Agent無疑是AI圈的熱詞。行業普遍認為：真正有用的Agent，必須學會使用手機和電腦，像人一樣操作GUI。 - 在地人新聞 LTVNews</title>
	<atom:link href="https://www.ltvnews.net/archives/tag/2025%e5%b9%b4%ef%bc%8cagent%e7%84%a1%e7%96%91%e6%98%afai%e5%9c%88%e7%9a%84%e7%86%b1%e8%a9%9e%e3%80%82%e8%a1%8c%e6%a5%ad%e6%99%ae%e9%81%8d%e8%aa%8d%e7%82%ba%ef%bc%9a%e7%9c%9f%e6%ad%a3%e6%9c%89%e7%94%a8/feed" rel="self" type="application/rss+xml" />
	<link>https://www.ltvnews.net/archives/tag/2025年，agent無疑是ai圈的熱詞。行業普遍認為：真正有用</link>
	<description>在地人新聞提供最貼近生活的影音新聞，以豐富的生活、社會、地方、旅遊、消費、藝文、專欄、綜合訊息，以最在地且多元的內容，給您滿滿訊息。</description>
	<lastBuildDate>Mon, 06 Oct 2025 10:27:00 +0000</lastBuildDate>
	<language>zh-TW</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.8.3</generator>

<image>
	<url>https://i0.wp.com/www.ltvnews.net/wp-content/uploads/2021/07/cropped-LTV-logo-544X280.png?fit=32%2C32&#038;ssl=1</url>
	<title>2025年，Agent無疑是AI圈的熱詞。行業普遍認為：真正有用的Agent，必須學會使用手機和電腦，像人一樣操作GUI。 - 在地人新聞 LTVNews</title>
	<link>https://www.ltvnews.net/archives/tag/2025年，agent無疑是ai圈的熱詞。行業普遍認為：真正有用</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">191695440</site>	<item>
		<title>全球雙榜SOTA！明略科技專有大模型 Mano開啟GUI智能操作新時代</title>
		<link>https://www.ltvnews.net/archives/162092</link>
		
		<dc:creator><![CDATA[美通社]]></dc:creator>
		<pubDate>Mon, 06 Oct 2025 10:27:00 +0000</pubDate>
				<category><![CDATA[美通社]]></category>
		<category><![CDATA[/美通社/]]></category>
		<category><![CDATA[2025年，Agent無疑是AI圈的熱詞。行業普遍認為：真正有用的Agent，必須學會使用手機和電腦，像人一樣操作GUI。]]></category>
		<category><![CDATA[北京2025年10月6日]]></category>
		<guid isPermaLink="false">https://www.ltvnews.net/archives/162092</guid>

					<description><![CDATA[<img width="400" height="350" src="https://i0.wp.com/www.ltvnews.net/wp-content/uploads/2025/10/Mano_achieved_SOTA_Foundation_E2E_GUI___Specialized_Model_Evaluation.jpg?fit=400%2C350&amp;ssl=1" class="webfeedsFeaturedVisual wp-post-image" alt="全球雙榜SOTA！明略科技專有大模型 Mano開啟GUI智能操作新時代" title="全球雙榜SOTA！明略科技專有大模型 Mano開啟GUI智能操作新時代" style="display: block; margin-bottom: 5px; clear:both;max-width: 100%;" link_thumbnail="" decoding="async" /><p>北京2025年10月6日 /美通社/ &#8212; 2025年，Agent無疑是AI圈的熱詞。行業普遍認為： [&#8230;]</p>
<p>〈<a href="https://www.ltvnews.net/archives/162092">全球雙榜SOTA！明略科技專有大模型 Mano開啟GUI智能操作新時代</a>〉這篇文章最早發佈於《<a href="https://www.ltvnews.net">在地人新聞 LTVNews</a>》。</p>
]]></description>
										<content:encoded><![CDATA[<img width="400" height="350" src="https://i0.wp.com/www.ltvnews.net/wp-content/uploads/2025/10/Mano_achieved_SOTA_Foundation_E2E_GUI___Specialized_Model_Evaluation.jpg?fit=400%2C350&amp;ssl=1" class="webfeedsFeaturedVisual wp-post-image" alt="全球雙榜SOTA！明略科技專有大模型 Mano開啟GUI智能操作新時代" title="全球雙榜SOTA！明略科技專有大模型 Mano開啟GUI智能操作新時代" style="display: block; margin-bottom: 5px; clear:both;max-width: 100%;" link_thumbnail="" decoding="async" /><div>
<p id="temp_ReleaseStart"><span class="legendSpanClass">北京</span><span class="legendSpanClass">2025年10月6日</span> <span>/美通社/ &#8212; 2025年，Agent無疑是AI圈的熱詞。行業普遍認為：真正有用的Agent，必須學會使用手機和電腦，像人一樣操作GUI。</span></p>
<p class="prntaj"><b><span>近日，中國企業級大模型與數據智能企業——明略科技推出的專有</span></b><b><span>GUI大模型 Mano在行業公認的Mind2Web和OSWorld兩大基準測試中，均取得了創紀錄的SOTA成績。</span></b><span>通過在線強化學習和訓練數據自動採集兩大核心創新，</span><span>Mano為GUI智能體領域提供了一套可擴展、可持續進化的新範式。</span></p>
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder6820">
<p style="TEXT-ALIGN: center; WIDTH: 100%"><span>Mano在OSWorld-Verified榜單的Foundation E2E GUI &amp; Specialized Model評測中取得SOTA。</span></p>
</p></div>
<p class="prntaj"><span>榜單鏈接：</span><a href="https://os-world.github.io/" target="_blank" rel="nofollow" style="color: #0000FF">https://os-world.github.io/</a><br /><span>技術報告鏈接：</span><a href="https://www.mininglamp.com/news/6394/" target="_blank" rel="nofollow" style="color: #0000FF">https://www.mininglamp.com/news/6394/</a></p>
<p class="prntaj"><b><span>關鍵突破：</span></b></p>
<p class="prntaj"><b><span>1．Mind2Web：</span></b><span>Mind2Web覆蓋137個網站、2350+真實任務，旨在考察智能體能否在複雜多變的DOM結構裡精準找到目標元素，並完成整個操作鏈。<b>Mano展示出「看得準、做得成」的核心優勢。</b></span></p>
<p class="prntaj"><span>技術報告顯示，</span><span>Mano的元素精度 (Ele.Acc）和步驟成功率（Step SR）指標遙遙領先，在準確識別、定位界面元素，以及成功執行多步任務能力上達到新高度。Mano的操作F1 (Op.F1) 指標與此前頂尖模型持平甚至略高，能夠真正將複雜任務轉化為成功的操作序列。</span></p>
<p class="prntaj"><b><span>2. OSWorld-Verified：</span></b><span>更難的挑戰來自桌面端。</span><span>OSWorld-Verified涵蓋了369個跨應用任務，覆蓋10類應用，包含瀏覽器，辦公軟件等多個類型，每一個操作都和真實桌面場景無縫對接。</span></p>
<p class="prntal"><span>技術報告顯示，在</span><span>OSWorld-Verified榜單的Foundation E2E GUI &amp; Specialized Model 評測中，<b>Mano直接把成功率提升到 41.6±0.7%，超過qwen、GUI-Owl、opencua等模型。</b></span></p>
<p class="prntaj"><b><span>技術創新：</span></b></p>
<p class="prntaj"><b><span>亮點一：首次提出「在線強化學習」</span></b></p>
<p class="prntaj"><span>自</span><span>DeepSeek橫空出世以來，GRPO已經成為強化學習黃金範式。現有的模型訓練大多局限在離線強化學習的範疇，深度依賴事先收集好的數據集。但在GUI交互智能體領域，任何操作都與真實的系統交互環境密切相關。</span></p>
<p class="prntaj"><span>因此，</span><b><span>Mano在GUI交互領域首次提出「在線強化學習」的訓練範式，並推出訓練數據自動採集的「探索器」，</span></b><span>讓智能體時刻依賴最新數據進行學習，並在「嘗試新的行動以獲取信息」和「基於已有知識採取最優行動」之間取得平衡。</span></p>
<p class="prntaj"><span>為了在真實的交互環境中不斷強化以提高適應性和靈活性，明略科技建立了一個<b>模擬環境池，</b>包括瀏覽器環境（</span><span>BUA）和桌面環境（CUA），讓模型在真實交互中採集更多樣化的環境數據，彌補了離線軌跡分佈稀疏的局限性，最終在多樣化的Web GUI場景中展現出更強的魯棒性。</span></p>
<p class="prntaj"><span>同時，採用<b>在線採樣</b></span><b><span> + 離線過濾</span></b><span>的創新方式：先收集軌跡，再過濾噪聲數據，動態調節任務難度分佈，有效避免了因失敗軌跡導致學習效率低下的問題。</span></p>
<p class="prntaj"><span>消融實驗結果顯示，加入在線強化學習後，模型在</span><span>OSWorld-Verified數據集的平均分數產生了質的飛躍，<b>相比離線強化學習的模型結果提升了</b><b> 7.9，達到 41.6。</b></span></p>
<p class="prntaj"><b><span>亮點二：智能探索，採集真實環境軌跡</span></b></p>
<p class="prntaj"><span>儘管大模型能夠理解籠統的指令，但在多步驟操作的目標驅動型任務中，往往無法將大目標分解為具體的執行步驟。因此，研發人員需要為交互任務構建專用的模型和智能體。在這一過程中，海量的高質量交互軌跡數據不可或缺。過去，這類數據往往需要人工構建或標注，成本高、耗時長。對此，<b>明略科技設計了訓練數據自動採集的方法，從根本上提升了數據收集的效率和準確性，這正是</b></span><b><span>Mano的第二大創新。</span></b></p>
<p class="prntaj"><span>明略科技搭建了一個可擴展的虛擬環境集群，用於模擬多種交互場景。針對每個目標應用，大模型自動生成目標清單，並對目標進行優先級排序，過濾掉使用頻率極低的功能，為後續探索提供明確的上下文指導。</span></p>
<p class="prntaj"><span>元素提取方面，明略科技為網頁環境定制了</span><span>Chrome插件「Mano-C」，全面提取網頁中的交互元素，捕捉其空間坐標與語義屬性。針對桌面環境，技術團隊則採用A11y Tree解析與 OmniParseV2協同過濾的方法，確保覆蓋更多交互元素。</span></p>
<p class="prntaj"><span>數據標注方面，明略科技利用大模型為每個提取的元素生成語義標籤、功能描述，以及交互類別，形成結構化的語義對齊數據，為後續訓練提供有效監督。</span></p>
<p class="prntaj"><span>為了提升數據採集的智能程度，技術團隊設計了基於</span><span>Prompt的探索模塊，用於智能選擇交互元素，並引入顯式約束，避免路徑循環和冗余分支。在探索過程中，採用深度優先搜索（DFS）策略，系統會截取截圖並保存帶註釋的交互數據。完成探索後，通過軌跡評估機制，篩選出高質量的交互序列。整個過程不斷循環，每一步都會檢查是否達到最大探索深度。</span></p>
<p class="prntaj"><b><span>Mano的SOTA表現，得益於明略科技多年來在大模型領域的積累。</span></b><span>2024年，明略科技的超圖多模態大語言模型（HMLLM）和Video-SME數據集在腦電圖、眼動等非標模態數據處理領域取得顯著突破，榮獲ACM MM 2024最佳論文提名。2025年，明略科技推出企業級商業數據分析可信智能體<b>DeepMiner</b>，Mano作為DeepMiner的自動化執行引擎，讓智能體真正學會了「看」與「點」，在複雜的軟件與瀏覽器環境下實現了精細化操作。展望未來，明略科技將進一步優化Mano在應用和端側部署能力，加速企業智能化轉型進程。</span></p>
<div class="PRN_ImbeddedAssetReference" id="DivAssetPlaceHolder0">  </div>
</div>
<p>
新聞來源：PR Newswire</p>
<p>以上新聞投稿內容由PR Newswire 美通社全權自負責任，若有涉及任何違反法令、違反本網站會員條款、有侵害第三人權益之虞，將一概由PR Newswire 美通社承擔法律及損害賠償之責任，與LTVNews在地人新聞無關。</p>
<p>〈<a href="https://www.ltvnews.net/archives/162092">全球雙榜SOTA！明略科技專有大模型 Mano開啟GUI智能操作新時代</a>〉這篇文章最早發佈於《<a href="https://www.ltvnews.net">在地人新聞 LTVNews</a>》。</p>
]]></content:encoded>
					
		
		
		<media:content url="https://www.ltvnews.net/wp-content/uploads/2025/10/Mano_achieved_SOTA_Foundation_E2E_GUI___Specialized_Model_Evaluation.jpg" medium="image"></media:content>
            <post-id xmlns="com-wordpress:feed-additions:1">162092</post-id>	</item>
	</channel>
</rss>
