<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:media="http://search.yahoo.com/mrss/"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Memory - 在地人新聞 LTVNews</title>
	<atom:link href="https://www.ltvnews.net/archives/tag/memory/feed" rel="self" type="application/rss+xml" />
	<link>https://www.ltvnews.net/archives/tag/memory</link>
	<description>在地人新聞提供最貼近生活的影音新聞，以豐富的生活、社會、地方、旅遊、消費、藝文、專欄、綜合訊息，以最在地且多元的內容，給您滿滿訊息。</description>
	<lastBuildDate>Wed, 18 Mar 2026 12:05:00 +0000</lastBuildDate>
	<language>zh-TW</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.8.3</generator>

<image>
	<url>https://i0.wp.com/www.ltvnews.net/wp-content/uploads/2021/07/cropped-LTV-logo-544X280.png?fit=32%2C32&#038;ssl=1</url>
	<title>Memory - 在地人新聞 LTVNews</title>
	<link>https://www.ltvnews.net/archives/tag/memory</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">191695440</site>	<item>
		<title>基於 NVIDIA BlueField-4 STX，WEKA 以更低的每 Token 成本將 Token 輸出推至極限</title>
		<link>https://www.ltvnews.net/archives/181206</link>
		
		<dc:creator><![CDATA[美通社]]></dc:creator>
		<pubDate>Wed, 18 Mar 2026 12:05:00 +0000</pubDate>
				<category><![CDATA[美通社]]></category>
		<category><![CDATA[Grid]]></category>
		<category><![CDATA[Memory]]></category>
		<category><![CDATA[NeuralMesh 及 Augmented]]></category>
		<guid isPermaLink="false">https://www.ltvnews.net/archives/181206</guid>

					<description><![CDATA[<img width="400" height="225" src="https://i0.wp.com/www.ltvnews.net/wp-content/uploads/2026/03/WEKA_and_NVIDIA.jpg?fit=400%2C225&amp;ssl=1" class="webfeedsFeaturedVisual wp-post-image" alt="基於 NVIDIA BlueField-4 STX，WEKA 以更低的每 Token 成本將 Token 輸出推至極限" title="基於 NVIDIA BlueField-4 STX，WEKA 以更低的每 Token 成本將 Token 輸出推至極限" style="display: block; margin-bottom: 5px; clear:both;max-width: 100%;" link_thumbnail="" decoding="async" /><p>NeuralMesh 及 Augmented Memory Grid 與 NVIDIA STX 整合，能在相同 [&#8230;]</p>
<p>〈<a href="https://www.ltvnews.net/archives/181206">基於 NVIDIA BlueField-4 STX，WEKA 以更低的每 Token 成本將 Token 輸出推至極限</a>〉這篇文章最早發佈於《<a href="https://www.ltvnews.net">在地人新聞 LTVNews</a>》。</p>
]]></description>
										<content:encoded><![CDATA[<img width="400" height="225" src="https://i0.wp.com/www.ltvnews.net/wp-content/uploads/2026/03/WEKA_and_NVIDIA.jpg?fit=400%2C225&amp;ssl=1" class="webfeedsFeaturedVisual wp-post-image" alt="基於 NVIDIA BlueField-4 STX，WEKA 以更低的每 Token 成本將 Token 輸出推至極限" title="基於 NVIDIA BlueField-4 STX，WEKA 以更低的每 Token 成本將 Token 輸出推至極限" style="display: block; margin-bottom: 5px; clear:both;max-width: 100%;" link_thumbnail="" decoding="async" /><div>
<p class="prntac"><i>NeuralMesh</i> <i>及</i><i> Augmented Memory Grid </i><i>與</i><i> NVIDIA STX </i><i>整合，能在相同</i><i> GPU </i><i>佔用空間下，將</i><i> Token </i><i>產量提升</i><i> 6.5 </i><i>倍，大減</i><i> AI </i><i>驅動機構的推理成本</i></p>
<p><span class="legendSpanClass">加州聖荷西和加州坎貝爾</span><span class="legendSpanClass">2026年3月18日</span> /美通社/ &#8212; 在 2026 年圖形處理器 (GPU) 技術大會 (GTC 2026) 上，人工智能 (AI) 儲存與記憶體系統公司    <br />   <span>WEKA 與 NVIDIA 合作實現具成本效益的大規模人工智能 (AI) 推論。</span>  </div>
<p><b>利用共享鍵</b><b>值</b><b> (KV) </b><b>緩存基礎設施解決推理成本問題</b><br />擴展代理型系統，尤其在軟件工程應用領域，揭示一個殘酷真相：現今 AI 的經濟效益取決於記憶體基礎設施層。 每個大規模推理集群都會撞上記憶體牆：GPU 上有限的高頻寬記憶體 (HBM) 很快便耗盡，導致 KV 快取被逐出、情境丟失，系統被迫重複已經完成的工作。 這種架構效率低下，令推理成本急升。 解決之道在於建立共享的 KV 快取基礎設施，讓情境在代理、用戶與會話之間保持活躍。 這樣能消除重複計算、維持 Token 吞吐量，並保持效能穩定可測。 缺乏共享 KV 快取基礎設施的話，每增加一批並發用戶及代理，都會成為負累——成本上漲、體驗變差，推理集群規模越大，營運就越難。 NVIDIA 推出專為語境記憶而設的 STX，提供一套藍圖，旨在破解核心推理瓶頸。</p>
<p><b>上下文記憶體儲存：代理型</b><b> AI </b><b>工廠的基礎<br /></b>透過基於 NVIDIA STX 架構聯合設計的 WEKA 解決方案，AI 雲端、企業及 AI 模型構建者，均可部署所需基建，讓 GPU 以頂尖效能運行，維持海量 Token 生成，同時提升大規模推理的能源效益及成本效益。</p>
<p>領先在前的 AI 創新者及雲端供應商，例如 <a href="https://edge.prnewswire.com/c/link/?t=0&amp;l=zh-hant&amp;o=4641359-1&amp;h=4126411074&amp;u=https%3A%2F%2Fedge.prnewswire.com%2Fc%2Flink%2F%3Ft%3D0%26l%3Den%26o%3D4641359-1%26h%3D1759237850%26u%3Dhttps%253A%252F%252Ffirmus.co%252F%26a%3DFirmus&amp;a=Firmus" target="_blank" rel="nofollow" style="color: #0000FF">Firmus</a>，已開始應用 NeuralMesh 上的 Augmented Memory Grid，重塑其推理經濟模式。</p>
<p>Firmus 技術總監 Daniel Kearney 表示：「現實世界的 AI 並非在實驗室運行，而是要面對電力限制、散熱限制，以及源源不絕的工作負載需求。 Firmus 正是為此而生。 與 NVIDIA AI 基礎設施雙劍合璧之下，WEKA Augmented Memory Grid 可於大規模運行時，實現每秒 Token 數提升 6.5 倍，首個 Token 生成時間 (TTFT) 加快 4 倍，證明在相同 GPU 配置下，效能可提升至更高層次。 隨著 NeuralMesh 和 Augmented Memory Grid 整合到我們與 NVIDIA 一致的 AI Factory 和 NVIDIA STX 參考架構中，就能提供最快的情境記憶體網絡，實現可預測且高效的大規模推理。」</p>
<p><b>NeuralMesh</b> <b>與</b><b> NVIDIA STX：專為代理型 AI </b><b>而設</b><br />NeuralMesh 是 WEKA 建基於超過 170 項專利的智能自適應儲存系統。 這將貫穿全棧 STX 參考架構，為企業提供所需的新一代儲存方案，旨在將高性能 AI 數據服務標準化，從而加快實現代理型 AI 的價值。 WEKA 的 Augmented Memory Grid 是專為擴展記憶體而設的技術層，能於 GPU 記憶體以外，將 KV 快取整合成池並持久保存。即使推理工作負載不斷增加，長情境會話依然穩定，並發量亦能維持高水平。 Augmented Memory Grid 於 GTC 2025 首次亮相，今日起正式向 NeuralMesh 客戶全面供應。該技術已在 Supermicro 平台上，搭配 <a href="https://edge.prnewswire.com/c/link/?t=0&amp;l=zh-hant&amp;o=4641359-1&amp;h=73383535&amp;u=https%3A%2F%2Fedge.prnewswire.com%2Fc%2Flink%2F%3Ft%3D0%26l%3Den%26o%3D4641359-1%26h%3D888123797%26u%3Dhttps%253A%252F%252Fwww.nvidia.com%252Fen-us%252Fdata-center%252Fgrace-cpu-superchip%252F%26a%3DNVIDIA%2BGrace&amp;a=NVIDIA+Grace" target="_blank" rel="nofollow" style="color: #0000FF">NVIDIA Grace</a> 中央處理器 (CPU) 及 BlueField-3 數據處理單元 (DPU) 完成驗證，能帶來多項提升 AI 成本效益的優勢，包括：</p>
<ul type="disc">
<li><b>用</b><b>戶體驗，大幅躍升：</b>NeuralMesh 上的 Augmented Memory Grid 能將首個 Token 生成時間大幅縮短 4 至 20 倍，確保 AI 代理及應用程式在真實負載下依然反應迅速。</li>
<li><b>相同硬件，收益更高：</b>毋須增建基礎設施，每個 GPU 就能多處理 6.5 倍的 Token。</li>
<li><b>規模擴張，效能恒久：</b>隨著會話、代理及情境窗口增加，Augmented Memory Grid 依然能維持高 KV 快取命中率，避免純 DRAM 架構出現效能急跌的瓶頸。</li>
<li><b>GPU </b><b>原生效率：</b>整合 BlueField-4 能將儲存數據路徑從 CPU 卸載，讓 GPU 全速運算，並消除輸入/輸出 (I/O) 瓶頸從此絕跡。</li>
</ul>
<p>WEKA 聯合創始人兼行政總裁 Liran Zvibel 表示：「隨著編碼大型語言模型 (LLM) 不斷進步，軟件工程領域對代理型 AI 應用的採納程度可謂前所未見，生產力因此提升了 100 到 1000 倍。 當編碼助手反覆調用近乎相同的代碼庫及提示時，WEKA 的 Augmented Memory Grid 會重複使用已快取的語境，即使語境窗口長度已發展至難以置信，亦不用強制進行冗餘的預填充。 此舉大幅縮短回應時間，亦讓同一基礎設施上支援的並發用戶數目顯著增加。 WEKA 在一年多前便率先洞悉市場對情境記憶儲存的需求，並於 GTC 2025 推出 Augmented Memory Grid。 如今，NVIDIA STX 的出現，為企業打開大門，讓其能在最先進的 NVIDIA Vera Rubin 架構（包括 NVIDIA BlueField-4 及 NVIDIA Spectrum-X 以太網絡）上，運行儲存及記憶體擴展基礎設施。 為 NVIDIA STX 在 NeuralMesh 上運行 Augmented Memory Grid，將帶來無與倫比的效能及效率，直接實現顛覆市場的 AI 成本效益。」</p>
<p><b>供應情況</b></p>
<p>WEKA 的 Augmented Memory Grid 現已隨 NeuralMesh 一併正式推出市場。</p>
<p>今天對記憶體高牆視而不見的企業，日後將會面對更艱難、更昂貴的擴展挑戰。 隨著代理型工作負載增加，情境窗口不斷擴大，純 DRAM 架構將面對成本持續疊加的問題：每新增一個並發用戶或會話，重算開銷、GPU 閒置時間及營運成本便隨之上升。 現在就為持久 KV 快取規劃架構的企業，將比那些等待觀望的對手取得結構性成本及效能優勢。</p>
<p>如欲進一步了解 NeuralMesh，請瀏覽：<a href="https://edge.prnewswire.com/c/link/?t=0&amp;l=zh-hant&amp;o=4641359-1&amp;h=452447944&amp;u=https%3A%2F%2Fedge.prnewswire.com%2Fc%2Flink%2F%3Ft%3D0%26l%3Den%26o%3D4641359-1%26h%3D2989255427%26u%3Dhttps%253A%252F%252Fwww.weka.io%252Fneuralmesh%252F%26a%3Dweka.io%252FNeuralMesh&amp;a=weka.io%2FNeuralMesh" target="_blank" rel="nofollow" style="color: #0000FF">weka.io/NeuralMesh</a>。<br />如欲進一步了解 Augmented Memory Grid，請瀏覽：<a href="https://edge.prnewswire.com/c/link/?t=0&amp;l=zh-hant&amp;o=4641359-1&amp;h=2810676172&amp;u=https%3A%2F%2Fedge.prnewswire.com%2Fc%2Flink%2F%3Ft%3D0%26l%3Den%26o%3D4641359-1%26h%3D2530118059%26u%3Dhttps%253A%252F%252Fwww.weka.io%252Faugmented-memory-grid%252F%26a%3Dweka.io%252Faugmented-memory-grid&amp;a=weka.io%2Faugmented-memory-grid" target="_blank" rel="nofollow" style="color: #0000FF">weka.io/augmented-memory-grid</a>。</p>
<p>企業可瀏覽 <a href="https://edge.prnewswire.com/c/link/?t=0&amp;l=zh-hant&amp;o=4641359-1&amp;h=2278231883&amp;u=https%3A%2F%2Fedge.prnewswire.com%2Fc%2Flink%2F%3Ft%3D0%26l%3Den%26o%3D4641359-1%26h%3D2995353283%26u%3Dhttps%253A%252F%252Fwww.weka.io%252Fnvidia%26a%3Dweka.io%252Fnvidia&amp;a=weka.io%2Fnvidia" target="_blank" rel="nofollow" style="color: #0000FF">weka.io/nvidia</a> 獲取更多資訊，或親臨 GTC 2026 大會 WEKA 的 #1034 展位參觀。</p>
<p><b>關於</b><b> WEKA</b><br />WEKA 正憑藉其自適應智能網格儲存系統 NeuralMesh™ by WEKA®，徹底革新機構建立、運行和擴展 AI 工作流程的模式。 有別於傳統數據基礎設施會隨著工作負載擴展而變得緩慢不穩，NeuralMesh 在擴容時反而會變得更快速、更穩健、更高效。它能動態適應 AI 環境，為企業 AI 及代理型 AI 的創新，提供靈活穩固的基石。 NeuralMesh 備受財富 50 強中 30% 企業的信賴，致力協助頂尖企業、AI 雲端供應商及 AI 建構者，充分發揮 GPU 效能、加快 AI 擴展步伐，並降低創新成本。 在 <a href="https://edge.prnewswire.com/c/link/?t=0&amp;l=zh-hant&amp;o=4641359-1&amp;h=635248974&amp;u=https%3A%2F%2Fedge.prnewswire.com%2Fc%2Flink%2F%3Ft%3D0%26l%3Den%26o%3D4641359-1%26h%3D1913752326%26u%3Dhttps%253A%252F%252Fwww.weka.io%252F%26a%3Dwww.weka.io&amp;a=www.weka.io" target="_blank" rel="nofollow" style="color: #0000FF">www.weka.io</a> 了解更多，或在 <a href="https://edge.prnewswire.com/c/link/?t=0&amp;l=zh-hant&amp;o=4641359-1&amp;h=3230066868&amp;u=https%3A%2F%2Fedge.prnewswire.com%2Fc%2Flink%2F%3Ft%3D0%26l%3Den%26o%3D4641359-1%26h%3D2818042447%26u%3Dhttps%253A%252F%252Fwww.linkedin.com%252Fcompany%252Fweka-io%26a%3DLinkedIn&amp;a=LinkedIn" target="_blank" rel="nofollow" style="color: #0000FF">LinkedIn</a> 及 <a href="https://edge.prnewswire.com/c/link/?t=0&amp;l=zh-hant&amp;o=4641359-1&amp;h=3755762631&amp;u=https%3A%2F%2Fedge.prnewswire.com%2Fc%2Flink%2F%3Ft%3D0%26l%3Den%26o%3D4641359-1%26h%3D3826677041%26u%3Dhttps%253A%252F%252Fx.com%252FWEKA%26a%3DX&amp;a=X" target="_blank" rel="nofollow" style="color: #0000FF">X</a> 與我們聯繫。</p>
<p class="prntac"><i>WEKA </i><i>及</i><i> W </i><i>標誌為</i><i> WekaIO, Inc. </i><i>的註冊商標。本文中出現的其他商業名稱，可能為其各自擁有者的商標</i><i>。</i></p>
<div id="prni_dvprnejpgfbb0left" dir="ltr" style="TEXT-ALIGN: center; WIDTH: 100%">   <a href="https://mma.prnasia.com/media2/1796062/5864370/WEKA_v1_Logo_new.jpg?p=medium600" target="_blank" style="color: #0000FF"><img decoding="async" id="prnejpgfbb0left" title="WEKA: The Foundation for Enterprise AI" src="https://mma.prnasia.com/media2/1796062/5864370/WEKA_v1_Logo_new.jpg?p=medium600" alt="WEKA: The Foundation for Enterprise AI" align="middle"></a>   <br />   <span>WEKA: The Foundation for Enterprise AI</span>  </div>
<p> </p>
</div>
<p>
新聞來源：PR Newswire</p>
<p>以上新聞投稿內容由PR Newswire 美通社全權自負責任，若有涉及任何違反法令、違反本網站會員條款、有侵害第三人權益之虞，將一概由PR Newswire 美通社承擔法律及損害賠償之責任，與LTVNews在地人新聞無關。</p>
<p>〈<a href="https://www.ltvnews.net/archives/181206">基於 NVIDIA BlueField-4 STX，WEKA 以更低的每 Token 成本將 Token 輸出推至極限</a>〉這篇文章最早發佈於《<a href="https://www.ltvnews.net">在地人新聞 LTVNews</a>》。</p>
]]></content:encoded>
					
		
		
		<media:content url="https://www.ltvnews.net/wp-content/uploads/2026/03/WEKA_and_NVIDIA.jpg" medium="image"></media:content>
            <post-id xmlns="com-wordpress:feed-additions:1">181206</post-id>	</item>
	</channel>
</rss>
