
NVIDIA執行長黃仁勳在台灣GTC重磅宣告「有用的AI已經到來」,主攻代理型AI(Agentic AI)、AI工廠與新一代資料中心系統。Vera Rubin平台正式量產、Vera CPU鎖定低延遲代理工作負載,並聯手Microsoft等夥伴把雲端、企業、PC與機器人全部串進同一套AI運算版圖。
「有用的AI已經到來。」NVIDIA(NASDAQ: NVDA)創辦人暨執行長黃仁勳(Jensen Huang)在台灣舉行的 GTC Taiwan 主題演講中,以這句話為開場,宣告運算產業進入「代理型AI(Agentic AI)」的新階段。他將這波變革形容為一場從雲端資料中心、企業 IT,到個人電腦與機器人全線重構的「AI工業革命」。
黃仁勳指出,傳統軟體是人寫好流程、機器照表操課;而所謂代理型AI,則是能「推理、規劃、使用工具並完成任務」的系統。它結合大型語言模型、協調軟體、記憶系統與各式工具與執行環境,不再只是單一模型回答問題,而是像一名可長期工作的「數位員工」。他以軟體開發為例,指出 GitHub 等平台上的開發活動顯示,AI正讓開發者生產力大幅提升,而不是取代工程師,「有人說AI會減少工作,完全是胡說,反而是讓更多軟體工程師被聘用。」
在黃仁勳的敘事中,AI不只改變寫程式的方式,更徹底翻轉運算經濟學。他強調,如今「token 是有利潤的收入單位」,推演出「Compute is revenues, compute is profit(算力就是營收、算力就是利潤)」。在這種邏輯下,誰能提供更高效能、更低能耗、更可靠的算力基礎設施,就能掌握AI時代的現金流。這也催生所謂「AI factories(AI工廠)」——以大規模資料中心為核心,專門用來訓練與運行代理型AI系統的基礎設施。
在這場架構重整中,NVIDIA 最核心的發表就是宣告 Vera Rubin 平台正式進入全面量產。黃仁勳強調,Vera Rubin「不只是GPU」,而是一個為代理型AI工作負載打造的多機櫃、Pods級(pod-scale)系統。依照簡報內容,Vera Rubin 由多個互相連接的機櫃級系統組成,包括 Rubin GPU 系統、Vera CPU 機櫃、基於 BlueField 的儲存與安全系統,以及 NVIDIA 網路設備。晶片採用由 TSMC 製程生產,並搭配 Micron、SK hynix 與 Samsung 的 HBM4 記憶體。黃仁勳透露,Vera Rubin 的供應鏈規模是前一代 Grace Blackwell 的兩倍,而機櫃組裝效率也大幅提升:過去一個 Grace Blackwell 機櫃要兩小時,現在 Vera Rubin 只需五分鐘即可完成。
在客戶端布局上,NVIDIA 表示 Microsoft(NASDAQ: MSFT)已經有 Vera Rubin NVL72 工程機櫃投入運作,Dell 與雲端運算平台 CoreWeave 也架設了同系列工程系統。這顯示 Vera Rubin 不只是一紙規格,而是已進入頂級雲端服務商的實際部署階段。對這些業者而言,如何在功耗、可靠性、部署速度與系統壽命之間取得最佳平衡,直接決定AI服務的毛利率與投資回收期。
除了 GPU 系統外,NVIDIA 同時把目光瞄準CPU市場,推出專為代理型工作負載設計的 Vera CPU。黃仁勳強調,傳統CPU設計是以人操作電腦為主,如今代理型工作負載要求極低延遲、高單執行緒效能、高頻寬與優異能耗表現,因為CPU要負責協調工具、管理記憶體存取與在GPU周邊調度工作流程。NVIDIA 在簡報中表示,Vera 採用 Olympus core 與可擴展一致性架構(coherency fabric),並宣稱在所謂「agentic sandbox」環境中,效能是一般 x86 CPU 的 1.8 倍,涵蓋 SQL 工作負載與紐約證交所(New York Stock Exchange)等即時資料流處理案例。黃仁勳直言,Vera 將成為 NVIDIA 的重要成長引擎,公司正在打造「數以百萬計的 Vera」,而台灣 ODM 與電腦製造商則是重要推手。
要讓「AI工廠」真正量產算力,僅有硬體還不夠,還得有完整的設計與運維框架。NVIDIA 因此推出 DSX,作為建置 AI factories 的藍圖與作業框架。其中 DSX Sim 是基於 Omniverse 的數位分身工具,可在實際施工前先對AI工廠進行設計與驗證;DSX OS 則用來布建、監控與操作已安裝的基礎設施,同時提供電力優化、冷卻與電網互動等管理工具。這類能力對於打算大規模擴充AI算力,卻又面臨能源成本與電網壓力的企業與雲端營運商至關重要。
在企業應用層面,黃仁勳介紹了 NVIDIA Agent Toolkit,這是一個整合模型、工具與執行環境的「企業級代理堆疊」。其中的 NVIDIA OpenShell 是一套開源 runtime,主打在企業環境中安全地運行代理型AI,並預期將獲 Red Hat、Canonical 與 Microsoft 等軟體與雲端供應商採用。NVIDIA 也發表 Nemotron 3 Ultra,定位為一款開放模型,連同訓練資料與腳本一併釋出。公司表示該模型採用 state-space models 與 Mixture of Experts 的混合架構,並依自家測試宣稱,相較其他開放模型,運行成本更低、速度更快,瞄準希望自行部署或客製化模型的企業客戶。
值得注意的是,NVIDIA 不只要賣工具,更想直接切入產業工作流程。與電子設計自動化業者 Cadence 的合作,就是一個代表案例。雙方共同打造「chip design agent」,利用 NVIDIA Codex、Cadence ChipStack、Nemotron 與 OpenShell,來自動化 RTL 驗證、測試產生、迴歸測試與除錯等環節。NVIDIA 表示,過去需耗時數週的驗證週期,有機會縮短到數小時。對半導體產業而言,一旦這類代理工具成熟,將可能重新定義開發時程與人力需求。
在終端裝置端,NVIDIA 也與 Microsoft 等夥伴企圖「重發明」個人電腦,讓PC原生支援代理型運算。NVIDIA 宣布推出 RTX Spark 筆電,以及涵蓋桌機、筆電與工作站的 Windows 平台產品線。當中包含與 MediaTek 合作打造的 N1X 晶片,支援 NVIDIA 軟體堆疊、CUDA 應用、Windows 應用,以及本地或雲端串接的代理服務。這樣的設計,意在讓開發者與企業能在單一裝置上,同時運行本地推論與雲端協作代理,打通從邊緣到資料中心的運算鏈。
演講最後,黃仁勳將焦點轉向「實體AI(Physical AI)」——也就是會在現實世界中感知、思考與行動的系統。他指出,對機器人來說,最大難題是資料來源,因為機器人需要的是自身視角的資料,而不是單純第三人稱影片。為此,NVIDIA 推出 Cosmos 3,定位為實體AI的前沿基礎模型,可同時作為視覺-語言模型、世界模型、模擬器與行動模型的基底。同場還發表 Llama Mio 2,主打自駕車的開放模型,並展示具推理能力的自駕系統。黃仁勳表示,約占全球 80% 產量的汽車製造商已簽約採用 NVIDIA Hyperion 平台,約占全球 97% 的行動服務業者也正與 NVIDIA 連結,顯示其在自駕與智慧車生態系中的滲透率。
在人形機器人領域,NVIDIA 推出 Isaac GR00T 參考設計機器人,瞄準高等教育與大學研究者。這套平台包含開放模型、模擬與訓練程式庫、資料生成工具,以及搭載 Jetson Thor 的機器人電腦。透過提供完整開發套件,NVIDIA 企圖在新興的人形機器人市場搶先建立標準與開發者社群,進一步鞏固其在「實體AI」中的平台地位。
綜觀這場發表,可以看出 NVIDIA 正把自己從「賣GPU的公司」,轉型成為「端到端代理型AI平台供應商」。從 Vera Rubin 與 Vera CPU 所代表的資料中心與AI工廠基礎建設,到 DSX、Agent Toolkit 與 OpenShell 這類企業軟體,再到 RTX Spark PC、Cosmos 3、Llama Mio 2 與 Isaac GR00T 等實體AI應用,NVIDIA 想要的是一條貫穿雲端、企業、PC、車輛與機器人的共同運算模式。
這樣的佈局固然替投資人描繪出龐大的成長藍圖,但也意味著整個科技產業的競爭門檻被拉高。雲端服務業者與大型企業,若要在新一波AI競賽中維持競爭力,勢必得思考如何導入「AI工廠」概念,並在電力、冷卻與資料治理等面向做好長期投資;同時也必須評估對單一供應商高度依賴的風險。黃仁勳在演講總結時表示,過去六個月,隨著代理型AI變得真正「有用」,整個運算產業已經被改寫。他預言,同一套代理計算模式,將橫跨雲端、企業、個人電腦、機器人、車輛、衛星、基地台與工廠,未來幾年,誰能掌握並善用這套新模式,恐怕將決定下一輪科技與資本版圖的贏家。
點擊下方連結,開啟「美股K線APP」,獲得更多美股即時資訊喔!
https://www.cmoney.tw/r/56/9hlg37
本網站所提供資訊僅供參考,並無任何推介買賣之意,投資人應自行承擔交易風險。
發表
我的網誌


