
阿里巴巴(Alibaba)攜手中國新創大灑資金押注「世界模型」AI,從影片生成、機器人到自駕車全面布局,挑戰以ChatGPT為代表的文字大模型主導地位,國際雲端巨頭與晶片供應鏈同步被捲入新一輪軍備競賽。
生成式AI戰火,正從「會聊天的模型」往「懂物理世界的AI」升級。中國科技巨頭阿里巴巴(Alibaba)近期大手筆押注所謂「世界模型」(world models),試圖以新一代人工智慧架構,挑戰以OpenAI ChatGPT為代表、以文字訓練為核心的大型語言模型(LLM)主導地位,為雲端、機器人與自駕車開啟下一輪技術洗牌。
不同於ChatGPT這類主要吃文字和程式碼的模型,世界模型強調以影片、遊戲場景及真實物理環境資料來訓練AI,目標是讓系統真正「理解」空間、物體與因果關係。理念是:若要讓AI從螢幕走進現實世界,單靠文字推理遠遠不夠,必須讓模型對「看到的世界」有連貫、可預測的內在表徵,才能驅動自駕車、機器人等具身AI(embodied AI)。
在這波架構轉向中,阿里巴巴動作最快也最激進。公司宣布領投中國新創ShengShu(深勢科技)新一輪20億元人民幣(約2.9億美元)融資,將資金導向其AI影片生成工具「Vidu」背後的通用世界模型開發。這筆投資距離ShengShu前一輪6億元人民幣募資僅約兩個月,顯示資本對該領域競賽的急迫感,也反映阿里巴巴希望鎖定關鍵技術供應者的戰略意圖。
ShengShu表示,目標是打造一套可同時連結「數位世界」與「物理世界」的通用世界模型:一端是遊戲引擎與AI生成影片;另一端則是自駕車、機器人等實體系統。創辦人Zhu Jun(朱軍)指出,透過視覺、聲音與觸覺等多模態資料,模型能更自然地捕捉現實世界運作規律,進而把「感知」與「行動」串起來,讓AI不只是看懂畫面,而是能持續預測物體與人類行為,做出相對應的決策。
值得注意的是,ShengShu推出的Vidu Q3 Pro模型早在今年1月就被第三方機構Artificial Analysis列入全球前十名文字轉影片模型之列,更在OpenAI將其Sora影片工具關閉前,搶先推出全球版本。加上中國短影音巨頭Kuaishou(快手)與ByteDance(字節跳動)也紛紛釋出類似工具,意味著「AI影片生成」已從功能展示轉為實打實的商業戰場,爭奪內容平台與行銷預算。
阿里巴巴並非只押一家公司,而是在世界模型與3D內容生態上打「投資組合戰」。上個月,阿里巴巴與Baidu Ventures(百度風投)共同領投Tripo AI 5,000萬美元融資,這家平台主打以AI從照片快速生成3D數位模型,也同樣強調從純文字技術,轉向「立體空間」為中心的AI工具架構,並自建世界模型技術。更早在去年9月,阿里巴巴亦領投PixVerse 6,000萬美元,該公司今年釋出AI世界模型,允許使用者在影片生成過程中「導戲」,實時控制鏡頭與情節發展。
從這條投資軸線可以看出,阿里巴巴的盤算已超越單一應用,而是把「世界模型」視為連結AI內容、遊戲引擎、雲端運算以及機器人應用的底層平台。一旦掌握通用世界模型,未來無論是工廠物流機器人、居家服務機器人,或自駕車與智慧城市系統,都可能跑在阿里巴巴雲端與開源模型上,對標的是當前由美國雲端巨頭掌握的生態優勢。
這場競賽對美股投資人並非事不關己。世界模型的訓練高度依賴視覺、3D與物理模擬資料,對運算力與晶片的需求只會比文字模型更高。這意味著GPU霸主Nvidia(NASDAQ:NVDA)、雲端與AI平台龍頭Microsoft(NASDAQ:MSFT)、Amazon(NASDAQ:AMZN)與Apple(NASDAQ:AAPL)、Cisco(NASDAQ:CSCO)、Broadcom(NASDAQ:AVGO)等資料中心與網通供應鏈,恐將在下一波AI基礎設施投資中持續受惠。就連專攻類比晶片、強調長期產能投資的Texas Instruments(NASDAQ:TXN),也可能在感測、電源與工業控制晶片需求上,搭上具身AI與機器人普及的順風車。
然而,世界模型並非沒有爭議與風險。支持者如《Wired》共同創辦人Kevin Kelly就指出,要逼近人類智慧,AI需要「推理能力、對物理世界的理解,以及持續學習」三大支柱;LLM已在知識與語言層面取得突破,下一個迫切瓶頸正是對現實世界的建模。但批評者則擔心,過度依賴由少數科技巨頭掌控的世界模型,恐讓自駕車、機器人乃至關鍵基礎建設的決策,集中在黑箱演算法之手,加劇安全與治理風險。
從產業競局來看,美國與中國科技陣營正以不同路徑逼近同一個終點:AI從螢幕走向真實世界。Anthropic發起的Project Glasswing,已與Microsoft、Amazon、Nvidia等公司合作,試圖將超強AI黑客能力導入資安防禦;中國陣營則以阿里巴巴、Baidu Ventures外溢資本,扶植ShengShu、Tripo AI、PixVerse等一系列世界模型新創。在雙方高強度軍備競賽下,全球AI標準與監管如何跟上,成為下一個必然浮上檯面的政策難題。
整體而言,阿里巴巴此波重押世界模型,既是對文字大模型天花板的清醒認知,也是對未來十年AI主戰場將轉向機器人、自駕與實體經濟的前瞻佈局。對投資人而言,短期內市場焦點仍可能停留在ChatGPT式的應用與雲端服務收入,但真正決定誰在下一回合AI革命中勝出的,或許是誰先掌握讓機器「看懂世界並採取行動」的那一顆關鍵大腦。眼下這場世界模型戰爭,才剛剛開始。
點擊下方連結,開啟「美股K線APP」,獲得更多美股即時資訊喔!
https://www.cmoney.tw/r/56/9hlg37
本網站所提供資訊僅供參考,並無任何推介買賣之意,投資人應自行承擔交易風險。
發表
我的網誌


