
美國企業界正悄悄醞釀一場變革,財務長與董事會開始嚴格審視缺乏效率的人工智慧支出。過去兩年,企業的標準做法是不論任務難易,直接將所有指令交給最頂級、最昂貴的AI模型來處理。然而,隨著AI帳單遠遠超出原定預算,企業開始反思,是否每項任務都需要動用最尖端的技術。為了控制不斷膨脹的成本,市場上開始浮現一種名為「模型分流」的新型解決方案。
模型分流成企業節流新寵,大幅提升成本效益
所謂的模型分流,是一種將任務與適合模型進行匹配的技術工具。它會將複雜難解的問題發送給昂貴的尖端模型,而將簡單的任務交由更便宜、速度更快的替代方案來處理。開發AI軟體工程師Devin的Cognition執行長Scott Wu指出,這種做法在處理例行性工作時能帶來巨大的收益。對於大量格式化、重複性的工作,企業若改用足以勝任的平價模型,不僅能完成任務,還能將成本效益提升5到10倍之多。
企業AI資源錯置,多數任務無須殺雞用牛刀
儘管節流潛力龐大,但目前多數企業仍未採用分流機制。企業搜尋引擎Glean執行長Arvind Jain估計,高達95%的企業AI應用仍依賴最昂貴的尖端模型,甚至連平價模型能輕鬆解決的任務也不例外。舉例來說,若要求AI說出美國第三任總統的名字,無論是昂貴還是便宜的模型,都會給出正確答案。企業為這種簡單的常識問題支付高昂的頂級模型費用,無疑是一種資源的浪費。
開銷超預算!思科(CSCO)重組資源保研發
這波成本壓力甚至讓全球科技巨頭必須謹慎應對。思科(CSCO)產品策略長Jeetu Patel分享了一組驚人的估算數據:若每位員工每週消耗約200美元的詞元(Token)算力,單一員工每年的成本將高達10,000美元。對於擁有90,000名員工的企業而言,每年的AI開支將上看9億美元。他坦言思科(CSCO)的相關支出已遠超內部預算,因此被迫進行調整,將資源重新分配,優先滿足旗下30,000名工程師利用AI開發產品的算力需求。
供應商祭出報酬率保證,轉向追求實際產出
面對企業端對成本的焦慮,AI供應商也開始調整策略。Cognition宣布推出AI生產力保證計畫,承諾如果其產品帶來的工程價值低於客戶支付的費用,將提供最高達1,000萬美元的使用額度補償。供應商強調,業界過往太執著於消耗的詞元(Token)數量或生成的程式碼行數,未來應該轉向關注實際產出。企業真正需要的是能節省多少人力時間,而不是盲目追求龐大的算力消耗。
買方掌握定價權,頂級AI實驗室面臨考驗
隨著企業開始將大量簡單任務轉向更便宜的開源模型,這意味著OpenAI和Anthropic等頂尖實驗室將無法再從每一項小任務中獲利,只能接到較為複雜的工作。這兩家巨頭過去的商業模式及市場對其首次公開募股的超高估值,都建立在市場願意以高價購買龐大算力的假設上。儘管尖端技術依然具有不可替代的價值,但在買方逐漸掌握定價權的趨勢下,這些AI領頭羊必須設法提升模型的使用效率,尋找全新定價模式。
思科(CSCO)為網路龍頭,最新股價收紅
思科(CSCO)是全球最大的網路設備供應商,也是全球首屈一指的軟體企業,旗下核心業務涵蓋網路軟硬體設備與防火牆等資安軟體,並擁有Webex等協作產品。該公司主要將製造外包,並在全球90個國家擁有龐大的銷售團隊。在最新交易日中,思科(CSCO)收盤價來到130.00美元,單日上漲3.50美元,漲幅達2.77%,單日成交量為23,339,462股,成交量較前一日變動-22.13%。
發表
我的網誌