
人工智慧領域發展日新月異,微軟(MSFT)所支持的OpenAI正式發布最新模型GPT-5.3-Codex。這是該公司首款在建構過程中,「部分由模型自我完成」的產品,具有里程碑意義。OpenAI團隊透露,Codex團隊利用該模型的早期版本來協助除錯訓練過程、管理部署作業,甚至用於診斷測試結果與評估。開發團隊對於Codex在加速自身開發進程上的表現感到相當驚艷,顯示AI自我迭代的能力已進入新的階段。
運算效能提升25%並具備更強大的電腦操作能力
根據OpenAI公布的數據,新模型在GPT-5.2-Codex的程式編寫基礎上進一步強化,同時繼承並提升了GPT-5.2的推理能力。在產出效率方面,GPT-5.3-Codex的生成速度較前一代提升了25%。OpenAI表示,隨著GPT-5.3-Codex的問世,Codex的角色已從單純撰寫與審查程式碼的工具,轉變為能夠執行「開發者與專業人士在電腦上能做的幾乎所有事情」的智慧代理人,大幅擴展了應用場景。
採用輝達GB200系統訓練並優化開發成本
在成本效益與準確度方面,GPT-5.3-Codex展現顯著進步。在執行特定產出任務時,新模型所需的代幣(Tokens)數量僅為前代模型的一半,有助於降低企業使用成本。在技術指標上,該模型於Terminal-Bench 2.0基準測試中的準確率從GPT-5.2-Codex的64%攀升至77.3%,並在網頁與遊戲開發領域展現更佳性能。值得注意的是,該模型是採用輝達(NVDA)的GB200 NVL72系統進行訓練,OpenAI也特別對輝達的合作夥伴關係表達感謝。目前該模型已開放付費訂閱用戶使用,API版本也即將推出。
競爭對手Anthropic同日發布新模型挑戰Google地位
就在OpenAI宣布推出企業級平台Frontier的同一天,競爭對手Anthropic(ANTHRO)也不甘示弱,同步發布了Claude Opus 4.6模型。Anthropic聲稱,其新模型在多項基準測試中的表現,已超越了Google(GOOG)的Gemini 3 Pro以及OpenAI的GPT-5.2。美股AI板塊的技術競賽持續白熱化,各大科技巨頭在模型效能、運算速度與應用生態系的佈局上,競爭態勢將更為激烈。
發表
我的網誌