
人工智慧新創公司Anthropic宣布推出最新旗艦AI模型Claude Opus 4.6,該版本在程式編碼及處理自主代理(Agentic)任務的能力上,較前一代有顯著提升。新模型目前已透過claude.ai、Anthropic API及各大主要雲端服務供應商開放使用,展現該公司在AI軍備競賽中持續領先的企圖心。
百萬詞元窗口測試版上線與強大除錯力
Anthropic官方指出,Claude Opus 4.6在規劃能力上更為縝密,能夠維持更長時間的代理任務,並在大型程式碼庫中運作得更可靠。該模型具備更優異的程式碼審查與除錯技巧,能有效捕捉自身錯誤。值得注意的是,這是Opus級別模型首度在測試版(beta)中提供高達100萬詞元(Token)的上下文窗口,大幅提升資訊處理量。
新功能Cowork引發傳統軟體股市場擔憂
Opus 4.6整合了Anthropic新推出的「Cowork」功能,該服務開放了對廣受歡迎的Claude Code的存取權限,並利用代理架構來執行複雜任務。市場分析顯示,近期廣泛軟體市場出現部分拋售潮,主因在於投資人擔憂這項新工具可能侵蝕傳統軟體公司的市占率,顯示AI技術的進步正重新定義軟體產業的競爭格局。
代理任務表現優於Google與OpenAI模型
在性能對比方面,Opus 4.6在多個領域表現優於競爭對手,包括Google(GOOG)的Gemini 3 Pro以及OpenAI的GPT-5.2。特別是在代理終端編碼、代理電腦使用、工具使用、搜尋功能、財務分析、辦公室任務及新型問題解決上,Opus 4.6均展現優勢。然而,在研究所等級的推理能力及視覺推理方面,Google(GOOG)與OpenAI的模型仍略勝一籌。
展現更佳的任務專注度與長時效生產力
Anthropic團隊發現,Opus 4.6在無需額外指令的情況下,能自動聚焦於任務中最具挑戰性的部分,並快速完成較直觀的環節。該模型在處理模稜兩可的問題時展現出更好的判斷力,並能在長時間的作業階段中保持高生產力,解決了過去模型容易在長任務中失焦的痛點。
發表
我的網誌