【即時新聞】OpenAI 推出新基準,提升科學推理能力

權知道

權知道

  • 2025-12-17 16:29
  • 更新:2025-12-17 16:29
【即時新聞】OpenAI 推出新基準,提升科學推理能力

OpenAI(OPENAI)近日推出名為FrontierScience的新基準,用於衡量生物學、化學和物理學等領域的專家級科學推理能力。這一基準由來自這些領域的專家撰寫並驗證,包含數百個設計為困難、原創且具意義的問題。OpenAI表示,這項新基準評估奧林匹亞式的科學推理及真實世界的科學研究能力。

OpenAI 的 GPT-5.2 模型表現

在最新的測試中,OpenAI 的 GPT-5.2 模型在奧林匹亞部分取得了 77% 的得分,而在研究類別中則獲得了 25%。這顯示出 GPT-5.2 在奧林匹亞式科學推理上具備一定的優勢。

其他公司模型的表現

與此同時,Anthropic(ANTHRO)的Claude Opus 4.5在奧林匹亞部分得分為71.4%,研究部分為17.5%。Google(GOOG)(GOOGL)的Gemini Pro 3在奧林匹亞部分得分76.1%,研究部分為12.4%。xAI(X.AI)的Grok 4則在奧林匹亞部分取得66.2%,研究部分為15.9%。

未來展望與努力方向

OpenAI表示,未來科學推理能力的進步將來自於更好的通用推理系統以及對提升科學能力的專注努力。FrontierScience等基準有助於我們理解當前AI系統的弱點,從而集中精力使模型成為科學發現中的可靠夥伴。

點我加入《理財寶》官方 line@

【即時新聞】OpenAI 推出新基準,提升科學推理能力
文章相關股票
權知道

權知道

我們重視「知」的權利 不惜抽絲剝繭、深入調查 只為讓投資人不錯過重要的投資訊息

我們重視「知」的權利 不惜抽絲剝繭、深入調查 只為讓投資人不錯過重要的投資訊息