在耶誕節前夕,人工智慧領域再度掀起波瀾。繼谷歌發佈其先進推理模型o1的消息後,OpenAI緊隨其後,於12月20日宣佈推出其o1的下一代模型——o3。這一新模型的發佈引發了廣泛關注,展示了OpenAI在推理能力上的顯著進步,並可能改變未來AI的發展格局。
OpenAI的CEO Sam Altman在直播中指出,o3是一個“非常、非常聰明的模型”。根據OpenAI的評估數據,o3在多個領域的測試中表現優異。例如,在軟體工程的能力測評中,o3的準確率達到了71.7%,相比o1的48.9%高出近47%。在競賽數學測評中,o3的準確率為96.7%,比o1高出15%。在涉及人類博士級專家的生化知識測試中,o3的準確率也比o1高出近13%。這些數據不僅展示了o3在多個領域的領先地位,也表明其在AGI(通用人工智慧)相關測試中取得了突破,最高得分達到了87.5%,超過了人類水準的門檻85%。
谷歌的新模型o1剛發佈,便展示了其在推理能力和透明性上的優勢。o1採用了一種慢思維的推理方式,能夠深度可視化整個思維鏈過程,特別是在處理複雜的數學和編程問題上展現了出色的能力。谷歌的這一新模型在Chatbot Arena大模型評估中取得了良好的表現,成為了評估榜單的領頭羊。
然而,OpenAI的o3一經推出,便吸引了廣泛的關注。o3的測試結果表明,其在多個關鍵領域的表現都超越了o1,顯示出OpenAI在AI推理能力上的顯著進步。這場在谷歌與OpenAI之間的推理模型攻防戰,不僅是技術實力的較量,也反映了兩大科技巨頭在人工智慧領域的戰略佈局。
儘管o3的測評結果令人振奮,OpenAI並不急於將其向大眾推向市場。Altman表示,o3系列可能在一段時間內不會面向普通用戶使用,原因在於希望在正式發佈之前,能夠建立一個聯邦政府的測試框架,以指導監控並降低潛在風險。他強調,確保模型的安全性和可靠性是OpenAI的首要任務,類似於對新藥物或新飛機的安全驗證。
根據OpenAI的計畫,o3和o3-mini的預覽版將首先向安全研究人員開放,預計將在明年初正式發佈。這一策略顯示了OpenAI在推動技術創新的同時,也在積極尋求監管與安全的平衡,以應對AI技術可能帶來的挑戰。
如何在uSMART上進行投資交易:
登入uSMART HK APP之後,從頁面最右上方點擊選擇「搜索」,輸入標的代碼,如「GOOG.US」,可進入詳情頁瞭解交易詳情和歷史走勢,點擊右下角「交易」,選擇「買入/賣出」功能,最後填寫交易條件後送出訂單即可。
(圖源:uSMART HK)