2月27日,OpenAI重磅推出最新人工智能模型,該公司稱,這是其迄今為止最大、最棒的聊天模型。
其最引人注目的亮點,當屬 “活人感強” 這一特性。OpenAI表示,用户與GPT-4.5交互時感覺更為自然,模型展現出更高的“情商”。
目前GPT-4.5僅面向每月200美元的ChatGPT Pro計劃用户開放,公司計劃下週開始向Plus和Team用户推出。
OpenAI僅用一場持續了不到14分鐘的發佈會介紹了GPT-4.5模型。
GPT-4.5作為去年5月發佈的GPT-4o模型的下一代產品,是OpenAI最後一款非推理模型。從GPT-5起,OpenAI的推理和通用模型將實現融合。
OpenAI稱,GPT-4.5將是其聊天機器人系統中最後一個不進行“思維鏈推理”的版本。
此次發佈之後,OpenAI後續模型可能會像人類一樣,在回答問題前花費更多時間思考,而非即刻迴應。
值得注意的是,“活人感更強”是GPT-4.5的一大顯著亮點。
OpenAI指出,用户與GPT-4.5交互時感覺更為自然,模型展現出更高的“情商”,這讓它在提高寫作、編程和解決實際問題等任務中非常有用。
當用户表示,因考試失敗而感到沮喪時,GPT-4.5會像朋友一樣給予安慰並傾聽,展現出極高的情感理解與迴應能力。反觀GPT-4o,面對相同情境,其反饋則顯得較為機械。
OpenAI研究副總裁MiaGlaese表示,該模型獨特之處在於能進行熱情、直觀且自然流暢的對話,對用户需求的理解能力更強。
此外,OpenAI在週四的博客文章中提到,GPT-4.5“擁有更廣泛的知識和對世界更深入的理解,減少了幻覺現象,在眾多主題上的可靠性得以提高”。
在與GPT-4o以及近期發佈的推理模型o3-mini的性能對比中,GPT-4.5優勢明顯。在簡單問題回答準確率上,GPT-4.5達到62.5%,遠超GPT-4o的38.2%和o3-mini的15.0%;幻覺率方面,GPT-4.5為37.1%,低於GPT-4o的61.8%和o3-mini的80.3%。
在人工智能模型基準測試中,GPT-4.5在數學、科學等領域的表現優於GPT-4o,在語言和多模態領域勝過o3-mini,不過在科學和數學方面略遜一籌。
此外,GPT-4.5具備通過搜索獲取最新信息的能力,支持文件和圖片上傳,還可利用畫布進行寫作和編碼。但目前不支持ChatGPT中的語音模式、視頻和屏幕共享等多模式功能。
目前GPT-4.5僅面向每月200美元的ChatGPT Pro計劃用户開放。OpenAI表示,將努力在未來讓更多用户能夠使用該模型,公司計劃下週開始向Plus和Team用户推出,再下週向Enterprise和Edu用户推出。
OpenAI的首席執行官Sam Altman在X平台還發文指出,GPT-4.5模型太大了,以至於公司正面臨GPU(運行和訓練AI系統所需芯片)短缺問題。
他表示:“這並非我們期望的運作方式,然而,導致GPU短缺的增長激增情況實在難以精準預測。”不過,他也補充道,預計未來幾週會補充上萬塊GPU,以緩解當前的困境。
待下週GPU到位後,OpenAI便會開始向每月支付20美元訂閲費用的Plus用户推送GPT-4.5。
值得關注的是,OpenAI在全球範圍內都面臨着來自競爭者的壓力。
在國內,人工智能初創公司DeepSeek推出的最新模型DeepSeek-V3,在自然語言處理、代碼生成、複雜推理等任務中表現優異,且訓練成本僅為同類模型的十分之一。在國外,谷歌的Gemini、Anthropic的Claude、微軟的CoPilot以及埃隆・馬斯克創建的Grok3等,也都在不同程度上對OpenAI構成挑戰。
此前,OpenAI宣佈了GPT-5的相關計劃。OpenAI表示,不會將推理/編碼模型作為獨立產品發佈,而是把相關功能整合進統一的GPT-5系統。GPT-5的發佈將實現o(Omni)系列模型(如GPT-4o)的“推理”能力與GPT模型語言能力的融合。
不過當被問到發佈時間時,Altman則表示,還要幾個月。