在耶诞节前夕,人工智慧领域再度掀起波澜。继谷歌发布其先进推理模型o1的消息后,OpenAI紧随其后,于12月20日宣布推出其o1的下一代模型——o3。这一新模型的发布引发了广泛关注,展示了OpenAI在推理能力上的显著进步,并可能改变未来AI的发展格局。
OpenAI的CEO Sam Altman在直播中指出,o3是一个“非常、非常聪明的模型”。根据OpenAI的评估数据,o3在多个领域的测试中表现优异。例如,在软体工程的能力测评中,o3的准确率达到了71.7%,相比o1的48.9%高出近47%。在竞赛数学测评中,o3的准确率为96.7%,比o1高出15%。在涉及人类博士级专家的生化知识测试中,o3的准确率也比o1高出近13%。这些数据不仅展示了o3在多个领域的领先地位,也表明其在AGI(通用人工智慧)相关测试中取得了突破,最高得分达到了87.5%,超过了人类水准的门槛85%。
谷歌的新模型o1刚发布,便展示了其在推理能力和透明性上的优势。o1采用了一种慢思维的推理方式,能够深度可视化整个思维链过程,特别是在处理复杂的数学和编程问题上展现了出色的能力。谷歌的这一新模型在Chatbot Arena大模型评估中取得了良好的表现,成为了评估榜单的领头羊。
然而,OpenAI的o3一经推出,便吸引了广泛的关注。o3的测试结果表明,其在多个关键领域的表现都超越了o1,显示出OpenAI在AI推理能力上的显著进步。这场在谷歌与OpenAI之间的推理模型攻防战,不仅是技术实力的较量,也反映了两大科技巨头在人工智慧领域的战略布局。
尽管o3的测评结果令人振奋,OpenAI并不急于将其向大众推向市场。Altman表示,o3系列可能在一段时间内不会面向普通用户使用,原因在于希望在正式发布之前,能够建立一个联邦政府的测试框架,以指导监控并降低潜在风险。他强调,确保模型的安全性和可靠性是OpenAI的首要任务,类似于对新药物或新飞机的安全验证。
根据OpenAI的计划,o3和o3-mini的预览版将首先向安全研究人员开放,预计将在明年初正式发布。这一策略显示了OpenAI在推动技术创新的同时,也在积极寻求监管与安全的平衡,以应对AI技术可能带来的挑战。
如何在uSMART上进行投资交易:
登入uSMART HK APP之后,从页面最右上方点击选择「搜索」,输入标的代码,如「GOOG.US」,可进入详情页了解交易详情和历史走势,点击右下角「交易」,选择「买入/卖出」功能,最后填写交易条件后送出订单即可。
(图源:uSMART HK)