您正在浏览的是香港网站,香港证监会BJA907号,投资有风险,交易需谨慎
ChatGPT迎来“炸裂”升级!能看、能听、会说,超级AI助理即将诞生?
格隆汇 09-26 09:37

ChatGPT又迎来大升级,这次是“多模态”,能开口说话,识别物体。

当地时间周一,OpenAI宣布,将在ChatGPT推出新的语音和图像功能,新功能将于未来两周内面向Plus和企业用户推出。

OpenAI介绍称,ChatGPT推出的语音和图像功能提供了一种新的、更直观的界面,允许用户进行语音对话或向ChatGPT显示用户正在谈论的内容。新功能可以给用户提供在生活中使用ChatGPT的更多方式:

用户可以在旅行时拍下一张地标的照片,并就它的有趣之处与ChatGPT进行现场对话;当用户在家时,拍下冰箱和餐具室的照片,ChatGPT可以给出晚餐食谱;如果用户在帮自己的孩子做一道数学题,拍张照片,圈出题集,ChatGPT会给出提示。

新功能有哪些用途?

据OpenAI介绍,语音输入功能类似于手机上的语音助手,用户只需按下一个按钮,说出自己的问题,ChatGPT 就会将其转换为文本,然后生成答案,再将答案转换为语音,播放给用户。

OpenAI 还开发了一种新的文本转语音模型,可以根据几秒钟的样本语音,生成与之相似的人声。用户可以从五种选项中选择 ChatGPT 的声音,而且这种模型还有更多的潜在用途,包括将播客翻译成其他语言,同时保留播客主持人的声音。

OpenAI表示,它与配音演员合作,共同构建了该功能的文本到语音AI模型。

图像输入功能则类似于 Google Lens,用户可以拍摄自己感兴趣的事物,并上传到 ChatGPT 中。ChatGPT会尝试识别用户想要询问的内容,并给出相应的回答。用户还可以用应用中的绘图工具来帮助表达自己的问题,或者配合语音或文本输入来进行交流。

OpenAI给出的例子是,用户拍了已升自行车的图片,询问ChatGPT如何调低座椅,根据用户的提问,ChatGPT很快识别出车座调节类型和需要的工具。

随后,用户又询问其工具箱中哪个是所需的工具,ChatGPT也是成功识别,并提示用户需要拿哪一个尺寸。

设想即将实现?

可以看出,ChatGPT的功能越来越强大,非常智能。此前,OpenAI首席执行官Sam Altman和比尔·盖茨都曾对ChatGPT未来的应用前景进行设想。

Altman曾私下吿诉开发者,希望将ChatGPT打造成“超级智能个人工作助理”,可以根据个人及工作需求执行多种任务,如按照用户的风格起草邮件或文件,提供相关业务的最新信息。

盖茨也曾表示,技术竞赛将推动顶级AI助理的诞生,颠覆现有生产力,可能会从根本上改变用户的行为,乃至取代搜索和购物网站。

不过,ChatGPT也提示,这些功能也带来了新的风险,例如恶意行为者可能冒充公众人物或实施欺诈。

关注uSMART
FacebookTwitterInstagramYouTube 追踪我们,查看更多实时财经市场信息。想和全球志同道合的人交流和发现投资的乐趣?加入 uSMART投资群 并分享您的独特观点!立刻扫描下载uSMART APP!
重要提示及免责声明
盈立证券有限公司(“盈立”)在撰写这篇文章时是基于盈立的内部研究和公开第三方信息来源。尽管盈立在准备这篇文章时已经尽力确保内容为准确,但盈立不保证文章信息的准确性、及时性或完整性,并对本文中的任何观点不承担责任。观点、预测和估计反映了盈立在文章发布日期的评估,并可能发生变化。盈立无义务通知您或任何人有关任何此类变化。您必须对本文中涉及的任何事项做出独立分析及判断。盈立及盈立的董事、高级人员、雇员或代理人将不对任何人因依赖本文中的任何陈述或文章内容中的任何遗漏而遭受的任何损失或损害承担责任。文章内容仅供参考,并不构成任何证券、金融产品或工具的要约、招揽、建议、意见或保证。
投资涉及风险,证券的价值和收益可能会上升或下降。往绩数字并非预测未来表现的指标。
uSMART
轻松入门 投资财富增值
开户