首页 > 科技要闻 > 科技> 正文

OpenAI下一代模型突遭泄露!「半GPT-5」旗舰模型猎户座要来了?

新智元 整合编辑:太平洋科技 发布于:2024-12-12 15:06

OpenAI的新模型,竟被意外泄露了?

圣诞马拉松第四天,网友们从OpenAI研究员Karina Nguyen介绍Canvas功能的帖子里,发现了蛛丝马迹。

一个名叫「ChatGPT ε」的模型,现身了。

有人猜测,这很有可能就是OpenAI的下一代模型「猎户座」。

这个帖子很快引爆了社区,网友们经过更细致的研究,发现了新的亮点——

在Karina的浏览器收藏夹内,一个文件夹名为「Agents」,还有一个名为「Scientist Assistant」的标签页。

眼看引起了轩然大波,Karina旋即将帖子删除了。

传闻中的猎户座,并不是GPT-5?

模型名称中的「ε」,正是猎户座中的那颗——参宿二(Alnilam)。

说起Orion这个名字,我们都不陌生。

此前OpenAI酝酿许久的草莓模型(推理模型o1的原型),曾引出多篇猜测。

The Information的一篇报道中曾写道,草莓曾用来改进名为猎户座(Orion)的新模型。具体来说,Orion的预训练数据,正是由草莓模型生成的。

当时,有人猜测猎户座就是下一代模型GPT-5,甚至GPT-6。

而草莓的作用,就是帮OpenAI克服获取高质量数据的限制,从现实世界数据(如互联网获取的文本或图像)中训练新模型。

草莓可以帮Orion减少幻觉的产生,因为AI模型是从训练数据中学习的,所以它们看到的复杂推理的正确示例越多,就越好。

一个月前,The Information给出的全新曝料,也和所谓的「预训练Scaling Law撞墙说」对上了。

据悉,猎户座相对于GPT-4的提升,要远小于GP4-3相对GPT-3的提升。因此,猎户座大概不会被命名为GPT-5。

与之对应的,X上的「曝料哥」Tibor Blaho也透露说——

一些测试Orion的OpenAI员工说,在完成20%的训练后,它就达到了GPT-4级的性能,但质量的提高小于从GPT-3到GPT-4的飞跃,这表明随着高质量数据变得有限,传统的Scaling Law可能正在放缓。

Orion的训练涉及来自GPT-4和推理模型等先前模型的AI生成数据,这可能会导致它重现旧模型的一些行为。

OpenAI已经创建了一个「基础」团队,以开发新的方法,随着高质量数据供应的减少,

OpenAI正在为明年初的计划发布完成Orion的安全测试,该测试可能会打破「GPT」命名惯例,以反映模型开发的变化

此外,还有爆料称,OpenAI目前正在训练一个在预训练规模上介于GPT-4o和Orion之间的模型。

他们会先预训练一个「基础模型」,然后从中派生出两个模型:一个是传统的聊天模型,另一个是真正的推理模型。

而Orion的训练时间,也打破了1-2个月的常规,超过了3个月。

原因就在于,推理模型的「反馈循环」机制,使得这种情况发生了变化。

而Karina屏幕中透露的「Agents」,也让人有诸多联想。

智能体是所有人一直期待的东西。而这次泄露是OpenAI有意的吗?

有人猜测,Scientist Assistant可能是prompt摘要,agents folder看起来像传统的浏览器文件夹

网友热议:OpenAI明天又有大发布?

对于ChatGPT ε,有网友猜测道:「在同一张截图中,他们似乎正在运行某种epsilon模型——可能是GPT 4.5?」

还有网友理性分析了引起讨论的标签页和文件夹,猜测「Scientist Assistant」可能是提示的摘要,而「agents」文件夹看起来像是一个传统的浏览器文件夹。

也就是说,这些可能和新功能新产品没什么关系。

还有网友觉得无论如何,这都是「有意为之」。有可能就是一种营销手段。

在这条Reddit帖子下,还有人总结了一下OpenAI的圣诞马拉松规律——

看起来他们现在似乎在遵循一种「A/B模式」,交替进行「大发布」和「小发布」。希望明天能迎来一个「大发布」。期待能有高级模式的视频功能!

是的,有关视频功能的消息也已经初见端倪了。

ChatGPT的视觉语音模式要来了?

据悉,ChatGPT带有视觉功能的高级语音模式(以下简称「视觉语音模式」)即将向付费用户开放。

60 Minutes最近在X上发布了一条将近3分钟的视频。视频中,OpenAI总裁Greg Brockman亲自向我们展示了ChatGPT视觉语音模式的能力。

它可以通过实时视频看到视野范围内的人们正在做什么,并与他们进行实时的语音互动。

视频中,ChatGPT实力变身全能老师,既当生物考官,又当数学老师——

它流畅地主持了一场解剖学测验,能够实时审阅黑板上的手绘答案并提供反馈;还写了一首三角形面积公式的押韵歌,并用英式口音唱了出来。

解剖学测验

在演示视频中,Brockman向ChatGPT发令:「你将对他进行测试,让他画出你想测试的任何身体部位,并让他标注出来。」

指令发出后,Brockman的手机摄像头便一直对准黑板,ChatGPT开始主持这场对Anderson Cooper的测试。

ChatGPT开考第一题:请标注心脏的位置!

Anderson在一个非常草率的人体示意图里,随便画了一个完全不圆的圈,标注出心脏的位置,GPT便成功地理解了他在做什么。

接着,ChatGPT又请他画出大脑的位置,Anderson准确地画了出来。GPT毫不吝啬地称赞了他。

然后,ChatGPT又出了一个题,让Anderson画出肝脏的位置。

Anderson听到题目后感慨了一句「这有点难」,ChatGPT立马就捕捉到了他的轻微焦虑,并告诉他「别紧张」。整段对话流畅得像真人家教,唯一的区别是,GPT的声音有点机器人味儿。

Anderson把肝脏画在了错误的一侧,ChatGPT礼貌地纠正了他。

最后,Brockman让GPT评价了一下这张图——

计算三角形面积

视频中,大家还让GPT客串了一下数学老师。一开始,它准确地说出了计算三角形面积的公式。

不过,当Khan故意指着三角形的边问「这里的高是这个4吗」,AI并没有发现错误。

看来,平面几何题要比人体器官部位要难一些。

参考资料:

https://x.com/kimmonismus/status/1866570298121916881

https://x.com/60Minutes/status/1865921920543186953

本文来源:新智元

新智元

网友评论

聚超值•精选

推荐 手机 笔记本 影像 硬件 家居 商用 企业 出行 未来
二维码 回到顶部