太平洋科技行业

首页 > 科技要闻 > 科技> 正文

OpenAI下一代模型突遭泄露！「半GPT-5」旗舰模型猎户座要来了？

新智元整合编辑：太平洋科技发布于：2024-12-12 15:06

由华为云驱动

OpenAI的未发布新模型「ChatGPT ε」意外泄露，引起网友热议。有人猜测它可能是下一代模型「猎户座」，但与传闻不同的是，这个模型可能不会被命名为GPT-5。此外，OpenAI正在训练一个介于GPT-4o和Orion之间规模的新模型，并计划明年初发布。另外，据报道，ChatGPT即将推出视觉语音功能。

OpenAI的新模型，竟被意外泄露了？

圣诞马拉松第四天，网友们从OpenAI研究员Karina Nguyen介绍Canvas功能的帖子里，发现了蛛丝马迹。

一个名叫「ChatGPT ε」的模型，现身了。

有人猜测，这很有可能就是OpenAI的下一代模型「猎户座」。

这个帖子很快引爆了社区，网友们经过更细致的研究，发现了新的亮点——

在Karina的浏览器收藏夹内，一个文件夹名为「Agents」，还有一个名为「Scientist Assistant」的标签页。

眼看引起了轩然大波，Karina旋即将帖子删除了。

传闻中的猎户座，并不是GPT-5？

模型名称中的「ε」，正是猎户座中的那颗——参宿二（Alnilam）。

说起Orion这个名字，我们都不陌生。

此前OpenAI酝酿许久的草莓模型（推理模型o1的原型），曾引出多篇猜测。

The Information的一篇报道中曾写道，草莓曾用来改进名为猎户座（Orion）的新模型。具体来说，Orion的预训练数据，正是由草莓模型生成的。

当时，有人猜测猎户座就是下一代模型GPT-5，甚至GPT-6。

而草莓的作用，就是帮OpenAI克服获取高质量数据的限制，从现实世界数据（如互联网获取的文本或图像）中训练新模型。

草莓可以帮Orion减少幻觉的产生，因为AI模型是从训练数据中学习的，所以它们看到的复杂推理的正确示例越多，就越好。

一个月前，The Information给出的全新曝料，也和所谓的「预训练Scaling Law撞墙说」对上了。

据悉，猎户座相对于GPT-4的提升，要远小于GP4-3相对GPT-3的提升。因此，猎户座大概不会被命名为GPT-5。

与之对应的，X上的「曝料哥」Tibor Blaho也透露说——

一些测试Orion的OpenAI员工说，在完成20%的训练后，它就达到了GPT-4级的性能，但质量的提高小于从GPT-3到GPT-4的飞跃，这表明随着高质量数据变得有限，传统的Scaling Law可能正在放缓。

Orion的训练涉及来自GPT-4和推理模型等先前模型的AI生成数据，这可能会导致它重现旧模型的一些行为。

OpenAI已经创建了一个「基础」团队，以开发新的方法，随着高质量数据供应的减少，

OpenAI正在为明年初的计划发布完成Orion的安全测试，该测试可能会打破「GPT」命名惯例，以反映模型开发的变化

此外，还有爆料称，OpenAI目前正在训练一个在预训练规模上介于GPT-4o和Orion之间的模型。

他们会先预训练一个「基础模型」，然后从中派生出两个模型：一个是传统的聊天模型，另一个是真正的推理模型。

而Orion的训练时间，也打破了1-2个月的常规，超过了3个月。

原因就在于，推理模型的「反馈循环」机制，使得这种情况发生了变化。

而Karina屏幕中透露的「Agents」，也让人有诸多联想。

智能体是所有人一直期待的东西。而这次泄露是OpenAI有意的吗？

有人猜测，Scientist Assistant可能是prompt摘要，agents folder看起来像传统的浏览器文件夹

网友热议：OpenAI明天又有大发布？

对于ChatGPT ε，有网友猜测道：「在同一张截图中，他们似乎正在运行某种epsilon模型——可能是GPT 4.5？」

还有网友理性分析了引起讨论的标签页和文件夹，猜测「Scientist Assistant」可能是提示的摘要，而「agents」文件夹看起来像是一个传统的浏览器文件夹。

也就是说，这些可能和新功能新产品没什么关系。

还有网友觉得无论如何，这都是「有意为之」。有可能就是一种营销手段。

在这条Reddit帖子下，还有人总结了一下OpenAI的圣诞马拉松规律——

看起来他们现在似乎在遵循一种「A/B模式」，交替进行「大发布」和「小发布」。希望明天能迎来一个「大发布」。期待能有高级模式的视频功能！

是的，有关视频功能的消息也已经初见端倪了。

ChatGPT的视觉语音模式要来了？

据悉，ChatGPT带有视觉功能的高级语音模式（以下简称「视觉语音模式」）即将向付费用户开放。

60 Minutes最近在X上发布了一条将近3分钟的视频。视频中，OpenAI总裁Greg Brockman亲自向我们展示了ChatGPT视觉语音模式的能力。

它可以通过实时视频看到视野范围内的人们正在做什么，并与他们进行实时的语音互动。

视频中，ChatGPT实力变身全能老师，既当生物考官，又当数学老师——

它流畅地主持了一场解剖学测验，能够实时审阅黑板上的手绘答案并提供反馈；还写了一首三角形面积公式的押韵歌，并用英式口音唱了出来。

解剖学测验

在演示视频中，Brockman向ChatGPT发令：「你将对他进行测试，让他画出你想测试的任何身体部位，并让他标注出来。」

指令发出后，Brockman的手机摄像头便一直对准黑板，ChatGPT开始主持这场对Anderson Cooper的测试。

ChatGPT开考第一题：请标注心脏的位置！

Anderson在一个非常草率的人体示意图里，随便画了一个完全不圆的圈，标注出心脏的位置，GPT便成功地理解了他在做什么。

接着，ChatGPT又请他画出大脑的位置，Anderson准确地画了出来。GPT毫不吝啬地称赞了他。

然后，ChatGPT又出了一个题，让Anderson画出肝脏的位置。

Anderson听到题目后感慨了一句「这有点难」，ChatGPT立马就捕捉到了他的轻微焦虑，并告诉他「别紧张」。整段对话流畅得像真人家教，唯一的区别是，GPT的声音有点机器人味儿。

Anderson把肝脏画在了错误的一侧，ChatGPT礼貌地纠正了他。

最后，Brockman让GPT评价了一下这张图——

计算三角形面积

视频中，大家还让GPT客串了一下数学老师。一开始，它准确地说出了计算三角形面积的公式。

不过，当Khan故意指着三角形的边问「这里的高是这个4吗」，AI并没有发现错误。

看来，平面几何题要比人体器官部位要难一些。

参考资料：

https://x.com/kimmonismus/status/1866570298121916881

https://x.com/60Minutes/status/1865921920543186953

本文来源：新智元

OpenAI 模型泄露猎户座

新智元

原创栏目

三星Galaxy S26系列现场上手：防窥屏杀疯了！

一款为不妥协而生的游戏显示器

换个视角看世界这台小相机有点东西

手机中暑急救指南：9款散热背夹横评

IT百科

抖音网页版怎么进入

iPhone12外观实锤！这2个问题还会重演吗？

AI大数据教你把妹儿？都是送人头的低俗趣味

我在双11买杜X斯的秘密怎么全网都知道？

收藏！买买买之后最该看的网购维权指南

比炒鞋更狂的炒盲盒

还去淘宝买iPhone有锁机？华强北的卖家都哭了

终于！AI开始对这届大学生们“下手了”

网友评论

聚超值•精选

推荐手机 笔记本 影像硬件家居商用企业出行未来

意见反馈回到顶部