差评
整合编辑:太平洋科技
发布于:2024-09-19 15:14
开源AI巨头Meta AI发布最新大模型Llama3.1,参数量达到4050亿,性能超过ChatGPT4o和Claude3.5-Sonnet。25家企业宣布将基于Llama3.1推出新模型。然而测试发现,在某些领域Llama3.1表现出色,但在其他方面也会翻车。虽然开源的LLM拓展性强,但与OpenAI相比仍有差距。
|
三个月过去了,当初的 “开源落后论” 再一次被打脸。
好吧不卖关子了,简单来说就是,开源 AI 界扛把子 Meta AI ,最近更新他们最新最强的大模型- Llama3.1 。
而它的性能,也号称已经完全追上 ChatGPT4o 和 Claude3.5-Sonnet ,像长文本和数学这些方面甚至超过他俩。这回啊,是开源的胜利!
不少媒体也跟着炸裂,宣称 AGI 之路近在眼前了,不过世超我还是先泼一盆冷水,劝大家先别急着狂热了,因为人家 Meta AI 官方这次,也放出了Llama3.1 的详细论文,足足 90 页。 这个版本究竟改进了什么地方,是不是真有吹的这么神,那论文里其实都写上了。
首先咱就说训练这方面,他们就下了大功夫,做了算力和数据的扩充。
数据和运算规模上去了,能力肯定也就上来了,突出一个力大砖飞。毕竟这么多东西,要咱学大概率摆烂学不动,但人家 AI 是真学啊。
其次,除了填鸭式训练,训练内容里的优化和微调也挺重要的,这也是他们能快速进步的另一个原因。比如说在刚开始处理训练信息的时候,他们就用了一些算法,来清理重复内容和垃圾信息,提高训练数据的质量。
而在模型结构上,为了照顾这么大量的数据训练, Meta 也做了不少改进,像是把训练数据由 16 位精度降低到 8 位,这样不但能节省储存空间还方便计算,并且有利于在移动端部署。
除以之外,他们还放弃了用传统的强化学习算法来进行模型后处理,而是选择靠测试员的标注和监督,边反馈边迭代。
而其他厂商看到 Llama3.1 的开源大旗,也纷纷来投,尽管月活超 7 亿的厂家还得先申请,但到现在已经有 25 家企业都官宣要出基于 Llama3.1 的新模型。
对,老黄也全面拥抱开源了,要把 Llama3.1 用到他家 AI Foundry 服务里。
说这么多,那这个进击的羊驼用起来是不是真这么牛逼哄哄呢?我们上手试了试,发现有些地方它做得确实可以,有些地方则也会翻车。 比如,在长文本阅读这个领域它有时候表现的就还可以,我们测试了让它回答十几轮问题之前的概念,发现它的确能在回答里反馈到当时给出的信息。
上图为 Llama3.1 ,下图为 Gemini
数据推理上,像用前几天考倒了众多 AI 的 9.11 和 9.9 谁大问题,他也搞不定。
那是不是这个 Llama3.1 啥啥都不行呢?话也不能这么说,虽然上面展示了一些翻车案例,但这倒也不能代表 Llama3.1 的真实实力就这样。
也就是说, Llama 的意义在于开源后创作者们的调教和微操,这才是这类开源模型的独到之处。
不过这也不意味着 Meta 这波就一下翻身了,比 OpenAI 牛逼了。虽然开源的 Llama3.1 拓展性会很强,但毕竟它的底子其实也没有跟 ChatGPT4o 拉开太大差距。
说到底,开源和闭源各有优势,但谁一定会颠覆谁那倒真不一定。
不过对于这次 Llama3.1 取得的进步,他却表示:虽然成不了 AGI ,但这玩意确实有用啊。 本文来源:差评 |
IT百科
网友评论
聚超值•精选
而打脸的人,仍然是上次那位,元宇宙倡导者,前半职业拳击手,潜伏在硅谷的纯正蜥蜴人,扎克伯格。
