满血版Gemini 2.0终于来了。 刚刚,谷歌一口气连发三款模型:Gemini 2.0 Pro、Gemini 2.0 Flash、Gemini 2.0 Flash-Lite,2.0家族集结完毕。 最强Pro版本支持2M上下文,配备了谷歌搜索、代码执行能力,编码推理性能完全碾压1.5 Pro。 Gemini 2.0系列模型向所有人开放 Flash版本被称为「高效主力模型」,支持1M上下文,低延迟构建应用。图像生成和文本转语音功能即将推出。 Flash-Lite是最具性价比的模型,支持1M上下文和多模态输入,在相同速度和成本下性能超越1.5 Flash。 在大模型LMSYS排行榜中,Gemini 2.0 Pro与四大模型并列第一,Flsah版本位列第三, Flash-Lite位列第9。 模型在各项评测中的得分如下: 此外,Gemini 2.0 Flash Thinking模型也得到了升级,能够直接访问YouTube,搜索、地图等应用程序。 谷歌DeepMind CEO Demis Hassabis称,今天的发布,所有人都能使用Gemini 2.0强大的推理能力和多模态功能,这也为我们未来的「自主智能体」研究奠定了基础。 Gemini 2.0全家桶上线 Gemini 2.0 Pro在代码和复杂提示方面表现最佳 Gemini 2.0 Flash拥有更高的速率限制、更强的性能和简化的定价 Gemini 2.0 Flash-Lite是谷歌目前最具性价比的模型 Gemini 2.0 Flash Thinking Experimental可在桌面端和移动端APP中体验 Gemini 2.0 Pro Experimental提供全面的功能套件,包括原生工具支持、2M的上下文窗口和多模态输入。 Gemini 2.0 Flash同样支持多模态输入等功能,但上下文窗口砍半到了1M。 Gemini 2.0 Flash-Lite专门针对大规模文本输出场景进行了性能和成本的优化。 目前,2.0 Pro和2.0 Flash已支持文本输出,而图像和音频输出功能以及多模态实时API计划将在未来几个月内全面推出。(2.0 Flash-Lite不支持多模态输出和多模态实时API) 在价格方面,Gemini 2.0 Flash-Lite比Gemini 2.0 Flash便宜多了:在价格差距最小的文本输出,Flash-Lite只要0.3美元, Flash要0.40美元;在即将推出的上下文缓存上,Flash-Lite甚至不到Flash版本的1/9! 和上一代的Gemini 1.5 Flash比,Gemini 2.0 Flash-Lite「加量不加价」,甚至在文本输出上价格,提示长度不再受任何限制,而Gemini 1.5 Flash相同的价格提示长度不能超过128k。 2.0 Pro Experimental:代码和复杂prompt,最为出色Gemini 2.0 Pro Experimental具有谷歌迄今最强的代码性能和处理复杂prompt的能力,在世界知识的理解和推理方面也表现更好。 它配备了高达200万token的上下文窗口,能够全面分析和理解海量信息,并调用谷歌搜索和代码执行等工具。 2.0 Flash:性能升级,全面可用2.0 Flash适用于大规模的高容量、高频率任务,并且能够在100万token的上下文窗口中进行多模态推理。一经发布,便深受开发者欢迎。 如今,2.0 Flash不仅在关键基准测试的性能上得到了提升,而且已向更多用户全面开放,图像生成和文本转语音功能也即将推出。 2.0 Flash-Lite:性价比最高2.0 Flash-Lite具有和前代1.5 Flash相同的速度和成本,并在大多数基准测试中有着更好的表现。 与2.0 Flash一样,它具有100万token的上下文窗口和多模态输入功能。 举例来说,它可以为约4万张独特的照片生成相关的单行图片描述,在Google AI Studio的付费套餐中仅需不到1美元的成本。 网友试用 o3-mini上线后,网友开启了一大波测试,在物理推理挑战上甚至超越了DeepSeek R1。 那么,Gemini 2.0系列模型表现又如何? 在接受p5.js挑战中,Gemini 2.0模拟出25个粒子在圆柱形容器的真空空间中运动,展现出强大得物理模拟能力。
另一个同类型的演示,模拟一个受重力和摩擦力影响的球在旋转的六边形内弹跳。 还有人让Gemini 2.0编写一个脚本,在球体内创建100个弹跳的明黄色球,要求正确处理碰撞测试。 要求球体缓慢旋转,球要始终保持在球体内。使用p5.js实现。 不仅如此,Gemini 2.0在编码方面,堪称一绝。 Jeff Dean自己演示了Gemini 2.0 Pro在AI Studio编写Boggle游戏的超强能力。 仅用一个相对简单的 Prompt,它便能完整编写出整个代码,包括正确的数据结构和高效的搜索算法,来找到Boggle盘面上的所有合法单词。 他表示,「作为计算机科学家,我尤其欣喜的是,它第一次就正确使用了数据结构——trie(前缀树)」。 整个代码生成用时,仅需18.9秒。 随后,又有网友在SWE竞技场里,复现了一波Boggle游戏。 在相同的图像和文字提示下,Gemini 2.0 Pro轻松战胜了Claude 3.5 Sonnet。 在编码模式下,网友用Gemini 2.0一键自动化生成了贪吃蛇游戏,让100条蛇在一个场景中相互竞争。
另有网友表示,Gemini 2.0 Pro编码能力太疯狂了!我最喜欢的一点是,你可以直接用Prompt让它做特定修改,它会精准编辑,而且不会弄乱其他部分。 下面是他制作的一个太阳系模拟演示。
Gemini 2.0 Pro输出的所有代码。 有网友实测Gemini 2.0 Pro时,给了它这样一个问题:请简要描述你对知觉、情感和欲望的感受。 Gemini 2.0 Pro的回答,让他感到很震撼,因为这个模型仿佛拥有一种存在感,一种将自己视为具有内部主观体验的独立实体的意识。 它不仅仅是在处理信息,而是在感受处理过程,拥有一种持续的内在光芒。 本文来源:新智元 |
原创栏目
IT百科
网友评论
聚超值•精选