首页 > 科技要闻 > 科技> 正文

再不做AI应用,大模型靠什么赢?

钛媒体 整合编辑:龚震 发布于:2024-04-18 18:00

成熟的“格子衫”和年轻的“脸庞”,与开发者有关的大会总是少不了这两种元素,Create 2024百度AI开发者大会也不例外。

过去几十年,层出不穷的编程语言、框架等新技术,把一代又一代年轻的脸庞,塑造为成熟的格子衫,软件应用开发的效率确实在提升,但却总是跟不上庞大而又繁杂的需求,似乎开发者将永远陷入在这样的循环。

直到大模型的出现。

“你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”百度创始人、董事长兼首席执行官李彦宏言之凿凿。

掷地有声。成熟的格子衫还在思考,话语有几分可信与其间难题,年轻的脸庞已经深信不疑,迫切想要听到该如何“说话”,才能成为新时代的开发者。

基础大模型的确炫人眼目,大部分人如今还沉浸在基础模型层面,但是时候把更多目光聚焦在应用层面,先是大模型等新技术为应用场景提供了新的可能性,接下来就是软件应用生态的繁荣,去推大模型的再次提升。

而百度正在做的事,就是扫平大模型和应用之间的障碍,这也是本次开发者大会,百度拿出的三大工具——智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。

大模型,应用为王

“大语言模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。”李彦宏表示。

正如李彦宏所言,过去一年,大模型足够让人侧目,例如百度文心大模型,从3.0版本到3.5,再到4.0版本的进化,在代码生成、代码解释、代码优化等通用能力方面,达到国际领先水平。

文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。

但仅靠大模型还不足以催生出新的业态,就像互联网起初只是一种技术概念,而互联网应用融入到千行百业的场景,造就了如今耳熟能详的互联网巨头。“他们”没有发明互联网技术,也没有在互联网的底层基础设施做文章,却是把互联网用得最好的代表。

百度为开发者提供的大模型,就像是过去的互联网,百度有动力也有必要,提供尽可能好的大模型,从而为大模型应用开发者打好基础。

可以想象,百度冲在大模型第一线,踩坑是免不了的。李彦宏也直言,百度“踩了无数的坑,交了高昂的学费”,得出了一些基于大模型开发AI原生应用的具体思路和工具,直接分享给行业。

第一是MoE。未来大型的AI原生应用基本都是MoE架构,这里所说的MoE不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,要针对应用的不同场景做匹配。

第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过SFT精调后的小模型,其使用效果可以媲美大模型。

“这就是我们发布Speed,Lite、Tiny三个轻量模型的原因。我们通过大模型,压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。”李彦宏说。

第三是智能体。智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。

智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,还可以让不同的智能体互动,相互协作,更高质量地完成任务。这些智能体能力,反思、规划、自我计划的能力,百度已经开发并向开发者全面开放。

AI应用开发三大“神器”

李彦宏表示,大模型和生成式AI,将彻底改变开发者群体。过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言。

与之相对应地,开发者的武器库也需要与时俱进,以适应新时代的软件开发体系,同时针对MoE、小模型、智能体这三大方向上,百度已经做好了“开箱即用”的工具。

AgentBuilder:最主流的大模型使用方式

首先是智能体开发工具AgentBuilder。智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。

以新加坡旅游局为例,打开文心智能体平台,创建页面有着零代码、低代码两种模式,新手可以直接选择“零代码模式”,用自然语言,几句话就能创建一个智能体,实现酒店查询、景点门票购买等服务能力,目前百度已经跟携程合作,提供了酒店、景点、票务等旅游服务工具。

新加坡之外,大连、沈阳等文旅类智能体也都在文心智能体平台上线,还有知识类、创作类、学习类、娱乐类等各式各样的智能体。

目前,已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。文心智能体平台还为开发者们提供了流量变现的通路。除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体的相关能力,为开发者解决流量分发的后顾之忧,获得实打实的收益。

有分发,就会有数据反馈;有数据反馈,飞轮转起来,智能体就能够自主迭代,越用越聪明。文心智能体平台还上线了智能体的数据分析和问答调优模块,不久后还将有更多的新能力上线。文心智能体平台将通过分发-诊断-收益的数据飞轮,驱动智能体形成质量更优、流量更好、收益更大的正循环。

除了新加坡之外,大连、沈阳等文旅类智能体也都在文心智能体平台上线,还有知识类、创作类、学习类、娱乐类等各式各样的智能体,这些都能在AgentBuilder做出来。

AppBuilder:自然语言三步就能开发一个应用

AppBuilder提前封装和预置了开发AI原生应用所需的各种组件和框架,可以大幅降低开发门槛,不写一行代码,最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。

以游乐场排队助手为例,打开AppBuilder的开发界面,第一步先给应用起名“游乐场排队助手”,第二步填写角色指令,包括调用代码解释器、算出在固定时间内的最佳组合、输出结果等;第三步再插入需要的工具组件。这样,在零代码的情况下,一个应用就生成了。

从去年开始,百度用AI重构了百度文库,使它成为用户“内容生产的起点”。如今,在AppBuilder的支持下,百度文库新推出的智能漫画和智能绘本,更是把场景延伸到了更加有趣的跨模态创作领域。

在AppBuilder上面,百度也提供了一定的跨模态能力,开发者只需要给一段文字,或者几句话,就可以快速创建绘画类的应用,像漫画、儿童绘本等。百度文库最新推出的漫画生成和绘本生成功能,就利用了AppBuilder上提供的这类组件。

从行业视角来看,百度AppBuilder具备两个明显优势:

一是功能强大。依托文心4.0对指令的理解和遵循能力,百度AppBuilder能保证冷启动状态下就能达到一个不错的水平,不会因为效果差,再花很长时间去调优,大大降低了开发门槛。

依托检索增强技术RAG,在知识问答等典型场景,问答准确率和友好回复程度都达到了95%以上,大幅超越其他同类产品。AppBuilder还提供丰富完整的组件工具,包括百度搜索等基于百度多年技术积累的AI能力组件、大模型能力组件,还有百度独家开放的业务组件等55个组件。

此外,一些主流场景的第三方API,比如航班查询、论文查询等,百度也有提供,最新支持了自定义组件,客户可以直接对接自己专有的任何工具和数据。这些丰富的组件,共同支撑起了AI原生应用的高效开发。

二是简单易用。使用AppBuilder,只需三步即可快速创建应用、一键分发。百度也支持开源的SDK,方便大家进行二次开发。

ModelBuilder:高效低价生产模型

ModelBuilder是更适合专业开发者使用的工具,它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调SFT,从而能达到更好的效果。

为了方便专业开发者快速上手,ModelBuilder预置了最全面最丰富的大模型。包括了ERNIE3.5和ERNIE4.0旗舰版大模型,它适合通用的复杂场景,能力强大;

此外还有三个轻量级的大模型,Speed、Lite、Tiny;以及两个垂直场景的模型——ERNIE Character适合角色扮演,ERNIE Functions适合对话或问答场景中的外部工具使用和业务函数调用。当然也包括国内外第三方主流模型,总数量达到77个,ModelBuilder是国内拥有大模型数量最多的开发平台。

以小度添添AI机器人日程规划为例,背后调用了不同的模型。先是由小模型ERNIE Tiny执行了“模型路由”的工作——把晨跑中的天气问题,分配给了基于ERNIE Lite打造的精调模型,快速查询出了气温25度、天气晴朗这些信息;同时,又把更复杂的日程安排,分配给了性能最好的大模型——文心4.0,来计算一天各项事项安排。

ModelBuilder的关键是高效低价生产模型的能力。企业客户可以根据需要,兼顾效果、响应速度、推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,并且支持精调和Post-pretrain。

通过降维裁剪出来的模型,比直接拿开源调出来的模型,同等尺寸下,效果明显更好,同等效果下,成本明显更低。

AI应用繁荣,大模型才能再进化

大模型到了聚合生态力量的新阶段,无论是国内还是国外,头部厂商都在试图打造新的大模型生态,AI应用的繁荣不仅能够证明大模型的价值,也能够反过来推动大模型的再进化。

当AI应用大量被创造,越来越多的数据被生成和收集,模型有更多的机会学习到不同场景下的应用知识;规模化带来专用硬件的普及和性能提升,使得训练和运行大模型变得更加可行和高效;多样化的应用场景带来正向商业收益,商业成功将转化为AI应用和大模型的资源。

百度文心大模型正在走上这一条路,用大模型和AI应用的相互促进,实现大模型生态的正向商业循环。

李彦宏表示,文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。百度在芯片、框架、模型、应用这四层架构上有着全栈的布局,通过端到端优化,不断地把成本打下来,让更多人都可以高效、低价地用大模型来做AI应用,通过端到端优化能力,不断提高文心大模型和文心一言的效率。

“实战是大模型最好的训练场,庞大的调用量将给予文心大模型更多反馈,反向促进了文心大模型的能力提升,形成飞轮效应,进一步扩大文心大模型和国内同行的差距。”他说。

文心一言从去年3月16日首发,在一年零一个月的时间里,用户数突破了2亿,每天API的调用量也突破了2亿,服务客户数或者说企业达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。

百度一并发布了文心大模型4.0的工具版,用户可以在工具版上体验代码解释器功能,通过自然语言交互,就能实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供高效精准的支撑。

此外,创业者生态也是大模型的有生力量。去年5月份,百度启动了“文心杯”创业大赛,第一届“文心杯”创业大赛,收到了近1000支创业团队报名,百度为其中的15支优胜团队,提供了近亿元的投资支持,并且在技术、团队和资源上持续提供全方位扶持。

李彦宏在现场宣布,第二届“文心杯”创业大赛正式启动,本次将扩大项目筛选范围、设置分赛场,面向全球市场及高校学子,招募创业创新团队。

只要创业方向是AI原生应用,都可以在大赛官网报名参赛,同时百度也加大了对创业者的支持力度,提供更充足的投资资金、更丰富的业务资源,还首次设立了“特别大奖”,特别优秀的项目将有机会获得最高5000万人民币的现金和资源支持。

无论是成熟的“格子衫”,还是年轻的脸庞,都是中国大模型产业的一分子,百度通过AI应用开发三大“神器”,展示出了一幅通向大模型产业未来的道路。这条路,有百度,也有千千万万的开发者群体。

文章来源:钛媒体

 

大模型   百度   AI
钛媒体

网友评论

聚超值•精选

推荐 手机 笔记本 影像 硬件 家居 商用 企业 出行 未来
二维码 回到顶部