太平洋科技要闻

人工智能的“过弯点”，三驾马车已经全面调整了姿态

智能相对论整合编辑：太平洋科技发布于：2024-08-06 17:29

日前，英伟达CEO黄仁勋和Meta创始人马克扎克伯格开展了一场“炉边谈话”。

两人作为当今人工智能领域的领袖人物，一边凭借AI芯片的绝对优势占据着算力领域的至高地位，另一边借助开源大模型Llama 3.1强势崛起成为开源领域的标杆。这样的对话为未来AI的发展趋势呈现了不同的视角。

黄仁勋对话扎克伯格

两位大咖的对话为我们描绘了AI技术未来的发展蓝图：从开源的AI算法，到先进的人形机器人，到未来即将普及的智能眼镜，AI技术发展充满了机遇与挑战。未来AI手机、AIPC、AI汽车、智能眼镜、服务器等等各类产品都会实现智能化升级，复杂的模型、海量的数据和计算，都极大地依赖于AI算力支持。

AI算力也正在从专用计算扩展到所有的计算场景，逐步形成“一切计算皆AI”的格局。

事实上，算力厂商们的动作也见证了市场对算力发展的要求。一方面，CPU、GPU、NPU等各种PU，也都被用于了AI计算。

另一方面，在适配不同场景应用的通用服务器上，浪潮信息也在致力于提供兼具高性能与低成本的选择。前不久，基于2U4路旗舰通用服务器NF8260G7，浪潮信息创新采用领先的张量并行、NF4模型量化等技术，实现了服务器仅依靠4颗CPU即可运行千亿参数“源2.0”大模型，再度成为通用AI算力的新标杆。

在今天的市场上，算力的产业地位正在迅速崛起。对应人工智能发展的三驾马车，算力、算法、数据三者终于到达了一个地位相当的状态，走向“并驾齐驱”。

要知道，在AI技术发展的前期，中国庞大的互联网用户群体和丰富的在线数据资源，侧重于数据的发展。而美国在计算机科学、数学和统计学等基础学科方面有着悠久的研究传统，则更聚焦算法的研发。对比两者，算力在前期的关注度就显得弱了许多。

时至今日，三驾马车并驾齐驱。大众对人工智能的发展思路也愈发清晰——AI产业的爆发是算法、算力与数据三者协同发展的结果。而这样的状态也就代表着AI产业正在进入一个全新的阶段。

人工智能产业来到了“过弯点”

现阶段，大模型技术的加速迭代，带来了千亿级大模型的持续涌现与精进。相关的AI应用也在以前所未有的速度和规模渗透到各行各业，并融入日常的生活和工作中。

人工智能产业正在从初步探索进入到了广泛应用的“过弯点”。在这个过程中，AI的三驾马车也到了全面协同发展的关键时刻，才能为场景应用的跨越式升级提供必要的技术支持。

以银行的防欺诈系统为例，早期的系统是基于大数据构建的，通过经验预设规则和统计模型来判断、检测可疑交易。如今，基于更高性能的通用算力整合大数据系统和金融防诈的AI模型，银行防欺诈系统实现了功能升级，不仅具备更高的准确性和更低的误报率，而且还能够根据新的数据自我学习和调整，快速适应新的欺诈模式。

算法、算力和数据三者协同，构成当前AI应用的基本范式。一个成功的AI项目往往需要在这三个方面都做出适当的投入和优化。

算法相当于AI的大脑，负责处理信息、学习知识、做出决策。而数据是算法的基础，如果没有足够的数据，即使是再先进的算法也无法发挥出应有的效果。

而在此基础上，不管是算法的运行还是数据的处理，都离不开算力的支持。特别是在涉及到大量的数据处理、复杂的模型训练以及实时的推理需求等场景中，AI对算力的要求，同时随着场景的规模化普及，还得进一步兼顾经济性。

现如今，针对AI产业的三驾马车，算法、算力和数据层面的升级依旧在同步进行，三者之间的协同在AI行业发展的驱动下达到了新高度。AI产业的加速发展，需要三驾马车的步伐更加一致。

是时候全面调整三驾马车的状态了

人工智能的广泛应用必然要建立在三驾马车协同发展的基础上。在接下来的时间内，针对人工智能产业的升级就需要解决一个关键问题，即如何保持三驾马车并驾齐驱的稳定状态。

一、技术“并驾”：一马当先并非最佳，三马同行最为稳定。

算力、算法、数据三者相辅相成，单一的技术领先无法带来AI产业的全面爆发，必须要另外两项迅速补齐，才能对应解决相关的技术问题。

例如，在当前，千亿级参数、甚至万亿级参数的大模型加速发展，带来了更强大的信息处理和决策能力，为智能涌现提供了基础。但是，算法层面的突破，必然要有算力、数据层面的升级，才能发挥出应用的效果。简单来说，如果没有足够的算力带动千亿级大模型的训练、推理等需求，那么再强大的模型也没有“用武之地”。

要加速人工智能的发展，支撑千行百业最广泛的通用场景，千亿级大模型必须要和大数据、数据库、云等场景相融合，实现高效运行。

但这一目标对计算、内存、通信等硬件资源需求量非常大。为了满足更多用户的AI算力需求，算力厂商不得不考虑如何有针对性地去克服现有的算力瓶颈。以承载千亿参数大模型推理的NF8260G7 AI通用服务器来看，浪潮信息在这方面就做出了专业的设计。

针对千亿级大模型推理过程中的低时延以及所需的巨大内存需求，NF8260G7服务器配置了4颗具有AMX的AI加速功能的英特尔至强处理器，内存方面，NF8260G7配置32根32G DDR5 4800MHZ的内存，内存带宽实测值分别为995GB/s（读带宽）、423GB/s（写带宽）、437GB/s（读写带宽），为满足千亿大模型低延时和多处理器的并发推理计算打下基础。同时，浪潮信息还对CPU之间、CPU与内存之间的高速互联信号走线路径和阻抗连续性做了优化，从而更好地支撑大规模并发计算。