AI算力需求进入爆发式增长阶段,AI服务器如何问天?

作者:四川成都联想服务器总代理 来源:成都联想服务器总代理 点击量:114

AI算力需求进入爆发式增长阶段,AI服务器如何问天?


近日,有外媒发文表示,尽管OpenAI努力通过GPT-3.5和GPT-4等产品收费来提升收入,但其收入不足以支付费用。ChatGPT每天的运行成本在70万美元左右,还不包括其产品阵容中的其他AI产品。该媒体预测,整个2022年,OpenAI亏损达到5.4亿美元,且随着GPT-5乖项目开发,亏损将会进一步放大。


印媒的这一报道,在行业里引起了巨大的波澜,甚至有人“预测”OpenAI将在2024年破产。


OpenAI破产的可能性不大,这不仅在于微软给其投资了100亿美元,而且后续仍然可能有大笔投资,同时OpenAI的付费人群也正在提升,其未来的营收改善可能性很大。


1.png


2.png


但有一点是需要注意的,那就是ChatGPT的运行成本,每天70万美元的运行成本,更多的是由于算力需求引发的。


在8月中旬召开的2023中国算力大会上,工信部部长金壮龙强调,“算力已成为数字经济时代的关键生产力”,要“加快建设全国一体化算力网络国家枢纽,打造数据中心集群。”


同时,生成式AI以及多模态大模型的崛起,让AI开始成为每个人提升生产效率的工具,据不完全统计,目前我国科技领域企业推出的大规模已经超过了50款,大量的大规模的出现,给算力提出了更高的要求,我们的AI算力的不足已经成为迫切要解决的问题。


对于AI算力未来的趋势,联想中国区基础设施业务群服务器事业部总经理陈振宽如此判断,“中国算力行业需要做好准备迎接新算力时代——智算的到来。而AI算力与通用算力存在明显的差异。从千万级的参数到千亿级的参数,从深度学习需要中等规模的训练和推理到现在要全面地去实现超大规模的训练,AI算力需要依据AI数据和算法的特性设计和优化。”


事实上,从OpenAI面临的困境来看,一是在大模型运行过程中算力够不够用的问题,二是算力系统的运行是否经济的问题。前一个问题涉及到算力构架,第二个问题涉及到算力系统的电力开销和绿色环保。


所以,相对于传统算力体系,AI算力对整体算力系统的构建提出了更高的要求,在中国大规模不断涌现的当下,中国的AI算力准备好了吗?


3.png


4.png


联想作为中国算力的重要提供商,对今年迅速增长的AI算力需求,联想中国区基础设施业务群服务器事业部对此有着敏捷的预测。


在2023中国算力大会上,联想针对AI算力领域,推出了问天WA7780 G3和问天WA5480 G3两款专用服务器产品,能够助力构建更加绿色高效的人工智能数据中心,满足大规模企业从训练到推理等多样的算力需求。


5.png


在性能方面,问天WA7780 G3 AI大模型训练服务器基于第四代英特尔至强可扩展处理器。NVIDIA HGX H800系统配备8颗H800 NVLinkGPU,拥有高达640GB的HBM3高速显存,通过NVLINK技术,GPU间互联带宽高达400GB/s。将AI算力提升了3.44倍,最高可达32P FLOPS AI算力。NVIDIA H800 GPU匹配第四代Tensor Core配合Transformer引擎(FP8精度),与上一代产品相比,可为大模型AI训练速度带来高达9倍提升,可将大模型AI推理速度提升高达30倍。


在灵活性方面,问天WA7780 G3最高可以支持8张RDMA高速网卡,提供3.2Tb/s聚合带宽。充分满足了超大模型训练并行计算时,跨节点的通信需求。同时,在本地存储的设计上,采用了GPU Direct Storage (GDS) 技术。通过GDS技术,GPU与NVMe实现了快速低延迟互联,能够有效提高训练数据载入的速度,提升大模型训练的性能。


服务节能一直是联想服务器的一大特点,在此次发布的新品上,联想仍然将节能做到了极致。问天WA7780 G3 AI大模型训练服务器功耗相比前一代降低约10%。同时,为了满足未来智算中心对PUE值更低的要求,产品还预留了液冷冷板设计,未来将支持液冷,进一步大幅度节省在AI大模型训练过程中,因系统散热带来的额外能耗,PUE值有望低于1.1。


问天WA5480 G3 AI训推一体服务器,是联想问天品牌中的一款4U机架式AI服务器,支持多元的算力和丰富的生态,能够为AI模型的训练推理提供极致可靠的算力。问天WA5480 G3 AI训推一体服务器采用2颗第四代英特尔至强可扩展处理器,支持最新PCIe 5.0。通过PCIe扩展,最多可以支持10张包括最新NVIDIA H800 GPU在内的,多类型、多品牌AI加速卡。可以灵活应用于AI通用模型训练、大模型推理、AI生成、云游戏、科学计算等多种应用场景,为AI的多样场景提供多元算力。


问天WA7780 G3和问天WA5480 G3是专门针对目前中国AI算力需求设计生产的AI服务器,在性能拓展和多场景应用方面都具有非常明显的特征,同时基于联想多年在水冷、液冷方面的积累,让这两款新型AI服务器的PUE值在1.1左右,在保证高性能的前提上,实现了低功耗运行。


IDC的研究表明,随着生成式人工智能应用的爆发,各行业对智算的需求首次超过通用算力,AI算力已成为算力发展的主要方向。



成都联想服务器总代理 成都强川科技有限公司专注企业IT服务需求,产品可按需定制。主营:联想问天你服务器、联想ThinkSystem服务器、联想ThinkStation工作站、T、联想商用电脑(启天/扬天/ThinkCentre/ThinkPad),以专业的IT解决方案和优质的服务体验赢得企业信赖。QQ:2851150694;服务热线:028-85024766  18215624006(微信同号)

热门文章