♩封面新闻记સ者 ü欧阳宏宇
人工智能算力是当前人工智能领域发展的关键,围绕AI与算力基础设施搭建应该如何实现突Ċb;⌊破?近日,中国工程院院士郑纬民在分享中表示,聚焦人工智能的Æ基础研究上,可从算力基础设施的设计、评测和优化方面入手推动技术发展。
在设计方面,郑纬民提到,传统数值超算系统(HPC)与AI算力系统(AI)之间在应用领域、运算精度等方面都有很大不同。基于此,人工智能计算机设计应遵循平衡性原则,即计算平衡设计、网络平衡计算、IO子系统设计。他§将HPC、AI和BigData(大数据处理系统)比作算力系统的“三驾马车”,指出“目前,行业整体趋势是HPC+AਠI+BigData融合在一起,预计未来两到四年,三者融合的服务器就会出现。”
在评测方面,在郑纬民看来,AIè基准设计要达到四个目标:统一的分数、可变的规模、具有ੌ实际的人工智能意义、评测程序包含必要的多机通信。由于传统的AI算力评测基准存在着只针对单个芯片、只是移动端的硬件、可扩展性不好等问题,所以,÷行业没有太多合适的大规模人工智能算力基准评测程序。
在优化方面,学界已达成一个基本共识,即模型规模和模型效果呈正相关关系。对此,郑纬民认为,由于模型规模增加了,但CPUće;的内存、计算能力是有限的,因此大模型训练一定是多机的,分布并行的。“融合了数据并行、模型并行、专家并行三种训练⇑模型后,百万亿参数超大规模训练模型的加速方法已得到了工业界的认可。ⓐ”
中国在大数据领域的算力处于领先,但是在另两种算力领域还和世界顶尖存在差距,特别是“智能算力严重Æ制约我国AI领域的创新能力”。对此,郑纬民表示,我国算力发展面临三大问题,即国产超算平台架构多样,应用移植和调优工作难度大;国产算力平台支持复杂应用全流程计算的能力亟待改善દ;和人工智能企业所可能面临的风险。
<!–
–>
ö