9月20日,华为副董事长、轮值董事长徐直军今天公开表示,不是每个企业都要训练自己的基础大模型。
“我们必须要面对一个现实,那就是,美国在AI芯片领域对中国的制裁长期不会取消,而中国半导体制造工艺由于也受美国制裁,将在相当长时间处于落后状态,这就意味着我们所能制造的芯片的先进性将受到制约。这是我们打造算力解决方案必须面对的挑战。”徐直军说道。
立足中国,只有基于实际可获得的芯片制造工艺打造的算力才是长期可持续的。
在徐直军看来,华为的战略核心就是,充分抓住人工智能变革机遇,基于实际可获得的芯片制造工艺,计算、存储和网络技术协同创新,开创计算架构,打造“超节点+集群”系统算力解决方案,长期持续满足算力需求。
从华为盘古在行业的实践看,十亿参数模型可以满足科学计算、预测决策等业务场景的需求,比如降雨预测、药物分子优化、工艺参数预测,在PC、手机等端侧设备上,十亿参数模型也有广泛应用。
而百亿参数模型可以满足面向NLP、CV、多模态等大量特定领域场景的需求,比如知识问答、代码生成、坐席助手、安全检测。面向NLP、多模态的复杂任务,可以用千亿参数模型来完成。