在OpenAI公司发布ChatGPT之后,全球很多资本、组织开始投入到AI大模型决赛中,掀起了“万模大战”高潮。出品方涵盖互联网巨头、AI概念上市公司、服务器龙头企业、科研院所与一级市场创业公司,有的大模型的参数规模已经接近,甚至超越ChatGPT的规模(上千亿条)。依托这些大模型推出的类ChatGPT产品,主打的能力包括对话问答、文本及代码生成等等。
4月28日,中共中央政治局会议分析了当前的经济形势和经济工作。在会议中,强调了通用人工智能的发展,加大了对人工智能的扶持力度。
在此之前,百度发布了大语言模型“文心一言”,阿里的“通义千问”开始企业内测;之后,商汤科技带来了“商量SenseChat”,360也开启了“360智脑”企业内测。5月6日,科大讯飞发布星火认知大模型,并发布其在教育、办公、汽车、数字员工等行业的应用成果。此外,腾讯、京东、字节跳动等国内科技“大厂”,云知声、医联等科技公司,也纷纷宣布了在类ChatGPT产品或AI大模型领域的布局。清华大学、北京智源人工智能研究院、上海人工智能实验室等科研院所也发布了各自的AI大模型成果。
据不完全统计,目前国内科技“大厂”、创业公司、科研院所等发布的AI大模型已超过30个,还有不少正在研发当中。
一般认为,算法、算力、数据是AI大模型研发中必不可少的基础要素,也是制约大模型成果水平的关键因素。ChatGPT之父、OpenAI创始人萨姆·奥特曼最近表示,大语言模型的规模已接近极限,并非越大越好;大模型发展不应一味追求参数数量,未来大模型或以多个小模型相互协作的方式运行。把各个子模型联动起来,并通过提升算法来优化其能力。在算力提升遭遇瓶颈,训练数据数量、质量有限的情况下,算法在大模型研发中的关键作用愈加凸显。现阶段大模型的基础理论已十分明晰,更像是一种系统性的复杂工程,“如何将其中的每一个环节‘做透’,通过算法的优化,将每一部分组合在一起发挥更大作用将是接下来发展重点。”
近年来,随着我国“东数西算”、算网融合等发展,全国算力网络正在加速建设,算力正在成为AI竞争的新焦点,也成为数字经济发展的新引擎。我国算力产业规模排名全球第二,去年增长率近30%。尽管如此,但在日趋激烈的竞争中,各家企业对算力的巨大需求仍然难以满足。更有不少业内人士直言:缺乏强大的芯片等算力支持,是制约我国AI大模型发展的一大瓶颈。当前AI算力竞争的主战场之一在云计算。国内云计算产业存在三方面突出问题:从核心技术的角度来看,云计算的硬件技术自主可控性仍是薄弱环节;从生态构建角度来看,云计算的互操作性成为影响构建统一生态和发展创新的瓶颈;从行业应用的角度来看,公有云上行业应用类型单一是突出问题。应该加大信创工程的支持力度,为自主可控云技术提供市场空间;持续发展云计算互操作技术,推动云际互操作接口标准化,建立产业发展基金,解决云计算的互操作问题;持续激励企业数字化转型,激励国有企业使用公有云,推进建设公共科学数据云服务,丰富公有云行业应用类型。
对于通用大模型,全球有这么多公司去做,需要一个相对客观的系统性的评价方法。我们要向OpenAI学习,同时也要快速追赶并努力超越,而这需要一套科学系统的评测体系。应该从7个维度衡量AI大模型产品是否达成通用人工智能(AGI):文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。
中国工程院郑纬民
科大讯飞研究院刘聪、刘庆峰
中青报·中青网记者 王林 王海涵