大模型：进入“百模混战”时代_SoHoBlink人工智能行业媒体网站

大模型：进入“百模混战”时代

智能计算芯世界 2023-10-09 22:12:54 浏览:1385

全球已发布大模型超200个，中美数量占全球的九成。虽然ChatGPT点燃了大模型发布的热情，不过早在ChatGPT发布之前，全球已经发布了不少大模型，《中国人工智能大模型地图研究报告》显示，2019年美国已经有了4个大模型，而中国2020年有了2个大模型，此后每年都有大模型发布，仅仅2023年的前五个月，中美分别有19、18个大模型发布。

截至2023年5月底，国内10亿级参数规模以上基础大模型至少已发布79个，而美国这一数字为100个，全球累计发布大模型202个，中美两国大模型的数量占全球大模型数量的近90%,中国大模型数量已进入第一梯队。

发布大模型的机构可以分为四种类型，互联网公司、学术/研究机构、Al公司及行业公司。国内大模型呈快速发展之势，在以下几个方面表现突出：

一是，大模型应用越来越广泛，在自然语言处理、图像识别、语音识别、内容生成等多个领域有着广泛应用。

二是，大模型算法丰富，国内的模型上除了GPT之外，还对BERT、ALBERT、NEZHA等进行了广泛的探索。

三是，大模型性能不断提升，国内大模型玩家纷纷加大对Al的研发投入，据钛媒体·钛度图闻不完全统计，2022年，华为在研发费用上投入1615亿元，成为研发投资资金最多的企业；其次，腾讯以614亿元排名第二，阿里以555亿元排名第三，他们在硬件和软件领域的大规模投入，大大提高了大模型的运算速度和效率。

四是，大模型研究成果不断涌现，国内以清华、复旦、哈工大等高校也推出了自己的大模型，国内机构在NLP、CV等领域也拿到了多个国际级别的冠军。

然而不得不承认的是，国内大模型迅猛发展的同时也面临着基础模型研发能力不足，部分行业数据搜集整理难度大等问题。

据国外风投数据分析公司PitchBook的数据，2023上半年，全球人工智能领域共计发生融资1387件，筹集融资金额255亿美元，平均融资金额达2605万美元。

根据Crunchbase数据库，2011-2023年共计3658个Al领域融资项目(仅统计500万以上融资金额的项目，且融资公司所在地为美国),美国Al领域融资项目数及融资金额稳步增长。2022年美国风投Al领域融资项目数为574个，2011-2022年CAGR达29.3%；2022年美国AI领域融资金额为243.5亿美元，2011-2022年CAGR达422.5%。

据业界不完全统计，2023年上半年，美国AIGC一级市场中，硅谷在人工智能领域共完成了42起融资，总金额约140亿美元，占世界总融资金额的55%。平均轮次融资金额为3.3亿美元，是平均融资水平的近13倍之多。其中，8家人工智能明星独角兽公司拔地而起，平均轮次融资金额3.3亿美元。

虽然大模型发布数量不断增长，然而对于大模型如何落地变现，仍在不断探索中，据中国电信研究院分析，国外行业大模型发展模式主要有三种，且以前两种发展模式为主。

一是。目前国际巨头多采用这种模式，如谷歌、微软、Meta等龙头厂商利用大模型重构原有业务，比如微软利用GPT-4全面“龙头大模型+原有业务”赋能Azure云、Office365、Dynamics365等传统业务。这种模式的优势在于可以利用大模型的强大语言能力，提升原有业务的智能化水平，同时也可以借助原有业务的数据和用户资源，增强大模型的应用相关性和准确性。

二是“龙头大模型+外部行业数据”。这种模式是国内创业公司普遍采用的方式，通过直接调用API或基于GPT大模型微调改进自身Al产品，比如哈维基于GPT及行业数据推出“Al法律助手”。这种模式的优势在于可以利用龙头大模型的先进技术和算力，快速打造出具有行业特色和竞争力的Al产品，同时也可以借助外部数据源，增强行业相关性和准确性。

三是“开源大模型+自有行业数据搭建行业大模型”。这种模式多适用于有着丰富的行业数据积累的中大型企业。例如基于开源模型研发，实现LLM与金融垂直领域知识的深度融合。这种模式的优势在于可以充分利用自有数据的质量和数量级，打造出更专业、更精准的行业大模型，同时也可以借鉴开源大模型的技术和经验，提升训练效率和效果。

总体而言，基础大模型训练成本高，研发难度大，这决定了大模型会遵照“赢者通吃”的规律，未来市场上仅存几个龙头大模型，而围绕龙头大模型的创业生态将逐步形成。

SoHoBlink - 人工智能行业网站

关于SoHoBlink人工智能网

微信公众号