大模型:进入“百模混战”时代
智能计算芯世界 2023-10-09 22:12:54 浏览:1385
全球已发布大模型超200个,中美数量占全球的九成。虽然ChatGPT点燃了大模型发布的热情,不过早在ChatGPT发布之前,全球已经发布了不少大模型,《中国人工智能大模型地图研究报告》显示,2019年美国已经有了4个大模型,而中国2020年有了2个大模型,此后每年都有大模型发布,仅仅2023年的前五个月,中美分别有19、18个大模型发布。
截至2023年5月底,国内10亿级参数规模以上基础大模型至少已发布79个,而美国这一数字为100个,全球累计发布大模型202个,中美两国大模型的数量占全球大模型数量的近90%,中国大模型数量已进入第一梯队。发布大模型的机构可以分为四种类型,互联网公司、学术/研究机构、Al公司及行业公司。国内大模型呈快速发展之势,在以下几个方面表现突出:一是,大模型应用越来越广泛,在自然语言处理、图像识别、语音识别、内容生成等多个领域有着广泛应用。二是,大模型算法丰富,国内的模型上除了GPT之外,还对BERT、ALBERT、NEZHA等进行了广泛的探索。三是,大模型性能不断提升,国内大模型玩家纷纷加大对Al的研发投入,据钛媒体·钛度图闻不完全统计,2022年,华为在研发费用上投入1615亿元,成为研发投资资金最多的企业;其次,腾讯以614亿元排名第二,阿里以555亿元排名第三,他们在硬件和软件领域的大规模投入,大大提高了大模型的运算速度和效率。四是,大模型研究成果不断涌现,国内以清华、复旦、哈工大等高校也推出了自己的大模型,国内机构在NLP、CV等领域也拿到了多个国际级别的冠军。然而不得不承认的是,国内大模型迅猛发展的同时也面临着基础模型研发能力不足,部分行业数据搜集整理难度大等问题。据国外风投数据分析公司PitchBook的数据,2023上半年,全球人工智能领域共计发生融资1387件,筹集融资金额255亿美元,平均融资金额达2605万美元。根据Crunchbase数据库,2011-2023年共计3658个Al领域融资项目(仅统计500万以上融资金额的项目,且融资公司所在地为美国),美国Al领域融资项目数及融资金额稳步增长。2022年美国风投Al领域融资项目数为574个,2011-2022年CAGR达29.3%;2022年美国AI领域融资金额为243.5亿美元,2011-2022年CAGR达422.5%。据业界不完全统计,2023年上半年,美国AIGC一级市场中,硅谷在人工智能领域共完成了42起融资,总金额约140亿美元,占世界总融资金额的55%。平均轮次融资金额为3.3亿美元,是平均融资水平的近13倍之多。其中,8家人工智能明星独角兽公司拔地而起,平均轮次融资金额3.3亿美元。虽然大模型发布数量不断增长,然而对于大模型如何落地变现,仍在不断探索中,据中国电信研究院分析,国外行业大模型发展模式主要有三种,且以前两种发展模式为主。一是。目前国际巨头多采用这种模式,如谷歌、微软、Meta等龙头厂商利用大模型重构原有业务,比如微软利用GPT-4全面“龙头大模型+原有业务”赋能Azure云、Office365、Dynamics365等传统业务。这种模式的优势在于可以利用大模型的强大语言能力,提升原有业务的智能化水平,同时也可以借助原有业务的数据和用户资源,增强大模型的应用相关性和准确性。二是“龙头大模型+外部行业数据”。这种模式是国内创业公司普遍采用的方式,通过直接调用API或基于GPT大模型微调改进自身Al产品,比如哈维基于GPT及行业数据推出“Al法律助手”。这种模式的优势在于可以利用龙头大模型的先进技术和算力,快速打造出具有行业特色和竞争力的Al产品,同时也可以借助外部数据源,增强行业相关性和准确性。三是“开源大模型+自有行业数据搭建行业大模型”。这种模式多适用于有着丰富的行业数据积累的中大型企业。例如基于开源模型研发,实现LLM与金融垂直领域知识的深度融合。这种模式的优势在于可以充分利用自有数据的质量和数量级,打造出更专业、更精准的行业大模型,同时也可以借鉴开源大模型的技术和经验,提升训练效率和效果。
总体而言,基础大模型训练成本高,研发难度大,这决定了大模型会遵照“赢者通吃”的规律,未来市场上仅存几个龙头大模型,而围绕龙头大模型的创业生态将逐步形成。