本文来自微信公众号:经济观察报 (ID:eeo-com-cn),作者:任晓宁、陶思羽、谭玉清,题图来源:视觉中国
一场关于大模型的地域竞速已经开始。
“现在已有80余个大模型公开发布,其中北京约占一半”,北京市经济和信息化局党组书记、局长姜广智最近在接受媒体采访时说。
经济观察报记者不完全统计发现,在新一轮生成式AI热潮中,全国已经出现了106个大模型,其中北京的大模型公司数量和研发数量均占据“C位”,多达54个;上海在AI算力方面积累了优势;深圳、广州、杭州、成都等城市也都有多个大模型公司。
今年4月28日,中共中央政治局会议提出,要重视通用人工智能发展,营造创新生态,重视防范风险。5月5日召开的二十届中央财经委员会第一次会议指出,要把握人工智能等新科技革命浪潮。之后,全国各地相继推出大模型扶持政策。抢占新一轮AI高地,各大城市正在行动中。
目前,各地大模型均还在内测中,未开放给公众。大模型发展仍处于混沌初开时刻,最终谁能胜出,成为真正的“大模型之都”,还需继续观察。
一、北京:54个
姜广智的话并不夸张,据经济观察报不完全统计,截至7月13日,北京已有54个大模型公司。
中关村是北京大模型公司的核心聚集地。经济观察报记者在五道口走访时,方圆3公里内,就坐落着近10个大模型创业公司,它们也都是中国大模型公司中的佼佼者。
五道口清华大学南门外,搜狐网络大厦3层,是王慧文创办的光年之外。这家公司成立刚4个月,以20.65亿元的价格被美团收购。搜狐大厦对面是智源大厦,北京智源人工智能研究院坐落其中,院长是北京大学计算机科学技术系主任黄铁军,这是学院派的中坚力量之一,早在2021年,智源就推出了中国首个超大规模预训练模型“悟道2.0”,参数量达到1.75万亿。
智源大厦往南800米,是王小川创办的百川智能,7月11日,百川智能发布参数量130亿的通用大语言模型“Baichuan-13B-Base”。
距离智源大厦3公里外的丹棱街上,MiniMax北京团队在这里办公,这是当前国内估值最高的大模型创业公司,6月最新一轮融资后,估值12亿美元。丹棱街1公里之外,是衔远科技的办公室,这家公司由京东前AI掌门人周伯文创办。
坐落在中关村附近的,还有李开复的大模型新公司“零一万物”,这家公司7月3日刚成立,目前团队已经有数十名核心成员。
出门问问创始人李志飞的公司也在海淀,他们推出了大模型产品“序列猴子”。这附近也有互联网大厂推出的大模型产品,比如位于知春路的字节跳动,在6月28日发布了大模型服务平台“火山方舟”。
如果把中关村的范围扩大到方圆10公里,大模型公司更多。中关村向北10公里,是互联网大厂的聚集地后厂村。今年3月,百度在百度科技园里发布了文心大模型,是国内第一个互联网大厂发布的大模型。
同在北京发布大模型的大厂,还有位于望京的360,今年发布了“智脑大模型”。位于亦庄的京东,发布了“言犀大模型”。
北京还有一批中等规模公司也发布了大模型,比如昆仑万维的“天工”、知乎的“知海图”、网易有道的“子曰”、第四范式的“式说”……
根据IDC《2022-2023中国人工智能计算力发展评估报告》,北京位居2022年中国人工智能城市排行榜首位。猎聘研究院发布的《AIGC就业趋势大数据报告2023》显示,在近一年AIGC新发职位城市分布TOP10中,北京职位最多,占比为22.21%。
AI政策扶持方面,北京市正在发力。5月份,北京市政府12天内连发3个AI相关文件。5月19日,发布《北京市通用人工智能产业创新伙伴计划》;5月30日,印发《北京市促进通用人工智能创新发展的若干措施》;5月30日,印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》。
姜广智也提到,北京市经信局将按季度迭代推出大模型应用成果,形成一批人工智能与经济社会发展深度融合的典型案例,并正在筹划通过算力券等形式支持模型伙伴和模型观察员,首期预计支持不低于4000万元算力券,补贴到模型伙伴企业。
二、上海:12个
今年7月8日,在2023世界人工智能大会闭幕式上,《上海市推动人工智能大模型创新发展的若干措施》公布,并发布了“模”都倡议,成立上海人工智能开源生态产业集群,打造AI“模都”。
围绕创新能力、创新要素、创新应用、创新环境四大方向,上海将重点打造三项计划以及五大平台。三项计划分别为:大模型创新扶持计划、智能算力加速计划、示范应用推进计划。
不过,与北京的大模型企业数量相比,上海稍微逊色了一筹。据经济观察报不完全统计,截至7月13日,上海共有12个大模型,分别是:总部位于上海的MiniMax、复旦大学的MOSS、商汤科技的日日新、达观数据的曹植、微盟的WAI、星环科技的无涯和求索、乐言科技的乐言、医疗算网的Uni-talk、上海AI实验室的书生通用大模型体系、虎博科技的TigerBot、智臻智能的小i、蜜度的蜜度文修。
上海大模型的带头人,是商汤及复旦大学。今年7月,商汤日日新大模型更新到了2.0版本,还在大模型基础上推出了小模型。复旦大学的MOSS于今年2月推出,MOSS系统负责人邱锡鹏说,MOSS在中文能力上已超ChatGPT。
虽然大模型数量没有北京多,不过,在每家大模型公司都离不开的算力、芯片方面,上海处于遥遥领先的位置。
今年上半年,英伟达股价暴涨,原因是他们的GPU可以为大模型提供算力,由于GPU出货量有限,市场供不应求。在上海,也分布着一众国产GPU公司。
闵行区和上海自由贸易试验区是上海芯片公司重镇。陈行公路上,坐落着壁仞科技、天数智芯等为大模型计算提供通用GPU芯片的国产龙头芯片公司。上海自由贸易试验区,林立着芯璐科技、日观芯设、世瞳微电子等从芯片设计到生成的不同节点、不同研发类型的半导体公司。
张江也是上海芯片公司聚集地。今年世界人工智能大会上,张江的芯片公司们集中发布了芯片新品,包括沐曦集成的“曦思N100人工智能推理GPU”、瀚博半导体的“瀚博第二代全功能GPU芯片”、燧原科技的“人工智能云端训练芯片邃思2.0”等。
同时,上海外资芯片公司较多,闵行区紫竹科学园区,有着半导体芯片巨头英特尔的中国区公司,定义了GPU的英伟达,其中国区公司也在上海。
除了大模型之外,上海也是上一波深耕计算机视觉的“AI四小龙”商汤科技、依图科技的发源地。2019年,上海浦东新区成为全国第一个人工智能先导区。现在,上海交大、复旦、同济、上大等13所高校和5个科研院所都设立了人工智能相关学科点。
AI扶持政策上,上海在全国范围内都跑得很快。去年9月,上海出台了全国首部AI省级法规《上海市促进人工智能产业发展条例》,提到上海市推动算法模型交易流通,上海市经济信息化部门会同相关部门指导行业组织制定人工智能算法模型推荐目录,降低算法模型交易风险,提高算法模型交易效率。《条例》指出,上海市支持相关主体开展基于先进架构的高效能智能芯片设计创新,研制云端芯片和云端智能服务器,布局类脑芯片,强化软硬件协同适配,支持联合建设研发测试和应用平台,加强技术协同和芯片架构互联互通,提升智能芯片产品和技术竞争力,培育智能芯片应用生态体系。
三、深圳:11个
在深圳龙岗政数局的行政服务大厅,大模型已应用于政务咨询服务系统,背后提供支撑的就是云天励飞技术股份有限公司名为“天书”的大模型。这家AI公司今年4月4日登陆科创板,是“深圳人工智能第一股”,目前市值229亿元。
深圳另一家做自然语言处理技术的追一科技,今年也发布了其自主研发的大模型“博文Bowen”,落地于金融、政务等垂直场景。
此外,深圳也有大模型科研力量。在深圳福田,前微软全球执行副总裁、AI及技术研发体系负责人沈向洋挂帅的IDEA研究院,推出了开源通用大模型“姜子牙”系列并开源封神榜第99个通用大模型“姜子牙通用大模型v1”。姜子牙大模型拥有130亿参数,可进行千亿token量级预训练。同时,香港中文大学(深圳)和深圳市大数据研究院训练并开源了一个医疗大模型——HuatuoGPT(华佗GPT),以使语言模型具备像医生一样的诊断能力和提供有用信息的能力。
“北京做的是0到1的事情,上海做的是从1到10的事情,深圳则是做从10到100的事情。”一位专注深圳人工智能企业的研究人士这样形容深圳在AI领域与北京、上海的不同。在他看来,深圳的AI公司擅长的是最上层AI应用,可能还要等半年到1年时间,才是深圳公司大显身手的时刻。
前不久,上述人士对当地大模型公司做了摸底工作,最新数据是,深圳有11家做大模型的公司和机构,其中既有通用大模型,也有行业大模型。
当然,深圳AI毫无疑问的龙头公司还是华为。7月7日下午,华为发布盘古大模型3.0,并且华为也提供算力,7月6日,华为旗下算力解决方案昇腾AI集群全面升级,集群规模从最初的4000卡集群扩展至16000卡,为业界首个万卡AI集群。
5月31日,深圳市印发《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》,同步发布首批“城市+AI”应用场景清单,统筹设立规模1000亿元的人工智能基金群,以最充足的算力、最大的政策支持、最优的产业生态、最好的人才环境、最丰富的场景应用,打造国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区。
上述研究人士告诉经济观察报,由于大模型创业门槛比较高,需要顶尖人才,偏基础研究,在大模型发展早期,北京这样高校多的城市有优势。深圳制造业发达,将来会强在应用端和产业化。
7月4日,深圳市人工智能产业协会研究团队发布的《深圳市人工智能产业发展白皮书(2023年度)》显示,2022年,深圳市人工智能产业规模达2488亿元。
其中,深圳市人工智能核心产业规模达308亿元,同比增长52.48%;企业数量方面,2022年,深圳市人工智能企业数量达1920家;产业链分布方面,2022年,深圳市人工智能基础层仅占企业总数量的8.13%,技术层占企业总数量的17.29%,应用层占企业总数量的74.58%;区域分布方面,2022年,深圳市人工智能企业主要集中在南山、宝安两区,合计占比高达58.1%。其中,南山区数量占36.8%,宝安区占21.3%。
四、杭州:8个
据经济观察报不完全统计,杭州的大模型有8个,最大的是阿里云的通义大模型家族,此外还有西湖心辰的西湖、宇视科技的梧桐、恒生电子的Light-GPT、蚂蚁集团的贞仪、新华三H3C的百业灵犀、实在智能的塔斯、网易伏羲的玉言。
杭州AI龙头是阿里巴巴,目前,阿里云通义大模型家族已经有3款大模型,包括通义千问、通义听悟和通义万相。阿里巴巴旗下的蚂蚁集团也发布了贞仪大模型。
杭州另一股AI力量来自网易。在2023世界人工智能大会上,网易伏羲多款AI大模型产品首次亮相,包括“玉言”“丹青”等。
浙江西湖边上,还坐落着一家大模型创业公司西湖心辰,这家公司与西湖大学等科研机构合作,融合了学院派的力量,发布了西湖大模型。今年以来,西湖心辰获得了百度、汤姆猫的投资,其最新一轮融资发生在7月,完成超亿元战略融资。
据IDC与浪潮信息联合发布的系列《中国人工智能计算力发展评估报告》,近五年,杭州稳居十大算力城市的前三席,与北京、深圳角逐,显示出强大的竞争力。
在算力载体方面,杭州拥有阿里云城市大脑、海康威视视频感知国家新一代人工智能开放创新平台,以及脑与脑机融合前沿科学中心、人工智能协同创新中心、国家数据智能技术创新中心等国家级创新平台。
同时,杭州的科技公司还找到了一个现成的试验场:电商产业。作为电子商务之都,频繁更新的内容生产需要催生了电商对于AIGC的市场需求,这成为当前AIGC在杭州市场化落地的支柱项目。目前杭州科技企业的AIGC服务已经能实现电商场景的快速搭建,除了营销文字外,商家所需要的产品介绍,图片素材都可以通过AIGC自动生成。去年流行一时的AI绘画,部分新媒体已经在使用的AI内容生成等,杭州企业的相关产品也已推出。
政策方面,去年底杭州发布《2022年杭州市第三批重点建设的人工智能应用场景清单》,涉及智慧城市、智慧制造、智慧医疗、智慧交通、智慧金融等多个领域,共46个重点建设人工智能应用场景入选。今年6月,杭州市经信局起草了《关于加快推进人工智能产业创新发展的实施意见(征求意见稿)》,现向社会公开征求意见。
目前之江实验室、阿里达摩院、浙江大学等科研院校都在加大对AIGC领域的研究。
五、广州:4个
据经济观察报不完全统计,广州有4个大模型,分别是云从科技的从容、华南理工大学未来技术学院的扁鹊和灵心、数说故事的SocialGPT、赛灵力科技的达尔文。
2021年7月,广州市科学技术局就发布了《广州市人工智能产业链高质量发展三年行动计划(2021-2023年)(征求意见稿)》,提出广州将重点打造1项具有国际影响力的人工智能创新大赛、建设10个人工智能产业园,打造100个人工智能典型应用场景,培育超1000家人工智能企业。
去年9月,广州市发布了《广州市促进创新链产业链融合发展行动计划(2022—2025年)》点出六大重点行动。
六、成都:3个
据不完全统计,成都已发布的大模型有3个:晓多科技与国家超算成都中心联合发布的晓模型XPT、医联科技发布的medGPT、明途科技的workChat数字人。
今年5月,晓模型(XPT)发布,这是基于大语言模型技术开发的面向电商行业的垂类大模型。5月 25日,医联发布了国内首款医疗大语言模型——MedGPT,致力于在真实医疗场景中发挥实际诊疗价值,实现从疾病预防、诊断、治疗、康复的全流程智能化诊疗能力。5月31日,明途科技正式发布明途workChat数字人,功能包含知识问答、AI写作、知识采集、辅助工具等。
今年5月,《2023年成都市大数据与人工智能(含车载智能控制系统)产业建圈强链工作要点》印发,17条细化举措,给予成都大数据与人工智能(含车载智能控制系统)产业链发展“路线图”。
成都市的目标是,今年力争培育国家级人工智能专精特新“小巨人”企业5家、上市企业1家、上规企业10家,人工智能产业规模突破700亿元。
成都市提出,鼓励高校、科研机构、龙头企业联合算力中心聚焦重点产业领域孵化原创AI大模型,并给予建设方每年最高500万元的算力成本补贴,降低企业创新成本。每年发放总额不超过1000万元的算力券,用于支持算力中介服务机构、科技型中小微企业和创客、科研机构、高校等使用国家超算成都中心、成都智算中心的算力资源。
七、南京:3个
身处长三角地区的南京,近年来也在着力发展AI产业。据不完全统计,南京已有3个大模型公司,分别是孩子王公司的KidsGPT、智子引擎的元乘象和硅基智能的炎帝。
孩子王公司的KidsGPT在六一童玩节期间推出,专攻母婴童垂直领域。炎帝大模型是一个多模态的行业模型,企业可以用它做短视频生成、直播生成、电影/电视剧生成、甚至数字永生等方面的工作。智子引擎是一家多模态大模型初创企业,已经完成千万元天使轮融资。该公司背后的核心团队便是中国人民大学高瓴人工智能学院教授卢志武带领的课题组,其大模型产品元乘象ChatImg参数约150亿。
2022年12月,南京市印发《南京国家人工智能创新应用先导区建设实施方案》,提出到2025年,南京将高标准打造5个人工智能产业园区,争创1~2个省级以上人工智能产业集群,培育100家人工智能重点企业,省级以上专精特新小巨人企业和单项冠军企业达到30家,全市人工智能核心产业收入超过500亿元。
未来,南京人工智能计算中心将继续在算力支持之外,为企业客户提供易用的服务及产品,着眼数据、算力、算法等人工智能产业发展核心能力,赋能企业,推动人工智能产业上下游企业在南京聚集。中心计划于近期完成核心伙伴的模型适配验证,将为本地企业孵化行业大语言模型提供强有力的基础模型支撑,在江苏打造行业大模型转商落地标杆示范。
八、其他:11个
其他发布大模型的城市还有天津、合肥、哈尔滨、沈阳、西安、长沙、绵阳、厦门。
天津已有2个大模型公司:国家超级计算天津中心发布的天河天元模型、慧言科技和天津大学联合发布的海河·谛听模型。
在世界人工智能大会期间,国家超算天津中心发布了天河百亿级智能计算开放创新平台和国产中文大模型——天河天元。国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据,以及专业领域的中医、医药、问诊、法律等多种数据集,训练数据集总token数达到350B。
安徽合肥的AI公司代表是科大讯飞。今年5月,科大讯飞发布了星火认知大模型。科大讯飞董事长刘庆峰称,当前讯飞星火认知大模型在文本生成、知识问答、数学能力三大能力上已超ChatGPT。
在合肥高新区,一个围绕智能语音和人工智能领域的产业园区也蓬勃发展起来,被称为“中国声谷”。这里已有1000多家企业入驻,从业人员超过5万人,形成了千亿级的产业集群。
本文来自微信公众号:经济观察报 (ID:eeo-com-cn),作者:任晓宁、陶思羽、谭玉清