互联网大厂逐浪GPT,“大模型背后是云计算的竞争”

越是聪明的大语言模型,参数量必然越大,这意味着每一次计算都要消耗更多的算力。换句话说,AI每回答一次问题,背后的成本都是高昂的。

大模型竞争背后实际是云计算的竞争。中国前四大云计算厂商,阿里云、华为云、腾讯云和百度智能云合占市场总额的八成。

各行各业的开发者不必再 “重复造轮子”,只需在云上找到所需要的模型,这能降低中小企业的AI开发成本。

(本文首发于2023年4月27日《南方周末》)

责任编辑:张玥

4月底,如果你在首都国际机场出发,就会看到一个个云计算厂商的海报灯牌,走到登机口就能集齐四大云计算厂商的广告。(南方周末记者 周小铃/图)

2023年,火爆全球的ChatGPT仿佛是一个从天而降的指南针,给全球科技企业明确了一条能够通往“人工智能”这片新大陆的航线。

从输出文本、回答问题到协助办公、写诗作画,大语言模型的惊艳表现激发了全球科技企业对人工智能更大的想象空间。在中国,谁能拥有类似ChatGPT的技术,就意味着谁将获得未来人工智能时代的入场券。

IDC中国副总裁兼首席分析师武连峰曾表示,“大模型的背后蕴藏着一场人工智能落地模式的变革。”这种变革体现在,依托生成式预训练的大语言模型,人们与机器之间得以自在沟通,而机器也能“理解”人们语言中的意图。

在即将过去的4月,每隔几天就有一家公司公布其研发的大模型进展。

华为大盘古模型、阿里通义千问、腾讯混元大模型、360智脑大模型、商汤科技日日新……各家大企业纷纷秀自己人工智能的“肌肉”。美团、搜狗的前高管、元老相继宣布投身大模型创业。

北京理工大学副教授、知名汉语分词系统ICTCLAS创始人、大数据搜索与挖掘实验室主任张华平告诉南方周末记者,大多数大模型未公布最新的详细技术文档或研究论文,无法从原理结构上断定它们的差异,但大模型最终会服务于这些互联网企业的核心业务,完善他们的业务生态,这些模型的差异也会最终体现在这些具体的业务中。

一位做过多家云厂商分销商的受访者对南方周末记者说,现在还看不出来哪家的大模型比较好。

4月底,如果你在首都国际机场出发,就会看到一个个云计算厂商的海报灯牌,走到登机口就能集齐四大云计算厂商的广告,即阿里云、华为云、腾讯云和百度智能云。

据民生证券统计,目前中国已发布超过三十个大模型。投身大模型创业的出门问问创始人、CEO李志飞则预计,中国未来1-2年会看到50家以上公司做大模型。

一场关于人工智能与云计算的竞争在中国互联网企业中间悄然拉开序幕。

得算力者得AI

GPT-1向GPT-2、GPT-3迭代,参数量分别是1.17亿、15亿、1750亿,参数规模正以指数级速度增长。

越是聪明的大语言模型,参数量必然越大,这意味着每一次计算都要消耗更多的算力。换

登录后获取更多权限

立即登录

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有,任何第三方未经授权,不得转载,否则即为侵权。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}