OpenAI忙宫斗，AI大模型和应用忙上新丨科创要闻

原创 2023-11-27 科创力

大模型这场算力、数据、模型的“内卷”属于企业，对于用户来说，大模型的使用价值和应用场景更为重要。

南方周末研究员唐家乐

责任编辑：黄金萍

2023年11月中下旬，OpenAI经历了一场不断反转的人事动荡，并以Sam Altman重新被任命为OpenAI CEO暂告一段落。

剧情扑朔迷离，确实吸引了足够多的眼球。一家明星公司、一位明星CEO，真的能左右AI在人类世界的发展进程吗？不妨看看更多企业在AI大模型升级和应用方面的努力。

大模型上新

11月21日，来自美国加州旧金山的AI初创企业Anthropic推出Claude 2.1 AI模型，支持输入多达20万个Token，超过了OpenAI大型模型GPT-4 Turbo的12.8万个Token，可以处理更长文本的内容，同时还新增同系统预设提示词(System Prompt)功能。Anthropic称，Claude2.1的准确率是Claude2.0的两倍，增强了对于文本内容的理解能力，特别是在处理法律文件、财报与技术规格等更高准确度的文档时。

正如OpenAI和微软的合作，Anthropic和谷歌站在了一起。2023年11月初，Anthropic宣布将采用谷歌的芯片Cloud TPU v5e来支持其大模型，并使用其云计算服务，而谷歌则在2023年10月承诺将向其投资20亿美元，前期已经投入5亿美元。

另外，由谷歌旗下DeepMind AI研究小组联合创始人Mustafa Suleyman、DeepMind AI首席科学家Karén Simonyan和 LinkedIn联合创始人Reid Hoffman于2023年3月共同成立的企业Inflection AI，在11月22日发布了新一代大模型Inflection-2，并称它是全球第二代大语言模型（LLM）。Inflection-2在5000块英伟达H100 GPU上进行FP8混合精度训练，具备约10^25次FLOP计算能力，和谷歌的PaLM 2 Large模型处于同一训练计算类别，并在MMLU、TriviaQA、HellaSwag和GSM8k等大多数AI基准测试中，优于PaLM 2，部分测试仅次于OpenAI的GPT-4。

登录后获取更多权限

立即登录

校对：胡晓

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有，任何第三方未经授权，不得转载，否则即为侵权。

科创人工智能 OpenAI 减肥疗法