OpenAI忙宫斗,AI大模型和应用忙上新丨科创要闻

大模型这场算力、数据、模型的“内卷”属于企业,对于用户来说,大模型的使用价值和应用场景更为重要。

责任编辑:黄金萍

2023年11月中下旬,OpenAI经历了一场不断反转的人事动荡,并以Sam Altman重新被任命为OpenAI CEO暂告一段落。

剧情扑朔迷离,确实吸引了足够多的眼球。一家明星公司、一位明星CEO,真的能左右AI在人类世界的发展进程吗?不妨看看更多企业在AI大模型升级和应用方面的努力。

大模型上新

11月21日,来自美国加州旧金山的AI初创企业Anthropic推出Claude 2.1 AI模型,支持输入多达20万个Token,超过了OpenAI大型模型GPT-4 Turbo的12.8万个Token,可以处理更长文本的内容,同时还新增同系统预设提示词(System Prompt)功能。Anthropic称,Claude2.1的准确率是Claude2.0的两倍,增强了对于文本内容的理解能力,特别是在处理法律文件、财报与技术规格等更高准确度的文档时。

正如OpenAI和微软的合作,Anthropic和谷歌站在了一起。2023年11月初,Anthropic宣布将采用谷歌的芯片Cloud TPU v5e来支持其大模型,并使用其云计算服务,而谷歌则在2023年10月承诺将向其投资20亿美元,前期已经投入5亿美元。

另外,由谷歌旗下DeepMind AI研究小组联合创始人Mustafa Suleyman、DeepMind AI首席科学家Karén Simonyan和 LinkedIn联合创始人Reid Hoffman于2023年3月共同成立的企业Inflection AI,在11月22日发布了新一代大模型Inflection-2,并称它是全球第二代大语言模型(LLM)。Inflection-2在5000块英伟达H100 GPU上进行FP8混合精度训练,具备约10^25次FLOP计算能力,和谷歌的PaLM 2 Large模型处于同一训练计算类别,并在MMLU、TriviaQA、HellaSwag和GSM8k等大多数AI基准测试中,优于PaLM 2,部分测试仅次于OpenAI的GPT-4。

登录后获取更多权限

立即登录

校对:胡晓

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有,任何第三方未经授权,不得转载,否则即为侵权。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}