近期中国AI技术厂商DeepSeek的AI大模型持续火爆,全球云服务及芯片等众多的科技大厂也从一开始的不敢相信、质疑到认可之后,纷纷下场对DeepSeek模型进行支持。
据《芯智讯》报导,DeepSeek推出的V3和R1两款开源AI模型被认为颠覆了业界对于AI算力需求的观点。特别是DeepSeek推出的推理大模型DeepSeek-R1,其不仅性能比肩OpenAI o1,并且其所需的训练成本可能只有后者的约1/20。这一成就被认为对美国的人工智慧领导地位构成威胁,不仅引发了OpenAI、微软、meta、谷歌等众多大模型厂商的恐慌,还一度引发了英伟达等AI芯片企业的价值重估和股价大跌。
虽然OpenAI和微软官方着手调查DeepSeek可能对OpenAI模型进行不当「蒸馏」的迹象,但是舆论的风向很快地发生了变化。不仅OpenAI CEO奥尔特曼公开承认,「DeepSeek确实是一个非常好的模型,OpenAI会开发出更好的模型,但我们不会像往年那样保持那么大的领先优势了。」
报导说,奥尔特曼还罕见地承认了自己的错误,「我个人认为,在这个问题上我们站错了队,需要想出一个不同的开源策略;不是OpenAI的每个人都持有这种观点,而且这也不是我们目前的最高优先顺序。」
与此同时,亚马逊AWS、微软、阿里云等众多的头部的云服务大厂纷纷上线了基于DeepSeek-R1模型的云服务。同时,英伟达、英特尔、AMD等众多的AI芯片厂商也纷纷宣布了对于DeepSeek模型的支持。
报导指出,随后微软也宣布DeepSeek-R1已在Azure AI Foundry和GitHub上提供,开发者可以用新模型进行测试和构建基于云的应用程序和服务。华为云、腾讯云、百度智能云、阿里云、字节跳动、京东云、中国联通云亦上架DeepSeek-R1和DeepSeek-V3模型,并推出超低价格方案及各种限时免费服务。
其他技术团队包括中科曙光国家先进计算产业创新中心、摩尔线程、天数智芯、沐曦集成电路、华为等科技企业也纷纷投入各种芯片与大模型服务合作;应用端方面,则有盛天网络、万兴科技、易点天下、当虹科技参与大模型适配与多行业垂类场景数据合作。