在中国人工智能(AI)初创企业深度求索(DeepSeek)震撼全球后,其他以发布低成本、高性能生成式的AI企业实力也正在逐步壮大,多款中国AI大语言模型开发商─包括月之暗面(Moonshot AI)开发的Kimi k1.5─也陆续登场。原先由美国初创企业为中心的AI性能竞争赛场迎来美中对抗的全新局面。
据《日经中文网》指出,深度求索发布生成式AI大语言模型DeepSeek R1仅仅约2个小时后,另一款由中国月之暗面公司开发的Kimi k1.5也正式公开,并在全球AI工程师群体中引发热议。
月之暗面表示,「Kimi k1.5」的推理能力超过了美国Anthropic的「Claude 3.5 Sonnet」,性能与美国OpenAI在2024年9月发布的新模型「OpenAI o1」相当。
报导说,月之暗面成立于2023年,创始人杨植麟来自北京的清华大学,并在美国宾州卡内基梅隆大学(Carnegie Mellon University)获得博士学位,他邀请了谷歌与华为从事过AI开发工作的人员,在北京设立了月之暗面新创企业。据美国调查公司CB Insights的数据,截至今年1月,月之暗面的企业估值已达到33亿美元。
除月之暗面外,2019年成立的「智谱AI(Zhipu AI)」、2021年成立的「MiniMAX」以及2023年成立的百川智慧(Baichuan AI)等,也作为主要的中国独角兽企业(估值超过10亿美元的未上市企业)而知名,并且都在竞相开发AI模型。
从资金上支持这些AI初创企业的是中国的网际网络相关企业等IT巨头,例如月之暗面成立仅一年就获得阿里巴巴融资10亿美元以及腾讯的投资,智谱AI、百川智慧和MiniMAX也都获得了阿里巴巴和腾讯的投资。清华大学、北京大学和中国科学院等从事AI研究的学术机构成为人才供应源,这也推动了AI初创企业的成长。
报导说,对AI三大顶级学会被引用论文的调查显示,在2024年作者人数排行榜上排名前100的机构中,美国占37家,中国机构占31家,仅次于美国。清华大学和北京大学等的被采纳论文作者人数增加了3~4倍,DeepSeek创始人梁文锋的母校——浙江大学的作者人数从2020年的34人猛增至2024年的906人,排名从第89位上升到了第6位。DeepSeek最新生成AI模型R1论文的许多核心研究者也来自排名靠前的大学,比如清华大学(第2名)、北京大学(第6名)、中山大学(第65名)、北京航空航天大学(第90名)等,它们都是政府在预算优先分配与支持的「国家重点大学」。
此外,大型中企也在推进自主AI的开发。阿里巴巴旗下的阿里云发布了「通义千问(Qwen)」最新版本「2.5-Max」,声称其性能超过了DeepSeek的V3。腾讯、字节跳动、百度及华为等也在加快提高AI的性能。
报导表示,「DeepSeek冲击」表明中国在国家层面推进的AI战略正在取得成果。如果未来初创企业继续增加并参与到性能竞争之中,美国在AI领域的优势可能会受到挑战。