阿里巴巴发布开源人工智能模型 可通过视频解读人类情绪
当前位置:首页>资讯 >行业资讯 > 人工智能>阿里巴巴发布开源人工智能模型 可通过视频解读人类情绪

阿里巴巴发布开源人工智能模型 可通过视频解读人类情绪

2025-03-13 来源:路透社浏览数:22 国际会展网

核心提示:阿里巴巴发布一款新的人工智能(AI)模型,据称能够通过视频识别人类情绪,意在超越OpenAI的最新模型。阿里巴巴旗下的通义千问实验室星期二(3月11日)开源R1-Omni模型,并形容这是业界首个将具有可验证奖励的强化学习(RLVR)应用于全能多模态大语言模型。

18SZ图片处理

阿里巴巴发布一款新的人工智能(AI)模型,据称能够通过视频识别人类情绪,意在超越OpenAI的最新模型。

综合彭博社和中国《科创板日报》报道,阿里巴巴旗下的通义千问实验室星期二(3月11日)开源R1-Omni模型,并形容这是业界首个将具有可验证奖励的强化学习(RLVR)应用于全能多模态大语言模型。

可验证奖励的强化学习(RLVR)正是深度求索(DeepSeek)模型R1的训练模式。

18SZ图片处理

开发团队称,研究人员利用RLVR对开源Omni模型HumanOmni-0.5B进行优化,在推理能力、情感识别准确性和泛化能力三个关键方面显著提高性能。据称,R1-Omni能更清楚地理解视觉和听觉信息如何促进情绪识别,明确展示哪些模态信息对特定情绪的判断起到关键作用。

在两场演示视频中,R1-Omni能推测视频中人物的情绪状态,并描述其服饰和周围环境。这为所谓的计算机视觉增加新的理解层次。

让人工智能解读并回应人类情绪,早已成为科技行业的一个重要目标。目前能够识别人类心理状态和健康状况的技术已被广泛应用,如客户服务聊天机器人,或用于特斯拉等电动汽车以识别司机是否疲劳驾驶。

18SZ图片处理

在DeepSeek-R1亮相震撼全球科技圈后,阿里巴巴也加快在AI领域争取领先地位的步伐,其对标DeepSeek的模型“通义千问”成了苹果在中国大陆市场的AI合作伙伴,为中国iPhone用户提供AI服务。

目前阿里似乎还打算与OpenAI一争高下。今年早些时候,OpenAI推出GPT-4.5模型,据称能更好地识别和响应用户书面提问中的微妙线索。但该模型价格不菲:最初仅向月费200美元的付费用户开放。

18SZ图片处理

而阿里巴巴则不收取任何费用,开放所有人使用R1-Omni模型,目前阿里已在Hugging Face平台上免费让用户下载使用该模型。

尽管当前的演示仅展示R1-Omni模型识别“高兴”或“愤怒”等基本情绪的能力,但能从视觉线索推导情绪的能力仍具有重要意义。阿里巴巴首席执行官吴泳铭在2月份告诉分析师,人工通用智能(AGI)已成为阿里巴巴的“首要目标”,而情绪智能是实现这一目标的重要一步。

Booking.com
打赏
0相关评论
阅读上文 >> 英国研究机构:中国二月引领电动车购买量同比增49%
阅读下文 >> 投行瑞银集团获准脱售瑞信在华证券业务36%股权

大家喜欢看的

  • 品牌
  • 资讯
  • 展会
  • 视频
  • 图片
  • 供应
  • 百科
  • 商城

欢迎转发与合作:


本文地址:http://www.18sz.com/news/show.php?itemid=19663

转载本站原创文章请注明来源:国际会展网

行业专题

更多行业专题

微信“扫一扫”
即可分享此文章



友情链接

  • 关注官方订阅号

  • 关注官方服务号

Copyright© 2003-2025 18SZ.com 18SZ B2B SYSTEM All Rights Reserved

服务热线:+86 755 88850315 ICP备案号: