字节跳动豆包团队开源优化技术 训练成本节约四成
当前位置:首页>资讯 >行业资讯 > 人工智能>字节跳动豆包团队开源优化技术 训练成本节约四成

字节跳动豆包团队开源优化技术 训练成本节约四成

2025-03-11 来源:IT之家浏览数:20 国际会展网

核心提示:中国科技巨企字节跳动旗下的豆包大模型团队开源优化技术,令其训练成本节约四成。这一技术已在字节跳动的万卡集群训练中得到实际应用。内部数据显示,自采用该技术以来,已累计节省了数百万GPU(图形处理器)小时的训练算力。

18SZ图片处理

中国科技巨企字节跳动旗下的豆包大模型团队开源优化技术,令其训练成本节约四成。

综合IT之家和快科技星期一(3月10日)报道,上述团队宣布开源混合专家模型(MoE)架构的关键优化技术。此技术通过一系列创新方法,将大模型的训练效率提升约1.7倍,同时也将训练成本降低40%。

这一技术已在字节跳动的万卡集群训练中得到实际应用。内部数据显示,自采用该技术以来,已累计节省了数百万GPU(图形处理器)小时的训练算力。

18SZ图片处理

豆包大模型团队决定开源此技术,是希望通过分享这一技术,推动整个人工智能(AI)社区在模型训练效率方面的共同进步。开源不仅有助于加速行业技术发展,还能为更多研究者和开发者提供宝贵的资源,进一步推动AI技术的创新与应用。

彭博社去年5月引述移动应用数据分析公司Sensor Tower的数据显示,字节跳动推出的豆包大模型,成为中国市场上最受欢迎的AI聊天机器人。

字节跳动否认10亿人民币购买寒武纪晶片

18SZ图片处理

综合中国新京报贝壳财经和21经济网报道,有消息指字节跳动向寒武纪下单4万颗580型号晶片,单价2.5万元,总价值合计10亿元。字节跳动相关负责人回应时说,消息不实。

在上海挂牌的寒武纪,股价星期一(3月10日)午后出现拉升,一度涨超5%,收涨3.87%。

18SZ图片处理

寒武纪官网资料显示,公司成立于2016年,专注于人工智能芯片产品的研发与技术创新,致力于打造人工智能领域的核心处理器芯片,“让机器更好地理解和服务人类”。

18SZ图片处理

21经济网也报道,官网显示,寒武纪目前产品分别为智能加速卡、智能加速系统、智能边缘计算模组、终端智能处理器IP、软件开发平台,涉及芯片有思元220系列、思元270系列、思元290、思元370系列等,但未见到580型号的产品。

Booking.com
打赏
0相关评论
阅读上文 >> 美造船业落后中国200倍 与日韩合作仅略改善落后窘态
阅读下文 >> 小鹏汽车未来或将在人形机器人产业投资上千亿人民币

大家喜欢看的

  • 品牌
  • 资讯
  • 展会
  • 视频
  • 图片
  • 供应
  • 百科
  • 商城

欢迎转发与合作:


本文地址:http://www.18sz.com/news/show.php?itemid=19649

转载本站原创文章请注明来源:国际会展网

行业专题

更多行业专题

微信“扫一扫”
即可分享此文章



友情链接

  • 关注官方订阅号

  • 关注官方服务号

Copyright© 2003-2025 18SZ.com 18SZ B2B SYSTEM All Rights Reserved

服务热线:+86 755 88850315 ICP备案号: