继3月初推出新一代快思考模型混元Turbo S后,腾讯星期五(3月21日)深夜宣布推出自研深度思考模型混元T1正式版。
综合中国基金报和证券时报网报道,据介绍,腾讯混元T1正式版以混元Turbo S为基础打造,亮点在于能秒回、吐字快、擅长超长文处理。
这款强推理模型是工业界首次将混合Mamba架构无损应用于超大型推理模型,性能保持业界领先。这一架构显著降低了训练和推理成本,让混元T1实现首字秒出,吐字速度达到最快每秒80 tokens。
混元T1在超长文本推理领域也展现出独特优势,能够有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时,混合Mamba架构针对长序列处理进行了专项优化,提升了解码速度。
混元T1目前已在腾讯云官网上线。价格方面,输入价格为每百万tokens1元(人民币,下同,0.18新元),输出价格为每百万tokens4元。