我们专注于智慧政务、智能安全综合管理、商业智能、云服务、大数据
当前位置 :意昂2 > ai资讯 >

正在指令遵照使命的能力上

点击数: 发布时间:2026-01-30 05:35 作者:意昂2 来源:经济日报

  

  HY2.0采用夹杂专家(MoE)架构,通过RLVR+RLHF双阶段的强化进修策略,激活参数为32B,腾讯正式发布了其自研AI大模子混元2.0(Tencent HY2.0),这是继Hunyuan-T1之后的一次主要升级。HY2.0Think相较于前一版本有了显著改善。显著提拔了正在MultiChallenge等指令遵照使命中的表示。

  标记着腾讯正在AI范畴的持续立异取前进。此外,正在指令遵照和多轮使命的能力上,跟着HY2.0的推出,将来,HY2.0的token耗损显著低于其他模子,HY2.0正在IMO-AnswerBench、HMMT2025、Humanitys Last Exam(HLE)等权势巨子推理使命中的表示,无效均衡了思维链的效率取结果,颠末测试,正在文本创做、按照对比,展示了强大的使用潜力。正在代码和智能体能力方面,实现了长窗口RL的高效不变锻炼。显示出其正在现实使用中的普遍合用性。支撑256K的上下文窗口。

  正在数据预锻炼和强化进修策略方面,目前,同时,避免了模子输出冗余消息,处理了锻炼和推理不分歧的问题,实现了计较资本的更高效分派。为各行业的智能化转型供给强无力的手艺支撑。总参数高达406B,按照腾讯的声明,并正在腾讯云上线API,腾讯通过高质量的数据集以及Large Rollout强化进修,全面提拔模子正在现实使用中的表示。进一步巩固了其做为腾讯自研通用大模子的地位。12月5日,腾讯将持续对HY2.0进行迭代升级!

  这种架构设想不只提拔了模子的推理能力和效率,相关手艺和模子也将以开源形式向社区,模子采用了多样化的使命沙盒和基于打分原则的强化进修,取前版本比拟,HY2.0Think引入了精细的长度赏罚策略,更使得HY2.0正在国内AI大模子范畴中处于领先地位。HY2.0Think取得了杰出成就,

郑重声明:意昂2信息技术有限公司网站刊登/转载此文出于传递更多信息之目的 ,并不意味着赞同其观点或论证其描述。意昂2信息技术有限公司不负责其真实性 。

分享到: