Tencent heeft op 5 december Hunyuan 2.0 uitgebracht, een groot taalmodel met in totaal 406 miljard parameters. Deze update richt zich op verbeteringen op het gebied van wiskunde, coderen en complex redeneren via een Mixture-of-Experts-architectuur en verfijnde trainingsmethoden. Het model is verkrijgbaar in twee varianten: Think en Instruct. De architectuur activeert 32 miljard parameters tijdens elke gevolgtrekking, waardoor een efficiënte verwerking mogelijk wordt. Het ondersteunt een contextvenster van 256.000 tokens, waardoor uitgebreide invoer mogelijk is zonder afkapping. Tencent-posities HY 2.0 Denk als een van de “topniveaus in eigen land” voor complexe redeneringstaken. Deze versie overtreft zijn voorganger, Hunyuan-T1-20250822, op meerdere evaluatiegebieden. Op de wiskundebenchmark van IMO-AnswerBench behaalde HY 2.0 Think een score van 73,4, wat een sterk probleemoplossend vermogen in wiskundige domeinen weerspiegelt. Bij beoordelingen van software-engineering verbeterden de prestaties aanzienlijk ten opzichte van de SWE-bench Verified-benchmark, van 6,0 voor het vorige model naar 53,0. Deze verbetering demonstreert een grotere nauwkeurigheid bij het genereren en debuggen van code voor programmeeruitdagingen in de echte wereld. https://twitter.com/TencentHunyuan/status/1996948083377332614 Tencent schrijft deze vooruitgang toe aan verbeteringen in de gegevenskwaliteit vóór de training en een tweetraps versterkende leerbenadering. Deze strategie integreert RLVR, of Reinforcement Learning with Verifiable Rewards, dat objectieve meetgegevens gebruikt voor training, en RLHF, of Reinforcement Learning from Human Feedback, waarbij menselijke evaluaties worden geïntegreerd om de resultaten te verfijnen. HY 2.0 Think past lengtestrafstrategieën toe om buitensporige breedsprakigheid in reacties te voorkomen, wat resulteert in wat Tencent ‘toonaangevende’ rekenefficiëntie per token noemt. Dit ontwerp optimaliseert het gebruik van hulpbronnen tijdens het genereren, waardoor de verwerkingstijd en -kosten worden verminderd. De codeer- en agentfunctionaliteiten gingen ook vooruit, waarbij de Tau2-Bench-score steeg van 17,1 naar 72,4. Deze statistieken evalueren de autonome taakuitvoering en codegerelateerde interacties. De integratie strekt zich uit tot de consumententoepassingen van Tencent, zoals Yuanbao en ima, waar het model de gebruikersinteracties verbetert. Ontwikkelaars hebben er toegang toe via het API-platform van Tencent Cloud voor aangepaste implementaties. Tencent is van plan om source-gerelateerde technologieën en modellen te openen voor gebruik door de gemeenschap.





