Anthropic heeft sinds 2024 herhaaldelijk de test voor technische sollicitatiegesprekken voor sollicitanten herzien om door AI ondersteund bedrog tegen te gaan. Het prestatie-optimalisatieteam, verantwoordelijk voor het afnemen van de test, vond dat De vooruitgang op het gebied van AI-coderingstools maakte deze veranderingen noodzakelijk. Teamleider Tristan Hume verklaarde in een blogpost van woensdag dat elk nieuw Claude-model herontwerpen nodig heeft. Claude Opus 4 overtrof de meeste menselijke sollicitanten als ze dezelfde tijdslimiet kregen, terwijl Claude Opus 4.5 de prestaties van topkandidaten evenaarde. Dit elimineerde het vermogen van Anthropic om onderscheid te maken tussen het werk van vooraanstaande menselijke kandidaten en het meest geavanceerde AI-model onder de testomstandigheden die mee naar huis werden genomen. Hume ontwikkelde een nieuwe test die minder gericht was op hardware-optimalisatie, waardoor deze voldoende complex werd om de huidige AI-tools uit te dagen. De originele test werd ook gedeeld in de blogpost, waarin lezers werden uitgenodigd alternatieve oplossingen voor te stellen. In het bericht stond: “Als u Opus 4.5 het beste kunt, horen we graag van u.”





