Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
No Result
View All Result

OpenAI GPT 5.2 lost het wiskundeprobleem van Erdő in 15 minuten op

byAytun Çelebi
19 januari 2026
in Research
Home Research
Share on FacebookShare on Twitter

Het nieuwste model van OpenAI demonstreert een onverwacht vermogen bij het oplossen van wiskundige problemen op hoog niveau, zo blijkt uit tests uitgevoerd door software-ingenieur en voormalig kwantitatief onderzoeker Neel Somani. Somani zag dat het model na 15 minuten verwerking van een probleem in ChatGPT een volledige oplossing genereerde, waarna het bewijs werd geformaliseerd met de Harmonic-tool, wat de nauwkeurigheid ervan bevestigde. Hij verklaarde dat hij ernaar streefde een basislijn vast te stellen voor het vermogen van grote taalmodellen (LLM's) om open wiskundige problemen op te lossen. De gedachtegang van het model beriep zich op wiskundige axioma's, waaronder de formule van Legendre, het postulaat van Bertrand en de stelling van de Davidster. Het vond een Math Overflow-post uit 2013 van de Harvard-wiskundige Noam Elkies, die een soortgelijke oplossing voor het probleem aanbood, maar het uiteindelijke bewijs van ChatGPT verschilde en bood een completere oplossing voor een versie van een probleem van wiskundige Paul Erdős. Sinds de release van GPT 5.2, die Somani omschreef als “anekdotisch beter in wiskundig redeneren dan eerdere versies”, heeft een groeiend aantal opgeloste problemen vragen doen rijzen over het vermogen van LLM's om de menselijke kennis te vergroten. Somani concentreerde zich op de Erdős-problemen, een verzameling van meer dan 1.000 vermoedens die online worden bijgehouden en die variëren qua onderwerp en moeilijkheidsgraad. De eerste autonome oplossingen voor deze problemen kwamen in november naar voren uit AlphaEvolve, een door Gemini aangedreven model. Meer recentelijk hebben Somani en anderen ontdekt dat GPT 5.2 bedreven is in wiskunde op hoog niveau. Sinds december zijn 15 problemen op de Erdős-website verschoven van ‘open’ naar ‘opgelost’, waarbij 11 oplossingen AI-modellen crediteren. Wiskundige Terence Tao, over zijn GitHub-paginamerkte acht problemen op waarbij AI-modellen betekenisvolle autonome vooruitgang boekten en zes gevallen waarin vooruitgang gepaard ging met het lokaliseren en voortbouwen op eerder onderzoek. Tao vermoedde op Mastodon dat de schaalbare aard van AI-systemen ze ‘beter geschikt maakt om systematisch te worden toegepast op de ‘lange staart’ van obscure Erdős-problemen, waarvan er vele feitelijk eenvoudige oplossingen hebben’, en voegde eraan toe dat ‘veel van deze gemakkelijkere Erdős-problemen nu waarschijnlijker zullen worden opgelost door puur op AI gebaseerde methoden dan door menselijke of hybride middelen.’ Een drijvende kracht achter deze vooruitgang is een verschuiving naar formalisering, een arbeidsintensief proces voor het verifiëren en uitbreiden van wiskundig redeneren. Hoewel er geen AI nodig is, hebben nieuwe geautomatiseerde tools dit proces vereenvoudigd. De open-source proefassistent Lean, ontwikkeld door Microsoft Research in 2013, wordt op grote schaal gebruikt voor het formaliseren van bewijzen, en AI-tools zoals Aristoteles van Harmonic streven ernaar een groot deel van dit werk te automatiseren. Tudor Achim, de oprichter van Harmonic, verklaarde dat de betrokkenheid van wiskundigen en professoren in de informatica bij AI-tools van groter belang was dan het aantal opgeloste Erdős-problemen. Achim zei: “Deze mensen hebben een reputatie te beschermen, dus als ze zeggen dat ze Aristoteles of ChatGPT gebruiken, is dat echt bewijs.”


Uitgelicht beeldtegoed

Tags: chatgptwiskunde

Related Posts

Forrester-analist: AI is er niet in geslaagd de mondiale productiviteit te beïnvloeden

Forrester-analist: AI is er niet in geslaagd de mondiale productiviteit te beïnvloeden

20 januari 2026
Hoe AI in slechts zeven dagen VoidLink-malware bouwde

Hoe AI in slechts zeven dagen VoidLink-malware bouwde

20 januari 2026
Appfiguren: De uitgaven voor mobiele apps bereiken een record van 5,8 miljard

Appfiguren: De uitgaven voor mobiele apps bereiken een record van $155,8 miljard

15 januari 2026
Het wereldwijde tekort aan geheugenchips zorgt ervoor dat de pc-prijzen de pan uit rijzen

Het wereldwijde tekort aan geheugenchips zorgt ervoor dat de pc-prijzen de pan uit rijzen

14 januari 2026
Ingenieurs bouwen op sprinkhanen geïnspireerde robots om het leeglopen van de batterij op te lossen

Ingenieurs bouwen op sprinkhanen geïnspireerde robots om het leeglopen van de batterij op te lossen

14 januari 2026
Natuurstudie projecteert 2B draagbare gezondheidsapparaten tegen 2050

Natuurstudie projecteert 2B draagbare gezondheidsapparaten tegen 2050

7 januari 2026

Recent Posts

  • Forrester-analist: AI is er niet in geslaagd de mondiale productiviteit te beïnvloeden
  • Sequoia Capital sluit zich aan bij de financieringsronde van Anthropic ter waarde van $350 miljard
  • TCL wordt eigenaar van 51% van Sony's Bravia TV-merk
  • Adobe lanceert AI-aangedreven Object Mask voor Premiere Pro
  • Netflix schakelt over naar een volledig contant bod op Warner Bros. Discovery

Recent Comments

Geen reacties om weer te geven.
Dataconomy NL

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.