Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
No Result
View All Result

GPT-4.5 Out-humans mensen in een nieuwe test

byKerem Gülen
3 april 2025
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

Openai’s GPT-4.5 overtroffen Mensen in een recente Turing-test van UC San Diego, laten zien hoe gemakkelijk mensen AI kunnen verwarren met een echt gesprek door samen te vullen met side-by-side chats.

De Turing-test heeft al lang gemeten of een machine als mens kan passeren door middel van tekstgebaseerde interactie. In deze bijgewerkte versie praatten bijna 300 deelnemers uit de taal- en cognitielab van UC San Diego elk met een mens en een AI voordat ze besloten welke welke was.

GPT-4.5, uitgerust met een popcultuur-savvy persona, overtuigde de deelnemers dat het 73 procent van de tijd mens was-nou boven de 50 procent benchmark die historisch werd gebruikt om een ​​pass te definiëren. Werkelijke mensen hebben deelnemers niet zo vaak voor de gek gehouden.

Andere systemen waren LLAMA 3 van Meta, Openai’s GPT-4O en Eliza, een van de vroegste chatbots. Zonder een gedefinieerde persona daalde het slagingspercentage van GPT-4.5 tot 36 procent en scoorde GPT-4O slechts 21 procent.

Onderzoekers merken op dat het doorlopen van de Turing -test niet betekent dat een AI de taal als een persoon echt begrijpt. Toch onderstrepen de resultaten hoe overtuigend deze modellen het menselijk gesprek kunnen nabootsen, vooral wanneer ze specifieke rollen krijgen. De bevindingen worden momenteel gepubliceerd op een preprint-server, met een peer-reviewed release in behandeling.


Uitgelichte afbeeldingskrediet

Tags: GPT-4.5openAI

Related Posts

Netflix lanceert realtime interactief stemmen voor de livepremière van Star Search

Netflix lanceert realtime interactief stemmen voor de livepremière van Star Search

21 januari 2026
Netflix plant een herontwerp van de mobiele app in 2026 om de dagelijkse gebruikersbetrokkenheid te vergroten

Netflix plant een herontwerp van de mobiele app in 2026 om de dagelijkse gebruikersbetrokkenheid te vergroten

21 januari 2026
OpenAI dwingt veiligheidsfilters af voor tieners via gedragsmatige leeftijdsvoorspelling

OpenAI dwingt veiligheidsfilters af voor tieners via gedragsmatige leeftijdsvoorspelling

21 januari 2026
Setapp Mobile stopt per 16 februari met zijn activiteiten in de EU

Setapp Mobile stopt per 16 februari met zijn activiteiten in de EU

21 januari 2026
Google lanceert gratis SAT-oefenexamens in Gemini met Princeton Review

Google lanceert gratis SAT-oefenexamens in Gemini met Princeton Review

21 januari 2026
Samsung lekt en verwijdert vervolgens de Bixby-revisie met Perplexity-zoekopdracht

Samsung lekt en verwijdert vervolgens de Bixby-revisie met Perplexity-zoekopdracht

21 januari 2026

Recent Posts

  • JWST identificeert SN Eos: de meest afgelegen supernova ooit spectroscopisch bevestigd
  • Netflix lanceert realtime interactief stemmen voor de livepremière van Star Search
  • Snap betaalt miljoenen om rechtszaak over tienerverslaving te schikken
  • De CEO van Anthropic hekelt de VS en Nvidia over de verkoop van AI-chips aan China
  • Netflix plant een herontwerp van de mobiele app in 2026 om de dagelijkse gebruikersbetrokkenheid te vergroten

Recent Comments

Geen reacties om weer te geven.
Dataconomy NL

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.