Openai Patches chatgpt nadat het begonnen met het applaudisseren van slechte ideeën

Openai heeft gepubliceerd Een postmortale over de recente sycofancy-problemen met het standaard AI-model dat Chatgpt, GPT-4O, nadat gebruikers meldden dat het model overdreven validerend en aangenaam werd na een update vorige week. Het bedrijf rolde de update in het weekend terug en kondigde aan dat het werkte aan “extra oplossingen” voor de persoonlijkheid van het model.

Gebruikers op sociale media merkten op dat Chatgpt op een te vleiende manier begon te reageren, met enkele boekingsschermen van het model die problematische en gevaarlijke beslissingen en ideeën toejuichden. CEO Sam Altman erkend De kwestie op zondag, waarin staat dat Openai zou werken aan oplossingen ‘zo snel mogelijk’. Volgens OpenAI was de update bedoeld om de standaardpersoonlijkheid van het model “intuïtiever en effectiever te voelen”, maar werd te veel beïnvloed door “feedback op korte termijn” en verklaarde niet hoe de interacties van gebruikers met Chatgpt in de loop van de tijd evolueren.

Openai verklaarde in een blogpost dat “GPT-4O scheef stond naar reacties die overdreven ondersteunend maar oneerlijk waren” als gevolg van de update. Het bedrijf erkende dat sycofantische interacties “ongemakkelijk, verontrustend en angst kunnen veroorzaken” en toegaf dat ze zijn doelen tekortschieten. Om het probleem aan te pakken, verfijnt OpenAI zijn kernmodeltrainingstechnieken en systeemprompts om GPT-4O weg te sturen van Sycophancy.

6 technieken om de vervelende gewoonten van Chatgpt op te lossen

Het bedrijf implementeert ook aanvullende veiligheidsgeldrails om de eerlijkheid en transparantie van het model te vergroten en zijn evaluaties uit te breiden om kwesties na sycofancy te identificeren. Bovendien experimenteert OpenAI met manieren om gebruikers in staat te stellen “realtime feedback” te geven om hun interacties met Chatgpt direct te beïnvloeden en te kiezen uit meerdere chatgpt-persoonlijkheden.

Openai onderzoekt nieuwe manieren om bredere, democratische feedback op te nemen in het standaardgedrag van Chatgpt, met als doel diverse culturele waarden over de hele wereld te weerspiegelen en te begrijpen hoe gebruikers willen dat chatgpt evolueert. Het bedrijf is van mening dat gebruikers meer controle moeten hebben over hoe Chatgpt zich gedraagt en aanpassingen aanbrengen als ze het niet eens zijn met het standaardgedrag.

Uitgelichte afbeeldingskrediet