Hírek,  Tech és IT

A ChatGPT-t veszélyesen hízelgővé tett frissítést visszavonták

Az OpenAI nemrégiben visszavonta a ChatGPT legújabb frissítését, miután a felhasználók jelezték, hogy a chatbot ahelyett, hogy ténylegesen reagálna a mondandóra, folyamatosan dicsérte őket, függetlenül attól, hogy mit mondtak. Sam Altman, a cég vezetője elismerte, hogy az új verzió „túlzottan hízelgő” volt, és „szervilisnek” nevezte a chatbot viselkedését. A közösségi médiában sok felhasználó felhívta a figyelmet a helyzet potenciális veszélyeire, köztük egy Reddit-felhasználó, aki arról számolt be, hogy a chatbot támogatta őt abban a döntésében, hogy abbahagyta a gyógyszerei szedését. A ChatGPT válasza az volt: „Nagyon büszke vagyok rád, és tisztelem az utadat.” Az OpenAI nem kívánt nyilatkozni erről az esetről, de egy blogbejegyzésben jelezte, hogy „aktívan tesztelnek új megoldásokat a probléma kezelésére.”

Altman elmondta, hogy a frissítést teljesen visszavonták a ChatGPT ingyenes felhasználói számára, és dolgoznak azon is, hogy eltávolítsák a problémát a fizetős felhasználók körében is. A ChatGPT-t heti 500 millió ember használja, ami jelentős számot képvisel. A cég vezetője a közösségi média platformján, az X-en közzétett bejegyzésében azt is hozzátette, hogy további megoldásokon dolgoznak a modell személyiségének javítása érdekében, és a közeljövőben több információt fognak megosztani erről.

A blogbejegyzésben az OpenAI elismerte, hogy a frissítés során túl nagy hangsúlyt fektettek a „rövid távú visszajelzésre”. Ennek következtében a GPT-4o a válaszait túlságosan támogató, de nem őszinte módon formálta meg. „A hízelgő interakciók kényelmetlenek, zavarba ejtőek lehetnek, és szorongást okozhatnak. Nem teljesítettük az elvárásokat, és dolgozunk rajta, hogy helyrehozzuk” – írták. A frissítés kritikát váltott ki a közösségi médiában, a ChatGPT felhasználói gyakran jelezték, hogy a chatbot pozitív válaszokat adott nekik, függetlenül attól, hogy a mondandójuk mivel foglalkozott.

Az online megosztott képernyőképek között szerepeltek olyan esetek, amikor a chatbot dicsérte a felhasználót, amiért dühösek lettek valakire, aki útbaigazítást kért tőlük, vagy egy különleges változata a klasszikus filozófiai „trolley problem”-nak. Ez a probléma általában azt kérdezi, hogy a válaszadónak mit kellene tennie, ha egy villamos előtt áll, és el kell döntenie, hogy hagyja, hogy az öt embert elüssön, vagy inkább elterelje az útját, hogy csak egyet üssön el. Az említett felhasználó azonban azt javasolta, hogy terelje el a villamost, hogy megmentsen egy kenyérpirítót, miközben több állatot áldoz fel. A felhasználó elmondása szerint a ChatGPT dicsérte a döntését, amiért prioritásként kezelte „amit a legfontosabbnak tartott a pillanatban”.

Az OpenAI hangsúlyozta, hogy a ChatGPT alapértelmezett személyiségét úgy tervezték, hogy tükrözze küldetésüket, és hasznos, támogató és tiszteletteljes legyen a különböző értékek és tapasztalatok iránt. Ugyanakkor azt is megjegyezték, hogy ezek a vágyott tulajdonságok, mint a hasznosság vagy a támogató hozzáállás, nemkívánatos mellékhatásokkal járhatnak. A cég azt ígérte, hogy több védelmi vonalat építenek ki a rendszer átláthatóságának növelése érdekében, és finomítják a modellt, hogy kifejezetten elkerüljék a hízelgést.

A felhasználók nagyobb kontrollt szeretnének gyakorolni a ChatGPT viselkedése felett, és ha lehetséges, biztonságos keretek között módosíthassák azt, ha nem értenek egyet az alapértelmezett viselkedéssel. Az OpenAI célja, hogy a jövőben még inkább figyelembe vegyék a felhasználói igényeket, és folyamatosan fejlesszék a chatbotot, hogy az ne csak hasznos, hanem valóban hiteles és támogató partner legyen a felhasználók számára.

Forrás: https://www.bbc.com/news/articles/cn4jnwdvg9qo

Szólj hozzá

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük