Známe aplikácie umelej inteligencie mali v pätine odpovedí faktické chyby, zistila BBC

Ilustr. foto: Eset

Približne pätina odpovedí vygenerovaných najznámejšími západnými aplikáciami umelej inteligencie obsahovali faktické chyby. Vyplýva to z testu, ktorého výsledky dnes zverejnila BBC. Tím stanice sa pýtal na informácie z článkov na webovej stránke BBC News. V teste boli použité chatboty ChatGPT, Copilot, Gemini a Perplexity.

V rámci testu poskytol tím BBC chatbotom prístup k obsahu webovej stránky BBC News a potom im kládol otázky. Podľa zverejnených výsledkov malo 51 % vygenerovaných odpovedí nejakú formu chyby. Devätnásť percent odpovedí obsahovalo faktické chyby a 13 percent nepresné citácie z článkov BBC News.

Medzi nesprávnymi odpoveďami boli aj tvrdenia chatbotov, že britský expremiér Rishi Sunak alebo bývalá šéfka škótskej vlády Nicola Sturgeonová sú stále vo funkcii, hoci v čase testu to už nebola pravda. V inej odpovedi napríklad aplikácia AI nepravdivo tvrdila, že britská NHS odporúča elektronické cigarety ako nástroj na odvykanie od fajčenia.

Novinári BBC News hodnotili presnosť, nestrannosť a tiež vernosť odpovedí pôvodným zdrojom, uvádza sa v hodnotení testu. „Chceli sme vedieť, či (platformy umelej inteligencie) poskytujú presné odpovede na otázky týkajúce sa správ; a či sú odpovede verné správam BBC News, ktoré boli použité ako zdroje,“ povedal Pete Archer, vedúci tímu umelej inteligencie BBC.

Podľa BBC výsledky testu ukazujú, že odpovede generované umelou inteligenciou môžu byť často zavádzajúce. „Je ťažké nevidieť, ako rýchlo môže skreslenie (informácií) umelou inteligenciou podkopať už aj tak krehkú dôveru ľudí vo fakty a overené informácie,“ uviedla v komentári Deborah Turnessová, vedúca spravodajstva BBC. Podľa testovacieho tímu je veľmi dôležité, aby boli informácie presné bez ohľadu na kanál, ktorý ich vysiela. „Nepresnosti z asistentov umelej inteligencie sa môžu ľahko šíriť, keď sa zdieľajú na sociálnych sieťach,“ povedal Archer.

Autori štúdie priznávajú, že výsledky ich výskumu neukazujú celkovú chybovosť odpovedí aplikácií AI. Domnievajú sa však, že chatboti v súčasnosti nemôžu byť zdrojom presných správ. „Chceme, aby spoločnosti zaoberajúce sa umelou inteligenciou počúvali naše obavy a konštruktívne s nami spolupracovali,“ uvádza sa v záveroch testu. BBC plánuje podobný test v blízkej budúcnosti zopakovať.