Internetom sa šíria falošné texty vytvorené umelou inteligenciou

Nástroje ako DALL-E 2 a Stable Diffusion alebo ChatGPT, o ktorých sa teraz veľa hovorí, sú veľmi pôsobivé.

Sú napríklad schopné vytvárať obrázky na základe textového popisu. Inteligentný konverzačný agent zasa dokáže odpovedať na takmer akúkoľvek otázku alebo generovať vlastný text.

Na nerozoznanie od ľudskej tvorby

Tieto technológie sú také dokonalé, že niekedy je ťažké uveriť, že nejde o výsledok činnosti človeka. Ako však vysvetľuje Melissa Heikkil z MIT Technology Review, také množstvo „umelých“ textov môže byť problematickejšie, ako sa zdá.

ChatGPT je ako encyklopédia, ktorá je k dispozícii 24 hodín denne. Má odpovede na takmer všetky otázky v rekordnom čase. Matematika, história či filozofia. Nič nie je problém.

Ale tam, kde tento konverzačný agent založený na jazykovom modeli GPT-3 od OpenAI ozaj vyniká, je najmä tvorba textu. Či už ide o celkom vymyslený príbeh, e-mail, vtip alebo novinový článok. Môže napísať jasný, zrozumiteľný a „spoľahlivý“ text na akúkoľvek tému. Za približne mesiac svojej existencie ho už využilo viac ako milión ľudí.

Hoci umožňuje napríklad študentom písať eseje bez námahy, môže mať aj oveľa vážnejšie následky. Heikkil upozorňuje na zdravotné rady neodobrené skutočným zdravotníckym pracovníkom. Alebo iný dôležitý informačný obsah.

„Systémy umelej inteligencie môžu prispieť k vytvoreniu veľkého množstva dezinformácií. Šíriť nežiadúci obsah a tiež skresľovať informácie. Môžu dokonca úplne pretvoriť náš zmysel pre realitu,“ varuje Heikkil.

Existuje niekoľko nástrojov na zisťovanie textov generovaných umelou inteligenciou. Podľa Heikkil sa však ukázalo, že sú voči ChatGPT neúčinné. Najväčšie obavy nevzbudzuje ani tak skutočnosť, že nie je možné určiť skutočný pôvod textu. Či je ľudský alebo umelý. Ide predovšetkým o to, že internet možno veľmi rýchlo naplniť akýmkoľvek obsahom. Často nepravdivým.

Umelá inteligencia čerpá zdroje z internetu vytvorené inou umelou inteligenciou

Modely počítačového jazyka sa učia na súboroch údajov, ktoré sa nachádzajú na internete. Medzi nimi môže byť dobrý obsah ale tiež zavádzajúce a škodlivé informácie zverejnené niektorými ľuďmi.

Umelá inteligencia vychádzajúca z takýchto zavádzajúcich údajov tak vytvára ďalší falošný obsah. A ten sa ďalej šíri internetom. Z neho čerpá ďalšia umelá inteligencia na vytvorenie ešte presvedčivejších jazykových modelov. A tie môžu ľudia použiť na vytváranie a šírenie ďalších nepravdivých informácií. A tak ďalej a tak ďalej. Znova a znova.

Najnovšie sa tento jav týka i obrázkov. „Internet je teraz zahltený obrázkami vytvorenými umelou inteligenciou. Obrázky, ktoré vznikli v roku 2022, budú teraz súčasťou každého modelu, ktorý vytvoríme,“ pripomína Mike Cook, výskumník na King’s College Londýn.

Z toho všetkého možno vyvodiť záver, že bude čoraz ťažšie nájsť kvalitné údaje netvorené umelou inteligenciou na tvorenie budúcich modelov umelej inteligencie.

„Je veľmi dôležité položiť si otázku, či potrebujeme trénovať na celom internete. Alebo či existujú spôsoby, ako odfiltrovať vysokokvalitný materiál, ktorý nám poskytne správny jazykový model,“ povedala Daphne Ippolito, vedúca výskumná pracovníčka spoločnosti Google Brain. Tá je výskumnou jednotkou spoločnosti Google pre celostné vzdelávanie.

Ako odhaliť text vytvorený umelou inteligenciou

Preto je potrebné vyvinúť nástroje na skúmanie textov vytvorených umelou inteligenciou. Nielen zaručiť kvalitu budúcich jazykových modelov. Ale predovšetkým zabezpečiť, aby informácie, ku ktorým máme každodenný prístup, boli založené na pravde.

Ako poznamenáva Heikkil, ľudia sa môžu pokúsiť predložiť vedeckú prácu generovanú umelou inteligenciou na odborné ohodnotenie. Alebo použiť technológiu ako nástroj na preverenie dezinformácií. Čo by bolo obzvlášť rizikové napríklad počas volieb.

V tomto boji proti umelému obsahu musia hrať úlohu aj ľudia. Musia sa stať dôvtipnejšími a naučiť sa rozpoznávať texty napísané ľuďmi. Ľudia totiž nie sú dokonalí. Text napísaný skutočnou osobou bude obsahovať preklepy alebo pravopisné chyby. Iste tiež niekoľko slangových slov. Niekedy mätúce rečové obraty.

To všetko sú drobné detaily, ktoré umelá inteligencia nebude schopná opakovať. Teda aspoň zatiaľ to nedokáže. Jazykové modely navyše fungujú tak, že predpovedajú ďalšie slovo vo vete. Takže používajú väčšinou najbežnejšie slová a veľmi málo vzácnych slov.

Čo je kľúčové v prípade ChatGPT? Je dôležité sústrediť sa na obsah, ktorý čítate na internete. Tréningová fáza ChatGPT sa totiž skončila ešte v roku 2021. Takže tento nástroj sa spolieha na údaje, ktoré boli on-line v tom čase.

Preto odpovede, ktoré vyžadujú vedomosti po tomto dátume, budú nevyhnutne nesprávne, zastarané alebo priamo vymyslené.

Zdroj: Ruské správy

Líbí se vám článek? Můžete ho sdílet se svými přáteli.

Loading…