Robotolunk, hogy többet ne kelljen
A sakkgépben továbbra is egy török ül
Szakmai bejegyzés
📅2023-1-20
Manapság divatosak a fenntarthatósági szempontrendszerek: kezdünk némi averziót érezni a kiszolgáltatott emberek keze által (is) készített iphone-okkal, ruhákkal, termékekkel kapcsolatban. Ennek örülnünk kell.
Ugyanakkor ez a probléma nem csak a H&M-ben kapható ingeket érinti, hanem a következő keresetleveledet is.
Miről beszélsz megint bálintka?
Lépjünk egy kicsit hátrébb - konkrétan mondjuk egy Google kereséshez.
Ismered azt az érzést, amikor beütsz a Google-be egy keresést egy konkrét weblapra, és a Google már annyira okos, hogy kidobja az adott weboldal almenüit?
Gondolhatnánk, hogy a Google ilyen okos, és nehéz lenne tagadni, hogy az. De aki még ennél is fondorlatosabb volt, az a fejlesztő.
Egy almenü sima szöveggel mondjuk annyi, hogy 'Elérhetőség'. Rákattintasz, és már lehet is olvasni, hogy hol lehet panaszt tenni.
A bőr alatt azonban azt találnád, hogy az 'Elérhetőség' szöveg egy ún. 'li' taggel van ellátva.
Ez parasztosan a következőt jelenti: a li tag jelenti, hogy a felsorolás tagjáról van szó - innen tudjuk azt is, hogy ez egy lista.
...és ez csak egy részlet volt, de láthatjuk, hogy mennyi többletinformáció van egy szövegben 'bekódolva' azon kívül, amit egy egyszeri felhasználó lát.
...kicsit mint bármelyik ruhánk: látjuk az anyagát, a kinézetét, a szabását, a színét - de egészen konkrét információkat a kis belső címke rejti.
Miért lényeges ez?
Ahhoz, hogy egy adatalapú szoftver jól működjön, kriminális mennyiségű címkézésre, taggelésre van szükség, hogy egy gép hatékonyan tudjon vele dolgozni.
Így van ez a legújabb csodafegyverrel, a ChatGPT-vel is.
Aki még esetleg nem hallott volna róla: a ChatGPT egy chatbot, ami különböző kérdésekre adott értelmes válaszaival napról-napra ámulatba ejti a felhasználókat. Az (amerikai) orvosi szakvizsga már pipa és már a jogit is kipróbálták (nem teljesen sikertelenül). Nem kizárt, hogy pár éven belül a chatbot írja a keresetleveledet (remélhetőleg egy másik robotnak).
De ahogy a ruha esetében a címke is tartalmazhat kellemetlen meglepetéseket, így van ez a ChatGPT esetében is.
Egy, eredetileg a TIME-ban megjelent, olasz összefoglaló cikkben olvasható, hogy a ChatGPT-ben felhasznált adatokat Afrikában, kb. 50 ezer ember - finoman fogalmazva - rugalmas foglalkoztatását kihasználva taggelték. A rugalmas foglalkoztatás ebben az esetben óránként 1,32-2 dollár javadalmazást jelentett.
És mit kellett ezért tenni?
Röviden: összeszedni és megcímkézni a web mocskát. Kiskorúakkal szembeni szexuális visszaélések, halálos, erőszakos tartalmak. Stb.
Az egész sztori jól példázza, hogy csak olyan, hogy 'adat', nincsen. Önmagában sok kép, sok szöveg, sok kép aláírásból nem lehet szoftvert fejleszteni. Előbb-utóbb kell hozzá az ember, méghozzá rengeteg mennyiségű, robotikus munkájával. Elképzelhető, hogy nem kell több keresetlevelet írnod: helyette címkézhetsz kétszer ennyit.
Ha odajutok, megkérdezem a chatrobot urat, hogy mit gondol: szabad-e ilyet tenni.