Az adatok mint korunk nyersanyaga – avagy mi köze a macskás képeknek a digitális gyarmatosításhoz?
Manapság sok helyen hallani, hogy az adat „az új olaj”, vagyis korunk legértékesebb nyersanyaga. De mit is jelent ez pontosan, és hogyan jutottunk el odáig, hogy “pár” vicces macskás képből kiindulva a személyes adataink sokmilliós, sőt akár milliárdos üzlet alapját képezzék? Ebben a cikkben szeretnénk röviden érthető módon elmagyarázni, miért olyan értékesek az adatok, hogyan épültek fel a mesterséges intelligencia rendszerek (köztük a képfelismerő algoritmusok), és miért fontos, hogy felelősen bánjunk a saját adatainkkal – például a sütik engedélyezésekor.
Hogyan lesznek a macskás képekből képfelismerő rendszerek?
Az internet hajnalán szinte csak szöveges információk voltak elérhetők, néhány lelkes fejlesztő, illetve kísérleti projekt által feltöltött tartalmakon keresztül. Az idő előrehaladtával és a világháló fejlődésével azonban egyre több, könnyen rögzíthető multimédiás tartalom lepte el az online teret, YouTube-videók, mémek, zenei platformok, digitális könyvtárak és nem utolsósorban macskás fotók özöne. A 2000-es évek közepére a „cuki macskás kép” a neten olyannyira elterjedt tartalom lett, hogy fejlesztői versenyeket (angolul hackathonok vagy challenge-ek) rendeztek, ahol a programozóktól kifejezetten a macskák képi felismerésére kértek megoldásokat.
Miért volt ez fontos mérföldkő? Mert a képfelismeréshez (és sok más mesterséges intelligencia alapú szoftver feltanításához) elengedhetetlen a sok-sok címkézett adat, fotó. Az emberek a közösségi oldalakon és a fotómegosztó platformokon önszántukból töltik fel a képeiket – ráadásul gyakran még azt is megjelölik, hogy ki vagy mi látható rajtuk („macska”, „kutya”, „én nyaralok”, „barátom születésnapja” és így tovább). Ezek a címkézett képek az idő folyamán óriási adatbázist hoztak létre, amelyek alapjául szolgáltak annak, hogy a számítógépes látás (computer vision) területén óriási fejlődés következzen be. A mesterséges intelligencia modellek ugyanis annál pontosabban tanulnak, minél több (és minél változatosabb) adatot kapnak. A macskás képek népszerűsége miatt különösen sok tanítóadat gyűlt össze. Ez a technológiai fejlesztés előbb kísérleti jelleggel működött (például a Google, Facebook laborjaiban), majd fokozatosan érett kiforrott, kereskedelmi szinten eladható termékké. Manapság ez a háttértechnológia szolgáltatja az alapot a kameraalkalmazások arcfelismeréséhez, a rendszámtábla-leolvasó szoftverekhez, a biztonsági kamerarendszerekhez és rengeteg más, nagy pontosságú képfeldolgozó megoldáshoz.
„Ingyen” adatból pénztermelő szoftverek
Ha a hétköznapok során használunk egy mobilalkalmazást, vagy posztolunk a közösségi médiában, nem feltétlenül gondolunk bele, hogy az általunk „ingyen” feltöltött tartalmak és megosztott adatok milyen mértékben válnak üzleti célok alapjává. Pedig a platformokat működtető cégek – amelyek gyakran óriási, globális kitekintéssel rendelkeznek – pontosan erre építik üzleti modelljeiket.
A közösségi média felületek (Facebook, Instagram, TikTok, stb.) folyamatosan gyűjtik, elemezik és rendszerezik a felhasználók magatartását. A keresőmotorok (Google, Bing) a keresési előzmények, kattintások és egyéb böngészési adatok révén építenek személyre szabott hirdetési rendszereket. A szoftverfejlesztő vállalatok (például képfelismerő AI-k esetében) összegyűjtik a feltöltött fotókat, és ezeken képezik az algoritmusaikat.
Az így megszerzett tudás – azaz a feldolgozott adathalmaz eredménye – végül szoftvertermékek, licencdíjak, API-k és különböző előfizetéses rendszerek formájában kerül vissza a piacra. Ironikus módon gyakran azoktól a felhasználóktól (akár kormányzati szinten) is pénzt kérve, akiktől az eredeti nyersanyag – a személyes adat – ingyen érkezett.
Ezt a jelenséget sokan digitális gyarmatosításnak (digital colonialism) nevezik, hiszen a világ minden pontjáról gyűjtött adat (városok térképei, emberi viselkedésminták, arcképek) egyre nagyobb értéket képvisel, miközben a felhasználók többnyire nem kapnak érte közvetlen ellentételezést. Az értékes adathalmazt feldolgozzák és végül olyan termék lesz belőle, amelyet később a globalizált piacokon értékesítenek. Ezáltal a nagy tech vállalatok óriási, akár országok gazdaságát meghaladó bevételhez és befolyáshoz juthatnak.
Miért kell óvatosnak lennünk az online térben?
Mindez rámutat arra, hogy a felhasználók – tehát mi, átlagemberek – sokszor nem is vagyunk tisztában azzal, milyen kereskedelmi és technológiai folyamatok zajlanak a háttérben, amikor bepötyögünk egy keresést, elfogadunk egy sütiszabályzatot, megosztunk egy fotót vagy lejátszási listát hallgatunk. Márpedig az adatvédelem nem csak valami homályos jogi kategória, közvetlenül kihat a személyes életünkre, a pénztárcánkra, és végső soron a szabadságunkra is. Például az online cégek platformok gyakran használják a profilozás és célzott hírdetések módszerét, amit a digitális lábnyomunkból – keresésekből, kattintásokból, közösségi média interakciókból – egyre részletesebben lehet alkalmazni. Ez lehetővé teszi a hirdetőknek, hogy a “gyengeségeinkre”, félelmeinkre vagy éppen a számunkra releváns érdeklődési pontokra célzottan lőjenek hirdetéseket, amelyek nagyobb eséllyel vesznek rá egy termék vagy szolgáltatás megvásárlására.
Gyakran használják azonosításra is adatainkat, ami biztonsági kockázatot is jelenthet. A képfelismerő rendszereknek “hála”, a fotóinkból arcképfelismerő mintát tudnak létrehozni. Ez nagy kockázatot jelenthet, ha egy vállalati vagy állami adatbázisba illetéktelenek férnek hozzá, vagy ha olyan országok szerzik meg, amelyekben a felhasználók emberi jogai nincsenek kellően védve.
Másik felhasználási területe adatainknak az automatizált döntéshozatal. A mesterséges intelligencia alapú döntéshozatal (például hitelbírálatnál vagy állásinterjúk első körös szűrésénél) sokszor a rendszer által feldolgozott adatokra támaszkodik. Ha ezek az adatok torzak vagy hiányosak, vagy épp téves következtetéseket vonnak le belőlük, akkor ez jelentősen befolyásolja az emberek lehetőségeit, esélyeit (akár anélkül, hogy erről ők tudomást szereznének).
Mit tehetünk mi, átlagfelhasználók?
- Legyünk tudatosak a cookie-kezelésben. Az európai GDPR (General Data Protection Regulation) szabályozás előírja, hogy a honlapok kötelesek tájékoztatni a felhasználókat arról, milyen sütiket kívánnak használni. A legtöbb webhelyen lehetőségünk van, hogy csak a minimálisan szükséges sütiket fogadjuk el és kikapcsoljuk a reklám- vagy statisztikai célú trackereket. Érdemes időt szánni arra, hogy megértsük, mire adunk engedélyt.
- Olvassuk el (legalább nagyvonalakban) az Adatvédelmi tájékoztatókat. Tudom, hogy nem túl izgalmas, és rengeteg jogi szakkifejezést tartalmaz, de legalább a főbb pontokat – mit és hogyan gyűjtenek rólunk, kinek adják tovább, meddig tárolják – célszerű áttekinteni.
- Ellenőrizzük a közösségi média beállításainkat. Ki láthatja a bejegyzéseinket? Milyen címkéket engedünk? Ki tud bejelölni a fotókon? Ezeket a beállításokat bizonyos időközönként felül kell vizsgálnunk, mert a platformok folyamatosan változtatják a szabályzataikat.
- Használjunk adatvédelmi eszközöket. A böngészőben léteznek reklámblokkoló bővítmények (például uBlock Origin) és nyomkövetést megakadályozó pluginek (Privacy Badger, stb.). Emellett alternatív keresőmotorok (DuckDuckGo, Startpage) is rendelkezésre állnak, amelyek kevesebb adatot gyűjtenek rólunk.
- Tájékozódjunk a digitális jogainkról. A GDPR és a kapcsolódó jogszabályok (például ePrivacy) mind a mi védelmünket szolgálják. Kérhetjük személyes adataink törlését, hordozhatóságát, az adatkezelés korlátozását. Gyakran már egy e-mail is elég ahhoz, hogy érvényesítsük ezeket a jogokat, ha tudjuk, hogyan.
Digitális felelősség: közösségi és egyéni szinten
Ahhoz, hogy a digitális világ a közjó szolgálatába álljon, nemcsak az adatvédelmi szabályozás folyamatos fejlesztésére, hanem társadalmi szintű tudatosításra is szükség van. Jó látni, hogy egyre több ország igyekszik szigorúbban fogalmazni az adatvédelmi előírásokban, de még messze nem általános a felhasználók körében, hogy értékként tekintsenek a saját adataikra.
A rendszer persze nem egyik napról a másikra változik meg. De minden apró lépés – például ha nem kattintunk automatikusan az „Elfogadom az összes sütit” gombra – számít. Ezzel kinyilvánítjuk, hogy értéket képvisel számunkra a saját digitális jelenlétünk, és nem szeretnénk róla teljes körűen lemondani.
Ezáltal ugyan kisebb bevételt jelentenek majd a reklámozóknak, s lehet, hogy bizonyos felugró ablakokat gyakrabban kell bezárnunk, de cserébe nagyobb kontrollt tartunk fent a saját adataink felett.
Összességében
A macskás képektől indultunk, a látszólag ártatlan, „cuki” fotók masszív adathalmazt szolgáltattak a fejlesztőknek, ami végül az egyik legdinamikusabban fejlődő technológiát, a mesterséges intelligenciát segítette elő. Ma pedig ezek az algoritmusok ott vannak a mobiltelefonjainkban, a térfigyelő kamerarendszerekben és számtalan online szolgáltatásban. A háttérben továbbra is ugyanaz zajlik: az adatok gyűjtése, feldolgozása és monetizálása.
A „digitális gyarmatosítás” kifejezés kissé provokatív, de rávilágít a lényegre: óriási vállalatok és adatkezelők gazdagodnak meg a mi mindennapi életünkből származó digitális lábnyomainkból, és ez a folyamat gyakran aszimmetrikus. Szerencsére egyre többen ismerik fel, hogy az adatvédelem nem egy elvont jogi kategória, hanem a 21. század egyik legfontosabb közéleti témája, amely az életünk minden területére kihat.
A megoldás kulcsa részben bennünk, felhasználókban van: tudatosabban kell bánnunk a saját adatainkkal. Érdemes kihasználni a GDPR és az egyéb adatvédelmi rendeletek adta lehetőségeket, és átgondolni, mit engedünk meg a sütik kapcsán. Ha értékként tekintünk a saját adatainkra, és igyekszünk felelős döntéseket hozni, akkor hosszú távon is megőrizhetjük a digitális szuverenitásunkat – miközben természetesen továbbra is élvezhetjük a net adta lehetőségeket, akár egy aranyos macskás fotó megosztását.



