ChatGPT a fost dezvoltat cu ajutorul unor persoane care provin din unele dintre cele mai sărace regiuni ale lumii, conform unor documente recent divulgate. OpenAI Corporation a început să coopereze cu Sama, companie care angajează milioane de lucrători din cele mai sărace regiuni de pe Terra. Această mișcare vine în contextul în care OpenAI încearcă să externalizeze instruirea modelului său de procesare a limbajului natural ChatGPT către forța de muncă cu costuri reduse.
Sama este o companie care angajează milioane de lucrători din cele mai sărace părți ale lumii, printre țările în care activează numărându-se Kenya, Uganda și India. Compania a fost criticată în trecut pentru condițiile sale de muncă, mulți angajați plângându-se de programul prelungit și de salariile mici. Cu toate acestea, OpenAI și-a apărat decizia de a încheia un parteneriat cu Sama, argumentând că această companie oferă oportunități de angajare persoanelor care, altfel, trăiesc în sărăcie lucie.
Decizia OpenAI de a externaliza instruirea modelului său ChatGPT către Sama a fost criticată de unele persoane responsabile cu etica în domeniul IA, care susțin că firma exploatează forța de muncă ieftină. Iar aceste persoane au fost cele care au codificat setul de antrenament ChatGPT. Pentru 1,32 dolari pe oră, aceștia au scanat texte de pe internet pentru a căuta conținut nepotrivit.
Mulți angajați Sama au declarat că sănătatea lor psihică a avut de suferit din cauza muncii prestate. OpenAI nu a negat folosirea angajaților Sama pentru externalizare, dar a subliniat în schimb că această muncă a scos mulți oameni din sărăcie.
„Nu trebuie să uităm că ChatGPT și alte modele generative nu sunt magice – ele sunt construite pe lanțuri de aprovizionare enorme de muncă umană și date extrase”, a remarcat Andrew Strait, responsabil cu etica în domeniul IA.
Intelligența Artificială a arătat abilități impresionante în predecesorul model, GPT-3, care este capabil să lege propoziții între ele. Cu toate acestea, GPT-3 nu a fost ușor de vândut din cauza tendinței de a „rosti” remarci violente, sexiste și rasiste.
Acest lucru se datorează faptului că inteligența artificială a fost antrenată pe sute de miliarde de cuvinte luate de pe internet, un vast depozit de limbaj uman. Deoarece unele zone ale internetului sunt pline de toxicitate și prejudecăți, nu a existat o modalitate ușoară de a curăța aceste secțiuni de date de instruire. Teoretic, o echipă formată din sute de persoane ar avea nevoie de zeci de ani pentru a revizui manual seturi de date uriașe.
Citește și: Inteligența artificială „atacă” lumea modei