Kas yra dirbtinio intelekto treneris?

Kartais dirbtinis intelektas atrodo kaip magiškas triukas. Įvedi atsitiktinį klausimą ir bam – per kelias sekundes pasirodo tvarkingas, nušlifuotas atsakymas. Tačiau štai kas yra netikėta: už kiekvienos „genialios“ mašinos slypi tikri žmonės, kurie ją stumia, taiso ir formuoja. Tie žmonės vadinami dirbtinio intelekto treneriais , o jų darbas yra keistesnis, juokingesnis ir, tiesą sakant, žmogiškesnis, nei dauguma žmonių mano.

Paaiškinkime, kodėl šie treneriai yra svarbūs, kaip iš tikrųjų atrodo jų kasdienybė ir kodėl šis vaidmuo populiarėja greičiau nei kas nors prognozavo.

Straipsniai, kuriuos galbūt norėsite perskaityti po šio:

🔗 Kas yra dirbtinio intelekto arbitražas: tiesa, slypinti už šio madingo žodžio
Paaiškina dirbtinio intelekto arbitražą, jo riziką, naudą ir dažniausiai pasitaikančius klaidingus įsitikinimus.

🔗 Duomenų saugojimo reikalavimai dirbtiniam intelektui: ką iš tikrųjų reikia žinoti
Apima dirbtinio intelekto sistemų saugojimo poreikius, mastelio keitimą ir efektyvumą.

🔗 Kas yra dirbtinio intelekto tėvas?
Tyrinėja dirbtinio intelekto pradininkus ir ištakas.

Kas daro dirbtinio intelekto trenerį patikimu? 🏆

Tai nėra darbas, kuriuo lengva paspausti mygtukus. Geriausi treneriai pasikliauja gana keistu talentų deriniu:

Kantrybė (daug jos) – modeliai neišmoksta iš karto. Treneriai kartoja tas pačias pataisas, kol jos prigyja.
Niuansų pastebėjimas – sarkazmo, kultūrinio konteksto ar šališkumo pastebėjimas suteikia žmogiškajam grįžtamajam ryšiui pranašumą [1].
Aiškus bendravimas – pusė darbo yra aiškių instrukcijų, kurių dirbtinis intelektas negali perskaityti klaidingai, rašymas.
Smalsumas + etika – geras instruktorius abejoja, ar atsakymas yra „fakiškai teisingas“, bet socialiai nereaguojantis į jo toną – tai pagrindinė dirbtinio intelekto priežiūros tema [2].

Paprastai tariant: lektorius yra iš dalies mokytojas, iš dalies redaktorius ir žiupsnelis etikos specialisto.

DI trenerio vaidmenų apžvalga (su kai kuriais ypatumais 😉)

Rolės tipas	Kas geriausiai tinka	Tipinis atlyginimas	Kodėl tai veikia (arba ne)
Duomenų žymėtojas	Žmonės, kurie mėgsta smulkias detales	Žemas–vidutinis $$	Absoliučiai svarbu; jei etiketės yra nerūpestingos, kenčia visas modelis [3] 📊
RLHF specialistas	Rašytojai, redaktoriai, analitikai	Vidutinis–aukštas $$	Suderina ir perrašo atsakymus, kad tonas ir aiškumas atitiktų žmonių lūkesčius [1]
Domeno treneris	Teisininkai, gydytojai, ekspertai	Visame žemėlapyje 💼	Tvarko nišinį žargoną ir kraštutinius atvejus, skirtus konkrečios pramonės šakos sistemoms
Saugos apžvalgininkas	Etikos šalininkai	Vidutinis $$$	Taiko gaires, kad dirbtinis intelektas vengtų žalingo turinio [2][5]
Kūrybinis treneris	Menininkai, pasakotojai	Nenuspėjama 💡	Padeda dirbtiniam intelektui atkartoti vaizduotę, išlaikant saugias ribas [5].

(Taip, formatavimas šiek tiek netvarkingas – panašiai kaip ir pats darbas.)

Diena iš dirbtinio intelekto trenerio gyvenimo

Taigi, kaip atrodo tikrasis darbas? Pagalvokite apie mažiau glamūrišką programavimą ir daugiau:

Dirbtinio intelekto parašytų atsakymų reitingavimas nuo blogiausio iki geriausio (klasikinis RLHF žingsnis) [1].
Taisomos painiavos (pavyzdžiui, kai modelis pamiršta, kad Venera nėra Marsas).
Pokalbių robotų atsakymų perrašymas, kad jie skambėtų natūraliau.
Kalnų teksto, vaizdų ar garso įrašų žymėjimas – čia tikslumas išties svarbus [3].
Diskusijos, ar „techniškai teisinga“ yra pakankamai gera, ar saugos gairės turėtų būti viršesnės [2].

Tai iš dalies sunkus darbas, iš dalies galvosūkis. Sąžiningai, įsivaizduokite, kad mokote papūgą ne tik kalbėti, bet ir nustoti vartoti žodžius šiek tiek neteisingai – tokia yra atmosfera. 🦜

Kodėl treneriai yra daug svarbesni, nei manote

Be žmogaus valdymo, dirbtinis intelektas (DI) galėtų:

Garsas standus ir robotiškas.
Nekontroliuojamas šališkumo skleidimas (baisi mintis).
Visiškai trūksta humoro ar empatijos.
Būkite mažiau saugūs jautriose situacijose.

Treneriai yra tie, kurie slapta įterpia „netvarkingus žmogiškus dalykus“ – slengą, šilumą, retkarčiais pasitaikančias gremėzdiškas metaforas – ir tuo pačiu metu taiko apsauginius turėklus, kad užtikrintų saugumą [2][5].

Įgūdžiai, kurie iš tikrųjų svarbūs

Pamirškite mitą, kad jums reikia daktaro laipsnio. Labiausiai padeda tai, kas:

Rašymo + redagavimo užuominos – nušlifuotas, bet natūraliai skambantis tekstas [1].
Analitinis mąstymas – pasikartojančių modelio klaidų pastebėjimas ir koregavimas.
Kultūrinis sąmoningumas – žinojimas, kada formuluotė gali būti neteisinga [2].
Kantrybės – nes dirbtinis intelektas to nesupranta akimirksniu.

Papildomi taškai už daugiakalbystės įgūdžius arba nišinę patirtį.

Kur pasirodo treneriai 🌍

Šis darbas skirtas ne tik pokalbių robotams – jis skinasi kelią į kiekvieną sektorių:

Sveikatos priežiūra – ribinių atvejų anotacijų rašymo taisyklės (pakartotos sveikatos srities dirbtinio intelekto gairėse) [2].
Finansai – sukčiavimo aptikimo sistemų mokymas nepaskandinant žmonių klaidingais pavojaus signalais [2].
Mažmeninė prekyba – asistentų mokymas, kaip vartoti žargoną pirkėjams, laikantis prekės ženklo tono [5].
Švietimas – mokymo robotų formavimas taip, kad jie būtų skatinantys, o ne globėjiški [5].

Iš esmės: jei prie stalo sėdi dirbtinis intelektas, fone slepiasi treneris.

Etikos dalis (to negalima praleisti)

Štai čia ir prasideda esmė. Nekontroliuojamas dirbtinis intelektas kartoja stereotipus, dezinformaciją ar dar blogiau. Mokytojai tai stabdo naudodami tokius metodus kaip RLHF arba konstitucines taisykles, kurios nukreipia modelius link naudingų, nekenksmingų atsakymų [1][5].

Pavyzdys: jei robotas pateikia šališkas darbo rekomendacijas, treneris tai pažymi, perrašo taisyklių knygą ir užtikrina, kad tai nepasikartotų. Tai yra vykdoma priežiūra [2].

Ne tokia smagi pusė

Ne viskas taip blizga. Treneriai susiduria su:

Monotonija – nesibaigiantis etikečių klijavimas pabodo.
Emocinis nuovargis – žalingo ar trikdančio turinio peržiūra gali turėti pasekmių; palaikymo sistemos yra labai svarbios [4].
Pripažinimo stoka – vartotojai retai suvokia, kad treneriai egzistuoja.
Nuolatiniai pokyčiai – įrankiai nuolat tobulėja, todėl treneriai turi neatsilikti.

Vis dėlto daugeliui technologijų „smegenų“ formavimo jaudulys išlaiko susidomėjimą.

Paslėpti dirbtinio intelekto MVP

Taigi, kas yra dirbtinio intelekto mokytojai? Jie yra tiltas tarp neapdorotų algoritmų ir sistemų, kurios iš tikrųjų veikia žmonėms. Be jų dirbtinis intelektas būtų kaip biblioteka be bibliotekininkų – daugybė informacijos, bet beveik neįmanoma ja naudotis.

Kitą kartą, kai pokalbių robotas jus prajuokins arba jausis stebėtinai „suderintas“, padėkokite mokytojui. Tai tylios figūros, kurios priverčia mašinas ne tik skaičiuoti, bet ir jungtis [1][2][5].

Nuorodos

[1] Ouyang, L. ir kt. (2022). Kalbos modelių mokymas vykdyti instrukcijas naudojant žmonių grįžtamąjį ryšį (InstructGPT). NeurIPS. Nuoroda

[2] NIST (2023). Dirbtinio intelekto rizikos valdymo sistema (AI RMF 1.0). Nuoroda

[3] Northcutt, C. ir kt. (2021). Paplitusios etikečių klaidos testų rinkiniuose destabilizuoja mašininio mokymosi etalonus. „NeurIPS“ duomenų rinkiniai ir etalonai. Nuoroda

[4] PSO / TDO (2022 m.). Psichikos sveikatos darbe gairės. Nuoroda

[5] Bai, Y. ir kt. (2022). Konstitucinis DI: DI grįžtamojo ryšio nekenksmingumas. arXiv. Nuoroda

Raskite naujausią dirbtinį intelektą oficialioje dirbtinio intelekto asistentų parduotuvėje

Apie mus

Atgal į tinklaraštį

Šalis / regionas