Koks yra pagrindinis generatyvinio dirbtinio intelekto tikslas?

Koks yra pagrindinis generatyvinio dirbtinio intelekto tikslas?

Trumpas atsakymas: generatyvinio dirbtinio intelekto pagrindinis tikslas – sukurti naują, įtikimą turinį (tekstą, vaizdus, ​​garso įrašus, kodą ir kt.), mokantis esamų duomenų modelių ir juos išplečiant reaguojant į užklausą. Tai dažniausiai padeda, kai reikia greitų juodraščių ar kelių variantų, tačiau jei svarbus faktinis tikslumas, pridėkite pagrindą ir peržiūrą.

Svarbiausios išvados:

Karta : sukuria naujus rezultatus, kurie atspindi išmoktus modelius, o ne saugomą „tiesą“.

Įžeminimas : jei tikslumas svarbus, susiekite atsakymus su patikimais dokumentais, citatomis ar duomenų bazėmis.

Valdomumas : naudokite aiškius apribojimus (formatą, faktus, toną), kad rezultatai būtų nuoseklesni.

Apsauga nuo netinkamo naudojimo : pridėkite apsauginius turėklus, kad blokuotumėte pavojingą, privatų ar neleidžiamą turinį.

Atskaitomybė : rezultatus traktuokite kaip juodraščius; didelės rizikos darbą registruokite, vertinkite ir nukreipkite žmonėms.

Straipsniai, kuriuos galbūt norėsite perskaityti po šio:

🔗 Kas yra generatyvinis dirbtinis intelektas
Supraskite, kaip modeliai kuria tekstą, vaizdus, ​​kodą ir kt.

🔗 Ar dirbtinis intelektas yra perdėtai išgirtas?
Subalansuotas žvilgsnis į ažiotažą, ribas ir realų poveikį.

🔗 Kuris DI jums tinka
Palyginkite populiarius dirbtinio intelekto įrankius ir išsirinkite tinkamiausią.

🔗 Ar yra dirbtinio intelekto burbulas?
Stebėtini ženklai, rinkos rizika ir kas bus toliau.


Pagrindinis generatyvinio dirbtinio intelekto tikslas🧠

Jei norite trumpiausio ir tikslesnio paaiškinimo:

  • Generatyvusis dirbtinis intelektas mokosi duomenų (kalbos, vaizdų, muzikos, kodo) „formos“

  • Tada jis generuoja naujus pavyzdžius , kurie atitinka tą formą

  • Tai daroma reaguojant į raginimą, kontekstą arba apribojimus

Taigi, taip, jis gali parašyti pastraipą, nutapyti paveikslą, remiksuoti melodiją, parengti sutarties sąlygą, generuoti testus arba sukurti logotipą primenantį dalyką.

Ne todėl, kad „supranta“ kaip žmogus (apie tai pakalbėsime vėliau), bet todėl, kad geba pateikti rezultatus, kurie statistiškai ir struktūriškai atitinka išmoktus modelius.

Jei norite suaugusiojo suprantamo požiūrio į tai, „kaip tai naudoti neužlipant ant grėblių“, NIST dirbtinio intelekto rizikos valdymo sistema yra tvirtas rizikos ir kontrolės mąstymo pagrindas. [1] O jei norite kažko specialiai pritaikyto generatyvinio dirbtinio intelekto rizikai (ne tik dirbtiniam intelektui apskritai), NIST taip pat paskelbė „GenAI“ profilį, kuriame išsamiau aprašoma, kas keičiasi, kai sistema generuoja turinį. [2]

 

Generatyvus dirbtinis intelektas

Kodėl žmonės ginčijasi dėl „pagrindinio generatyvinio dirbtinio intelekto tikslo“ 😬

Žmonės kalba vienas apie kitą, nes vartoja skirtingas „tikslo“ reikšmes

Kai kurie žmonės turi omenyje:

  • Techninis tikslas: sugeneruoti realius, nuoseklius rezultatus (pagrindas)

  • Verslo tikslas: sumažinti sąnaudas, padidinti produkciją, suasmeninti patirtį

  • Žmogaus tikslas: gauti pagalbos mąstant, kuriant ar bendraujant greičiau

Ir taip, tie susiduria.

Jei laikysimės tvirtos pozicijos, pagrindinis generatyviojo dirbtinio intelekto tikslas yra generavimas – turinio, kurio anksčiau nebuvo, kūrimas, sąlygojant jį įvesties duomenimis.

Verslo reikalai kyla pasroviui. Kultūrinė panika taip pat kyla pasroviui (atsiprašau... kažkaip 😬).


Dėl ko žmonės painioja „GenAI“ (ir kodėl tai svarbu) 🧯

Greitas „ne tai“ sąrašas išsklaido daug painiavos :

„GenAI“ nėra duomenų bazė

Jis „neatkuria tiesos“. Jis generuoja patikimus rezultatus. Jei reikia tiesos, pridedate pagrindą (dokumentus, duomenų bazes, citatas, žmogaus atliekamą peržiūrą). Šis skirtumas iš esmės yra visa patikimumo istorija. [2]

GenAI nėra automatiškai agentas

Tekstą generuojantis modelis nėra tas pats, kas sistema, galinti saugiai atlikti veiksmus (siųsti el. laiškus, keisti įrašus, diegti kodą). „Gali generuoti instrukcijas“ ≠ „turėtų jas vykdyti“

GenAI nėra ketinimas

Tai gali sukurti turinį, kuris skamba kaip tyčinis. Tai ne tas pats, kas turėti tyčinį tikslą.


Kas daro generatyvinį dirbtinį intelektą gerą? ✅

Ne visos „generatyviosios“ sistemos yra vienodai praktiškos. Gera generatyviojo dirbtinio intelekto versija yra ne tik ta, kuri sukuria gražius rezultatus – ji sukuria vertingus, valdomus ir pakankamai saugius atsižvelgiant į kontekstą.

Gera versija paprastai turi:

  • Nuoseklumas – jis neprieštarauja pats sau kas du sakinius

  • Įžeminimas – jis gali susieti rezultatus su tiesos šaltiniu (dokumentais, citatomis, duomenų bazėmis) 📌

  • Valdomumas – galite valdyti toną, formatą, apribojimus (ne tik vibraciją)

  • Patikimumas – panašios užduotys, o ne ruletės rezultatai, suteikia panašią kokybę

  • Apsauginiai turėklai – jie suprojektuoti taip, kad išvengtų pavojingų, privačių ar neleidžiamų išėjimų

  • Atvirumo pojūtis – užuot išgalvojęs, gali pasakyti „nesu tikras“

  • Atitikimas darbo eigai – tai atitinka žmonių darbo būdą, o ne fantazijos darbo eigą

NIST iš esmės visą šį pokalbį apibrėžia kaip „patikimumą + rizikos valdymą“, o tai yra... neseksualus dalykas, kurį visi norėtų padaryti anksčiau. [1][2]

Netobula metafora (pasiruoškite): geras generatyvinis modelis yra tarsi labai greitas virtuvės padėjėjas, kuris gali paruošti bet ką... bet kartais supainioja druską su cukrumi, o jums reikia ženklinimo ir skonio testų, kad nepatiektumėte desertinio troškinio 🍲🍰


Greitas kasdienis mini atvejis (sudėtinis, bet labai įprastas) 🧩

Įsivaizduokite palaikymo komandą, kuri nori, kad „GenAI“ parengtų atsakymų projektus:

  1. 1 savaitė: „Tegul modelis atsako į užklausas.“

    • Rezultatai yra greiti, patikimi... ir kartais brangiai kainuojantys, netikslūs.

  2. 2 savaitė: Jie prideda duomenų paiešką (faktai ištraukiami iš patvirtintų dokumentų) + šablonus („visada prašyti paskyros ID“, „niekada nežadėti grąžinti pinigų“ ir pan.).

    • Neteisingumas mažėja, nuoseklumas pagerėja.

  3. 3 savaitė: Jie prideda peržiūros juostą (žmogaus patvirtinimas didelės rizikos kategorijoms) + paprastus vertinimus („cituota politika“, „laikytasi grąžinimo taisyklės“).

    • Dabar sistema yra dislokuojama.

Toks progresavimas iš esmės yra NIST praktinis tikslas: modelis yra tik viena dalis; jį supantys valdikliai yra tai, kas jį pakankamai saugų daro. [1][2]


Palyginimo lentelė – populiarūs generatyviniai variantai (ir kodėl jie veikia) 🔍

Kainos nuolat kinta, todėl ši informacija sąmoningai lieka neaiški. Be to: kategorijos persidengia. Taip, tai erzina.

Įrankis / metodas Auditorija Kaina (apytikslė) Kodėl tai veikia (ir maža ypatybė)
Bendrieji LLM pokalbių asistentai Visi, komandos Nemokamas lygis + prenumerata Puikiai tinka juodraščių rašymui, apibendrinimui, idėjų generavimui. Kartais net ir užtikrintai klysti... kaip drąsus draugas 😬
API LLM programoms Kūrėjai, produktų komandos Naudojimo pagrindu Lengva integruoti į darbo eigas; dažnai derinama su paieškos ir įrankiais. Reikia apsauginių turėklų, kitaip bus aštru
Vaizdų generatoriai (difuzinio stiliaus) Kūrėjai, rinkodaros specialistai Prenumerata / kreditai Stiprus stiliaus ir variacijų srityje; paremtas denoizingo stiliaus generavimo modeliais [5]
Atvirojo kodo generatyviniai modeliai Hakeriai, tyrėjai Nemokama programinė įranga + aparatinė įranga Valdymas + pritaikymas, privatumą užtikrinančios sąrankos. Tačiau mokate už sąrankos skausmą (ir GPU apkrovą)
Garso / muzikos generatoriai Muzikantai, mėgėjai Kreditai / prenumerata Greitas melodijų, stygų, garso dizaino idėjų generavimas. Licencijavimas gali būti painus (skaitykite sąlygas)
Vaizdo įrašų generatoriai Kūrėjai, studijos Prenumerata / kreditai Greiti siužetiniai planai ir koncepcijų klipai. Nuoseklumas skirtingose ​​scenose vis dar yra galvos skausmas
Paieškos papildyta generacija (RAG) Įmonės Infrastruktūra + naudojimas Padeda susieti generavimą su jūsų dokumentais; įprasta kontrolės priemonė, padedanti sumažinti „išgalvotų dalykų“ skaičių [2]
Sintetinių duomenų generatoriai Duomenų komandos Įmonių lygio Patogu, kai duomenų trūksta / jie jautrūs; reikia patvirtinimo, kad sugeneruoti duomenys jūsų neapgautų 😵

Po gaubtu: generavimas iš esmės yra „modelio užbaigimas“ 🧩

Neromantiška tiesa:

Daug generatyvinio dirbtinio intelekto yra „numatymas, kas bus toliau“, padidintas tol, kol atrodo, kad tai kažkas kita.

  • Tekste: sukurti kitą teksto dalį (žetoninę) sekoje – klasikinė autoregresinė konfigūracija, dėl kurios šiuolaikiniai raginimai buvo tokie veiksmingi [4]

  • Vaizduose: pradėkite nuo triukšmo ir iteratyviai jį pašalinkite į struktūrą (difuzijos šeimos intuicija) [5]

Štai kodėl raginimai yra svarbūs. Jūs suteikiate modeliui dalinį šabloną, o jis jį užbaigia.

Štai kodėl generatyvinis dirbtinis intelektas gali būti puikus:

  • „Parašykite tai draugiškesniu tonu“

  • „Duokite man dešimt antraščių variantų“

  • „Paverskite šiuos užrašus švariu planu“

  • „Sukurti pastolių kodą + testus“

...ir kodėl jam gali kilti sunkumų dėl:

  • griežtas faktinis tikslumas be pagrindo

  • ilgos, trapios samprotavimų grandinės

  • nuoseklus identitetas daugelyje išvesties elementų (personažai, prekės ženklo stilius, pasikartojančios detalės)

Tai ne „mąstymas“ kaip žmogus. Tai įtikimų tęsinių generavimas. Vertingas, bet kitoks.


Kūrybiškumo debatai – „kūrimas“ ir „remiksavimas“ 🎨

Žmonės čia neproporcingai įkaista. Aš tai šiek tiek suprantu.

kūrybiškus rezultatus, nes ji gali:

  • derinti sąvokas

  • greitai ištirkite variantus

  • paviršiaus stebinančias asociacijas

  • imituoti stilius su šiurpiu tikslumu

Bet tai neturi jokio ketinimo. Jokio vidinio skonio. Jokio „Aš tai padariau, nes man tai svarbu“

Tačiau šiek tiek atsitraukus: žmonės taip pat nuolat perdaro. Mes tai darome vadovaudamiesi gyvenimiška patirtimi, tikslais ir skoniu. Taigi etiketė gali likti ginčijama. Praktiškai tai yra kūrybinis svertas žmonėms, ir tai yra svarbiausia.


Sintetiniai duomenys – tyliai nepakankamai įvertintas tikslas 🧪

Viena stebėtinai svarbi generatyvinio dirbtinio intelekto šaka yra duomenų, kurie elgiasi kaip tikri duomenys, generavimas neatskleidžiant realių asmenų ar retų jautrių atvejų.

Kodėl tai vertinga:

  • privatumo ir atitikties apribojimai (mažiau atskleidžiami tikri įrašai)

  • retų įvykių modeliavimas (sukčiavimo pranašumo atvejai, nišinių tiekimo linijų gedimai ir kt.)

  • bandymų vamzdynai nenaudojant gamybos duomenų

  • duomenų papildymas, kai realūs duomenų rinkiniai yra maži

Tačiau problema išlieka ta pati: sintetiniai duomenys gali tyliai atkurti tas pačias šališkumo ir akląsias zonas kaip ir originalūs duomenys – todėl valdymas ir matavimas yra tokie pat svarbūs kaip ir duomenų generavimas. [1][2][3]

Sintetiniai duomenys yra kaip kava be kofeino – atrodo tinkamai, kvepia tinkamai, bet kartais neatlieka to, ko tikėjaisi ☕🤷


Ribos – kuo generatyvinis dirbtinis intelektas yra blogas (ir kodėl) 🚧

Jei prisimenate tik vieną įspėjimą, prisiminkite šį:

Generatyviniai modeliai gali sklandžiai skleisti nesąmones.

Dažniausi gedimo režimai:

  • Haliucinacijos – užtikrintas faktų, citatų ar įvykių klastojimas

  • Pasenusios žinios – modeliai, apmokyti naudojant momentines kopijas, gali praleisti atnaujinimus

  • Greitas trapumas – maži formuluotės pakeitimai gali sukelti didelius produkcijos pokyčius

  • Paslėptas šališkumas – modeliai, išmokti iš iškreiptų duomenų

  • Pernelyg didelis paklusnumas – bandoma padėti net tada, kai neturėtų

  • Nenuoseklus samprotavimas – ypač atliekant ilgas užduotis

Būtent todėl ir vyksta pokalbis apie „patikimą dirbtinį intelektą“: skaidrumas, atskaitomybė, patikimumas ir į žmogų orientuotas dizainas nėra būtini dalykai; tai yra būdas išvengti pasitikėjimo patrankos perkėlimo į gamybą. [1][3]


Sėkmės matavimas: žinojimas, kada tikslas pasiektas 📏

Jei pagrindinis generatyvinio dirbtinio intelekto tikslas yra „generuoti vertingą naują turinį“, sėkmės rodikliai paprastai skirstomi į dvi grupes:

Kokybės rodikliai (žmogiškieji ir automatiniai)

  • teisingumas (jei taikoma)

  • nuoseklumas ir aiškumas

  • stiliaus atitikimas (tonas, prekės ženklo balsas)

  • išsamumas (apima tai, ko prašėte)

Darbo eigos metrika

  • sutaupytas laikas vienai užduočiai

  • pataisymų sumažinimas

  • didesnis našumas be kokybės praradimo

  • naudotojų pasitenkinimas (iškalbingiausias rodiklis, net jei jį sunku įvertinti kiekybiškai)

Praktikoje komandos susidūrė su nepatogia tiesa:

  • modelis gali greitai sukurti „pakankamai gerus“ juodraščius

  • tačiau kokybės kontrolė tampa nauja kliūtimi

Taigi, tikroji pergalė yra ne tik generavimas. Tai generavimas ir peržiūros sistemos – paieškos įžeminimas, vertinimo rinkiniai, registravimas, raudonųjų komandų sudarymas, eskalavimo keliai... visi tie nepatrauklūs dalykai, kurie tai paverčia realybe. [2]


Praktinės gairės „naudok be gailesčio“ 🧩

Jei generatyvinį dirbtinį intelektą naudojate ne tik pramogoms, bet ir kitiems tikslams, keli įpročiai labai padeda:

  • Paprašykite struktūros: „Duokite man sunumeruotą planą, o tada – juodraštį.“

  • Priverstiniai apribojimai: „Naudokite tik šiuos faktus. Jei trūksta, nurodykite, ko trūksta.“

  • Prašymo neapibrėžtumas: „Išvardykite prielaidas ir patikimumą.“

  • Naudokite įžeminimą: prisijunkite prie dokumentų / duomenų bazių, kai faktai yra svarbūs [2]

  • Rezultatus traktuokite kaip juodraščius: net ir puikius

O paprasčiausias triukas yra pats žmogiškiausias: perskaitykite jį garsiai. Jei tai skamba kaip nevykėlis, bandantis padaryti įspūdį jūsų vadovui, tikriausiai tekstą reikia redaguoti 😅


Apibendrinimas 🎯

Pagrindinis generatyvinio dirbtinio intelekto tikslas yra generuoti naują turinį, kuris atitiktų raginimą ar apribojimą , mokantis iš duomenų modelių ir pateikiant patikimus rezultatus.

Jis galingas, nes:

  • pagreitina rašymo ir idėjų generavimą

  • pigiai daugina variantus

  • padeda užpildyti įgūdžių spragas (rašymo, programavimo, dizaino)

Tai rizikinga, nes:

  • gali sklandžiai fabrikuoti faktus

  • paveldi šališkumą ir akląsias zonas

  • rimtose situacijose reikalingas įžeminimas ir priežiūra [1][2][3]

Gerai naudojamas, tai mažiau „pakeičiamos smegenys“ ir daugiau „traukinio variklis su turbokompresoriumi“.
Prastai naudojamas, tai pasitikėjimo patranka, nukreipta į jūsų darbo eigą... ir tai greitai brangsta 💥


DUK

Koks yra pagrindinis generatyvinio dirbtinio intelekto tikslas kasdienėje kalboje?

Pagrindinis generatyvinio dirbtinio intelekto tikslas yra sukurti naują, įtikimą turinį – tekstą, vaizdus, ​​garso įrašus ar kodą – remiantis iš esamų duomenų išmoktais modeliais. Jis neieško „tiesos“ iš duomenų bazės. Vietoj to, jis generuoja rezultatus, kurie statistiškai atitinka tai, ką matė anksčiau, atsižvelgiant į jūsų pateiktą užduotį ir visus jūsų pateiktus apribojimus.

Kaip generatyvinis dirbtinis intelektas generuoja naują turinį iš raginimo?

Daugelyje sistemų generavimas veikia kaip šablonų užbaigimas dideliu mastu. Teksto atveju modelis numato, kas bus toliau sekoje, sukurdamas nuoseklius tęsinius. Vaizdų atveju difuzijos stiliaus modeliai dažnai prasideda nuo triukšmo ir iteratyviai „šalina triukšmą“ link struktūros. Jūsų raginimas tarnauja kaip dalinis šablonas, o modelis jį užbaigia.

Kodėl generatyvinis dirbtinis intelektas kartais taip užtikrintai sukuria faktus?

Generatyvusis dirbtinis intelektas yra optimizuotas pateikti patikimus, sklandžius rezultatus, o ne garantuoti faktinį teisingumą. Štai kodėl jis gali pateikti užtikrintai skambančias nesąmones, išgalvotas citatas ar neteisingus įvykius. Kai svarbus tikslumas, paprastai reikia pagrindo (patikimų dokumentų, citatų, duomenų bazių) ir žmogaus atliekamos peržiūros, ypač atliekant didelės rizikos arba su klientais susijusius darbus.

Ką reiškia „įžeminimas“ ir kada jį naudoti?

Įžeminimas reiškia modelio išvesties susiejimą su patikimu tiesos šaltiniu, pvz., patvirtinta dokumentacija, vidinėmis žinių bazėmis arba struktūrizuotomis duomenų bazėmis. Įžeminimą reikėtų naudoti visada, kai svarbus faktinis tikslumas, atitiktis politikai arba nuoseklumas – palaikymo atsakymai, teisiniai ar finansiniai projektai, techninės instrukcijos arba bet kas, kas gali padaryti apčiuopiamos žalos, jei būtų neteisinga.

Kaip generatyvinio dirbtinio intelekto rezultatus padaryti nuoseklesnius ir labiau kontroliuojamus?

Valdomumas pagerėja, kai pridedate aiškius apribojimus: privalomą formatą, leidžiamus faktus, tono nurodymus ir aiškias „daryti/nedaryti“ taisykles. Šablonai padeda („Visada klauskite X“, „Niekada nežadėkite Y“), kaip ir struktūrizuoti raginimai („Pateikite sunumeruotą planą, o tada – juodraštį“). Paprašius modelio išvardyti prielaidas ir neapibrėžtumą, taip pat galima sumažinti pernelyg pasitikėjimą savimi.

Ar generatyvinis dirbtinis intelektas yra tas pats, kas agentas, galintis atlikti veiksmus?

Ne. Modelis, kuris generuoja turinį, nebūtinai yra sistema, kuri turėtų vykdyti tokius veiksmus kaip el. laiškų siuntimas, įrašų keitimas ar kodo diegimas. „Gali generuoti instrukcijas“ skiriasi nuo „jas saugu vykdyti“. Jei pridedate įrankių naudojimą arba automatizavimą, paprastai reikia papildomų apsauginių barjerų, leidimų, registravimo ir eskalavimo kelių rizikai valdyti.

Kas daro generatyvinę dirbtinio intelekto sistemą „gera“ realiuose darbo procesuose?

Gera sistema yra vertinga, valdoma ir pakankamai saugi savo kontekstui – ne tik įspūdinga. Praktiniai signalai apima nuoseklumą, patikimumą panašiuose uždaviniuose, ryšį su patikimais šaltiniais, apsauginius barjerus, kurie blokuoja neleistiną ar privatų turinį, ir atvirumą, kai jis neaiškus. Supanti darbo eiga – peržiūros juostos, vertinimas ir stebėsena – dažnai yra tokia pat svarbi, kaip ir modelis.

Kokie yra didžiausi apribojimai ir gedimų režimai, į kuriuos reikia atkreipti dėmesį?

Dažni nesėkmės tipai yra haliucinacijos, pasenusios žinios, greitas trapumas, paslėptas šališkumas, per didelis paklusnumas ir nenuoseklus samprotavimas atliekant ilgas užduotis. Rizika padidėja, kai rezultatai traktuojami kaip baigtas darbas, o ne kaip juodraščiai. Gamybos reikmėms komandos dažnai prideda paieškos įžeminimą, vertinimus, registravimą ir žmogaus atliekamą peržiūrą jautrioms kategorijoms.

Kada sintetinių duomenų generavimas yra geras generatyvinio dirbtinio intelekto panaudojimas?

Sintetiniai duomenys gali padėti, kai trūksta realių duomenų, jie yra jautrūs arba jais sunku dalytis, ir kai reikia retų atvejų modeliavimo ar saugios testavimo aplinkos. Jie gali sumažinti realių įrašų atskleidimą ir palaikyti duomenų srauto testavimą ar papildymą. Tačiau juos vis tiek reikia patvirtinti, nes sintetiniai duomenys gali atkurti originalių duomenų šališkumą ar akląsias zonas.

Nuorodos

[1] NIST dirbtinio intelekto rizikos ir kontrolės sistema (DI) – DI rizikos ir kontrolės priemonių valdymo sistema. Skaityti daugiau
[2] NIST DI 600-1 „GenAI“ profilis – gairės dėl DI specifinių rizikų ir jų mažinimo (PDF). Skaityti daugiau
[3] EBPO DI principai – aukšto lygio atsakingo DI principų rinkinys. Skaityti daugiau
[4] Brown ir kt. (NeurIPS 2020) – pagrindinis dokumentas apie kelių kadrų raginimą naudojant didelius kalbos modelius (PDF). Skaityti daugiau
[5] Ho ir kt. (2020) – difuzijos modelio dokumentas, kuriame aprašomas vaizdų generavimas naudojant denoisingą (PDF). Skaityti daugiau

Raskite naujausią dirbtinį intelektą oficialioje dirbtinio intelekto asistentų parduotuvėje

Apie mus

Atgal į tinklaraštį