kaip apmokyti dirbtinio intelekto modelį

Kaip apmokyti dirbtinio intelekto modelį (arba: kaip išmokau nustoti nerimauti ir leisti duomenims mane išsekinti)

Neapsimeskime, kad tai paprasta. Kiekvienas, kuris sako „tiesiog apmokyk modelį“, lyg tai būtų verdami makaronai, arba to nedarė, arba patyrė, kad kažkas kitas už jį patyrė blogiausias dalis. Jūs ne tik „apmokate dirbtinio intelekto modelį“. Jūs auginate . Tai labiau panašu į sunkaus vaiko, turinčio begalinę atmintį, bet be instinktų, auginimą.

Ir keista, bet dėl ​​to jis gana gražus. 💡

Straipsniai, kuriuos galbūt norėsite perskaityti po šio:

🔗 10 geriausių dirbtinio intelekto įrankių kūrėjams – padidinkite produktyvumą, programuokite sumaniau, kurkite greičiau.
Susipažinkite su efektyviausiais dirbtinio intelekto įrankiais, padedančiais kūrėjams supaprastinti darbo eigą ir pagreitinti kūrimo procesą.

🔗 Geriausi dirbtinio intelekto įrankiai programinės įrangos kūrėjams – geriausi dirbtinio intelekto valdomi kodavimo asistentai.
Dirbtinio intelekto įrankių, kuriuos kiekvienas kūrėjas turėtų žinoti, kad pagerintų kodo kokybę, greitį ir bendradarbiavimą, apžvalga.

🔗 Dirbtinio intelekto įrankiai be kodo
Naršykite „AI Assistant Store“ sudarytą įrankių be kodo sąrašą, kuris leidžia kurti dirbtinį intelektą visiems.


Pirmiausia: kas yra dirbtinio intelekto modelio mokymas? 🧠

Gerai, pauzė. Prieš pasinerdami į technologinio žargono sluoksnius, žinokite štai ką: dirbtinio intelekto modelio mokymas iš esmės reiškia skaitmeninių smegenų mokymą atpažinti modelius ir atitinkamai reaguoti.

nieko nesupranta . Nei konteksto. Nei emocijų. Net logikos. Jis „mokosi“ grubiai taikydamas statistinius svorius, kol matematika sutampa su realybe. 🎯 Įsivaizduokite, kad mėtote strėlytes užrištomis akimis, kol viena pataiko į taikinį. Tada tai darote dar penkis milijonus kartų, kiekvieną kartą koreguodami alkūnės kampą po vieną nanometrą.

Tai mokymas. Tai ne protinga. Tai atkaklus darbas.


1. Apibrėžkite savo tikslą arba mirkite bandydami 🎯

Ką bandote išspręsti?

Nepraleiskite to. Žmonės tai daro ir galiausiai sukuria Frankeno modelį, kuris techniškai gali klasifikuoti šunų veisles, bet slapta mano, kad čihuahua yra žiurkėnai. Būkite žiauriai konkretūs. „Nustatyti vėžines ląsteles iš mikroskopo vaizdų“ yra geriau nei „užsiimti medicininiais dalykais“. Neaiškūs tikslai žudo projektą.

Dar geriau suformuluokite tai klausimu:
„Ar galiu apmokyti modelį aptikti sarkazmą „YouTube“ komentaruose naudojant tik jaustukų šablonus?“ 🤔
Tikra nesąmonė, į kurią verta įklimpti.


2. Atkaskite duomenis (ši dalis... niūri) 🕳️🧹

Tai daugiausiai laiko reikalaujantis, nepakankamai išaukštintas ir dvasiškai sekinantis etapas: duomenų rinkimas.

Slinksite forumus, skinsite HTML, siųsite abejotinus duomenų rinkinius iš „GitHub“ su keistomis pavadinimų konvencijomis, tokiomis kaip „FinalV2_ActualRealData_FINAL_UseThis.csv “. Galvosite, ar nepažeidžiate įstatymų. Galbūt. Sveiki atvykę į duomenų mokslą.

O kai gaunate duomenis? Jie nešvarūs. 💩 Neužpildytos eilutės. Klaida parašytos etiketės. Dublikatai. Trikdžiai. Vienas žirafos paveikslėlis su užrašu „bananas“. Kiekvienas duomenų rinkinys yra vaiduoklių namas. 👻


3. Išankstinis apdorojimas: kur miršta svajonės 🧽💻

Manėte, kad kambario valymas yra blogai? Pabandykite iš anksto apdoroti kelis šimtus gigabaitų neapdorotų duomenų.

  • Tekstas? Paverskite jį žetoniniu. Pašalinkite stopžodžius. Naudokite jaustukus arba mirkite bandydami. 😂

  • Paveikslėliai? Keisti dydį. Normalizuotos pikselių vertės. Nerimauti dėl spalvų kanalų.

  • Garsas? Spektrogramos. Užteks pasakyti. 🎵

  • Laiko eilutės? Geriau tikėkitės, kad jūsų laiko žymos nėra išgėrusios. 🥴

Rašysite kodą, kuris labiau primityvus nei intelektualus. 🧼 Teks viską abejoti. Kiekvienas čia priimtas sprendimas paveikia viską, kas vyksta toliau. Jokio spaudimo.


4. Pasirinkite savo modelio architektūrą (egzistencinės krizės užuomina) 🏗️💀

Štai čia žmonės pasipuikuoja ir atsisiunčia iš anksto apmokytą transformatorių, tarsi pirktų buitinį prietaisą. Bet palaukite: ar jums reikia „Ferrari“, kad pristatytumėte picą? 🍕

Pasirinkite ginklą pagal savo karą:

Modelio tipas Geriausiai tinka Privalumai Trūkumai
Tiesinė regresija Paprastos prognozės apie tolydžiąsias vertes Greitas, lengvai interpretuojamas, veikia su mažais duomenimis Netinka sudėtingiems santykiams
Sprendimų medžiai Klasifikacija ir regresija (lentelių duomenys) Lengva vizualizuoti, nereikia mastelio keitimo Linkęs į perteklinį pritaikymą
Atsitiktinis miškas Patikimos lentelinės prognozės Didelis tikslumas, tvarko trūkstamus duomenis Lėčiau treniruojamas, mažiau interpretuojamas
CNN (konversija tinklais) Vaizdų klasifikavimas, objektų aptikimas Puikiai tinka erdviniams duomenims, stiprus dėmesys modeliams Reikia daug duomenų ir GPU galios
RNN / LSTM / GRU Laiko eilutės, sekos, tekstas (pagrindinis) Tvarko laiko priklausomybes Sunku išlaikyti ilgalaikę atmintį (nyksta gradientai)
Transformatoriai (BERT, GPT) Kalbos, regėjimo, multimodalinės užduotys Pažangiausias, keičiamo dydžio, galingas Reikalingas labai daug išteklių, sudėtinga apmokyti

Nepersistenkite. Nebent esate čia tik tam, kad pasitemptumėte. 💪


5. Treniruočių ciklas (kur prarandamas sveikas protas) 🔁🧨

Dabar pasidaro keista. Paleidi modelį. Jis pradeda kvailai. Pavyzdžiui, „visos prognozės = 0“ – kvailai. 🫠

Tada... išmoksta.

Naudodama nuostolių funkcijas ir optimizatorius, atgalinį sklidimą ir gradientinį mažėjimą, ji pakoreguoja milijonus vidinių svorių, bandydama sumažinti savo klaidingumą. 📉 Jūs apsėsite grafikų. Jūs rėksite dėl plokščiakalnių. ​​Jūs girsite mažyčius patvirtinimo nuostolių sumažėjimus, tarsi jie būtų dieviški signalai. 🙏

Kartais modelis patobulėja. Kartais jis sugriūva į nesąmonę. Kartais jis per daug prisitaiko ir tampa išaukštintu magnetofonu. 🎙️


6. Vertinimas: skaičiai ir nuojauta 🧮🫀

Čia galite tai patikrinti su nematomais duomenimis. Naudosite tokias metrikas kaip:

  • Tikslumas: 🟢 Geras pradinis rodiklis, jei jūsų duomenys nėra iškreipti.

  • Tikslumas / Atkūrimas / F1 balas: 📊 Svarbus, kai klaidingai teigiami rezultatai kenkia.

  • ROC-AUC: 🔄 Puikiai tinka dvejetainėms užduotims su kreivių dramatizmu.

  • Sumišimo matrica: 🤯 Pavadinimas tikslus.

Net geri skaičiai gali užmaskuoti blogą elgesį. Pasitikėkite savo akimis, nuojauta ir klaidų žurnalais.


7. Dislokavimas: kitaip tariant, išlaisvinkite Krakeną 🐙🚀

Dabar, kai jis „veikia“, jį sujungiate. Išsaugokite modelio failą. Įtraukite jį į API. Dokerizuojate. Įtraukiate į gamybą. Kas gali nutikti ne taip?

O, teisingai – viskas. 🫢

Iškils kraštutinių atvejų. Vartotojai viską sugadins. Žurnalai rėks. Jūs taisysite viską tiesiogiai ir apsimesite, kad norėjote tai padaryti būtent taip.


Paskutiniai patarimai iš skaitmeninių apkasų ⚒️💡

  • Šiukšlių duomenys = šiukšlių modelis. Taškas. 🗑️

  • Pradėk nuo mažų dalykų, tada didink. Maži žingsneliai pranoksta didelius šuolius. 🚶♂️

  • Patikrinkite viską. Pasigailėsite, kad neišsaugojote tos vienos versijos.

  • Rašykite netvarkingus, bet nuoširdžius raštelius. Vėliau sau padėkosite.

  • Patvirtinkite savo nuojautą duomenimis. Arba ne. Priklauso nuo dienos.


Dirbtinio intelekto modelio mokymas yra tarsi savo paties pasitikėjimo savimi derinimas.
Manai, kad esi protingas, kol jis be jokios priežasties sugenda.
Manai, kad jis pasiruošęs, kol nepradeda prognozuoti banginių atsiradimo duomenų rinkinyje apie batus. 🐋👟

Bet kai pavyksta – kai modelis tai iš tikrųjų supranta – tai atrodo kaip alchemija. ✨

Ir tai? Štai kodėl mes tai darome toliau.

Raskite naujausią dirbtinį intelektą oficialioje dirbtinio intelekto asistentų parduotuvėje

Atgal į tinklaraštį