Kaip išmokti dirbtinio intelekto?

Mokytis dirbtinio intelekto gali būti tas pats, kas žengti į milžinišką biblioteką, kur kiekviena knyga šaukia „PRADĖKITE ČIA“. Pusė lentynų užrašyta „matematika“, o tai... šiek tiek nemandagu 😅

Privalumas: norint sukurti naudingų dalykų, nebūtina visko žinoti. Reikia protingo kelio, patikimų išteklių ir noro šiek tiek pasimesti (sumišimas iš esmės yra registracijos mokestis).

Straipsniai, kuriuos galbūt norėsite perskaityti po šio:

🔗 Kaip dirbtinis intelektas aptinka anomalijas
Paaiškina anomalijų aptikimo metodus, naudojant mašininį mokymąsi ir statistiką.

🔗 Kodėl dirbtinis intelektas kenkia visuomenei
Nagrinėja dirbtinio intelekto etines, socialines ir ekonomines rizikas.

🔗 Kiek vandens sunaudoja dirbtinis intelektas
Išskaido dirbtinio intelekto energijos suvartojimą ir paslėptą vandens naudojimo poveikį.

🔗 Kas yra dirbtinio intelekto duomenų rinkinys
Apibrėžia duomenų rinkinius, žymėjimą ir jų vaidmenį mokant dirbtinį intelektą.

Ką „DI“ iš tikrųjų reiškia kasdienėje prasme 🤷♀️

Žmonės sako „DI“ ir turi omenyje kelis skirtingus dalykus:

Mašininis mokymasis (ML) – modeliai mokosi šablonų iš duomenų, kad susietų įvestis su išvestimis (pvz., brukalo aptikimas, kainų prognozavimas). [1]
Gilusis mokymasis (DL) – ML pogrupis, naudojantis neuroninius tinklus dideliu mastu (regėjimas, kalba, dideli kalbos modeliai). [2]
Generatyvusis dirbtinis intelektas – modeliai, kurie kuria tekstą, vaizdus, kodą, garsą (pokalbių robotai, antrieji pilotai, turinio įrankiai). [2]
Pastiprinamasis mokymasis – mokymasis bandymų ir apdovanojimų būdu (žaidimų agentai, robotika). [1]

Nebūtina pradžioje rinktis tobulai. Tik nesielkite su dirbtiniu intelektu kaip su muziejumi. Tai labiau kaip virtuvė – gamindamas išmoksti greičiau. Kartais skrebučiai pridega. 🍞🔥

Trumpas pasakojimas: maža komanda sukūrė „puikų“ klientų praradimo modelį... kol pastebėjo identiškus ID tiek mokymuose , tiek bandymuose. Klasikinis nutekėjimas. Paprastas srautas ir švarus padalijimas įtartiną 0,99 pavertė patikimu (mažesniu!) balu ir modeliu, kuris iš tikrųjų buvo apibendrintas. [3]

Kas daro „Kaip išmokti dirbtinio intelekto“ planą gerą ✅

Geras planas turi keletą savybių, kurios skamba nuobodžiai, bet sutaupo jums mėnesius:

Kurkite mokydamiesi (maži projektai pradžioje, didesni vėliau).
Išmokite būtiniausius matematikos duomenis, o tada grįžkite atgal, kad galėtumėte gilintis.
Paaiškinkite, ką padarėte (išvenkite savo darbo kaip guminės anties; tai išgydo miglotą mąstymą).
Kurį laiką laikykitės vieno „pagrindinio steko“ (Python + Jupyter + scikit-learn → tada PyTorch).
Matuokite pažangą pagal rezultatus, o ne pagal stebėjimo valandas.

Jei jūsų planas yra tik vaizdo įrašai ir užrašai, tai tas pats, kas bandyti plaukti skaitant apie vandenį.

Pasirinkite savo kelią (kol kas) – trys įprasti keliai 🚦

Galite išmokti dirbtinio intelekto skirtingomis „formomis“. Štai trys, kurios veikia:

1) Praktinis statybininko kelias 🛠️

Geriausia, jei norite greitų pergalių ir motyvacijos.
Dėmesys: duomenų rinkiniai, mokymo modeliai, pristatymo demonstracijos.
Pradedantiesiems skirti ištekliai: „Google“ mašininio mokymosi greitasis kursas, „Kaggle Learn“, fast.ai (nuorodos pateiktos toliau pateiktuose „Nuorodos ir ištekliai“).

2) Maršrutas „Pirmiausia pagrindai“ 📚

Geriausia, jei mėgstate aiškumą ir teoriją.
Pagrindinės temos: regresija, šališkumas-dispersija, tikimybinis mąstymas, optimizavimas.
Šaltiniai: Stanfordo CS229 medžiaga, MIT įvadas į gilųjį mokymąsi. [1][2]

3) Gen-AI programėlių kūrėjo kelias ✨

Geriausiai tinka, jei norite kurti asistentus, paiešką, darbo eigas ir kitus su agentais susijusius dalykus.
Dėmesys sutelktas į raginimus, paiešką, vertinimus, įrankių naudojimą, saugos pagrindus, diegimą.
Dokumentai, kuriuos reikia turėti po ranka: platformos dokumentai (API), HF kursas (įrankiai).

Vėliau galėsite persirikiuoti. Pajudėti iš vietos yra sunkiausia.

Palyginimo lentelė – geriausi mokymosi būdai (su sąžiningais keistenybėmis) 📋

Įrankis / Kursas	Auditorija	Kaina	Kodėl tai veikia (trumpai)
„Google“ mašininio mokymosi greitasis kursas	pradedantiesiems	Nemokama	Vizualinis + praktinis; vengiama pernelyg sudėtingų dalykų
„Kaggle Learn“ (įvadinis + pažengęs mašininio mokymosi lygis)	pradedantiesiems, mėgstantiems praktiką	Nemokama	Trumpos pamokos + momentiniai pratimai
fast.ai Praktinis gilusis mokymasis	statybininkai su šiek tiek programavimo	Nemokama	Tikrus modelius apmokai anksti – tarsi iš karto 😅
„DeepLearning.AI“ mašininio mokymosi specializacija	struktūrizuoti besimokantieji	Mokama	Aiškus progresas taikant pagrindines mašininio mokymosi koncepcijas
„DeepLearning.AI“ gilaus mokymosi specifikacija	ML pagrindai jau	Mokama	Tvirtas neuroninių tinklų ir darbo eigų išmanymas
Stanfordo CS229 užrašai	teorija pagrįstas	Nemokama	Rimti pagrindai („kodėl tai veikia“)
scikit-learn naudotojo vadovas	Mokinių mokytojų specialistai	Nemokama	Klasikinis lentelių / bazinių linijų įrankių rinkinys
PyTorch pamokos	gilaus mokymosi kūrėjai	Nemokama	Švarus kelias nuo tenzorių → mokymo ciklai [4]
Apkabinančio veido LLM kursas	NLP + LLM kūrėjai	Nemokama	Praktinis LLM darbo eiga + ekosistemos įrankiai
NIST dirbtinio intelekto rizikos valdymo sistema	kiekvienas, diegiantis dirbtinį intelektą	Nemokama	Paprasti, tinkami naudoti rizikos / valdymo pastoliai [5]

Maža pastaba: žodis „kaina“ internete keistas. Kai kurie dalykai yra nemokami, bet reikalauja dėmesio... o tai kartais dar blogiau.

Pagrindinių įgūdžių rinkinys, kurio jums iš tikrųjų reikia (ir kokia tvarka) 🧩

Jei jūsų tikslas yra „Kaip išmokti dirbtinio intelekto nepaskendant“, siekite šios sekos:

Python pagrindai

Funkcijos, sąrašai/diktantai, lengvosios klasės, failų skaitymas.
Būtinas įprotis: rašyti mažus scenarijus, o ne tik užrašų knygeles.

Duomenų tvarkymas

NumPy mąstymas, pandų pagrindai, siužetų kūrimas.
Čia praleisite daug laiko. Ne itin žavinga, bet toks jau darbas.

Klasikinė mašininė technika (nepakankamai įvertinta supergalia)

Traukinio/bandymo padalijimai, nuotėkis, per didelis pritaikymas.
Linijinė/logistinė regresija, medžiai, atsitiktiniai miškai, gradiento stiprinimas.
Metrikos: tikslumas, preciziškumas/atkūrimas, ROC-AUC, MAE/RMSE – žinokite, kada kiekvienas iš jų yra prasmingas. [3]

Gilus mokymasis

Tenzoriai, gradientai/atgalinė atrama (konceptualiai), mokymo ciklai.
CNN vaizdams, transformatoriai tekstui (galiausiai).
Keletas pagrindinių „nuo galo iki galo“ „PyTorch“ principų yra labai naudingi. [4]

Generatyviojo dirbtinio intelekto ir teisės magistro (LLM) darbo eigos

Tokenizavimas, įterpimai, paieškos papildyta generacija, vertinimas.
Tikslus derinimas ir raginimas (ir kai nereikia nei vieno, nei kito).

Žingsnis po žingsnio planas, kurio galite laikytis 🗺️

A etapas – priverskite savo pirmąjį modelį veikti (greitai) ⚡

Tikslas: kažką apmokyti, išmatuoti, patobulinti.

Atlikite trumpą įvadinį kursą (pvz., „ML Crash Course“), o tada – praktinį mikrokursą (pvz., „Kaggle Intro“).
Projekto idėja: numatyti būsto kainas, klientų kaitą ar kredito riziką naudojant viešą duomenų rinkinį.

Mažas „laimėjimo“ kontrolinis sąrašas:

Galite įkelti duomenis.
Galite apmokyti bazinį modelį.
Perteklinį pritaikymą galite paaiškinti paprasta kalba.

B etapas – susipažinkite su tikrais mašininio mokymosi pratimais 🔧

Tikslas: nustoti stebėtis įprastais gedimų režimais.

Išnagrinėkite tarpines mašininio mokymosi temas: trūkstamas vertes, nuotėkį, vamzdynus, variacijos koeficientą (CV).
Peržvelkite keletą „scikit-learn“ naudotojo vadovo skyrių ir paleiskite juose esančius fragmentus. [3]
Projekto idėja: paprastas kompleksinis vamzdynas su išsaugotu modeliu + vertinimo ataskaita.

C etapas – gilus mokymasis, kuris neatrodo kaip magija 🧙♂️

Tikslas: apmokyti neuroninį tinklą ir suprasti mokymo ciklą.

Atlikite „PyTorch“ pagrindų mokymosi kelią (tenzoriai → duomenų rinkiniai / duomenų įkėlėjai → mokymas / vertinimas → išsaugojimas). [4]
Jei norite greičio ir praktiškumo, galite derinti su „fast.ai“.
Projekto idėja: vaizdų klasifikatorius, nuotaikų modelis arba mažas transformatorius, tiksliai sureguliuotas.

D etapas – generatyvinės dirbtinio intelekto programėlės, kurios iš tikrųjų veikia ✨

Tikslas: sukurti kažką, ką žmonės naudotų.

Sekite praktinį teisės magistro (LLM) kursą + greitą tiekėjo instruktažą, kad nustatytumėte įterpimo, paieškos ir saugaus generavimo procesus.
Projekto idėja: klausimų ir atsakymų robotas, skirtas jūsų dokumentams (fragmentai → įterpti → gauti → atsakyti su citatomis) arba klientų aptarnavimo asistentas, atliekantis įrankių iškvietimus.

Matematikos dalis – išmok ją kaip prieskonius, o ne visą valgį 🧂

Matematika svarbi, bet laikas dar svarbesnis.

Minimali matematika pradžiai:

Tiesinė algebra: vektoriai, matricos, skaliarinės sandaugos (įterpimų intuicija). [2]
Skaičiavimas: išvestinių intuicija (nuolydžiai → gradientai). [1]
Tikimybė: skirstiniai, lūkesčiai, Bajeso teorijos pagrindu veikiantis mąstymas. [1]

Jei vėliau norėsite formalesnio pagrindo, peržiūrėkite CS229 užrašus, skirtus pagrindams, ir MIT įvadinį gilųjį mokymąsi, skirtą šiuolaikinėms temoms. [1][2]

Projektai, kurie priverčia atrodyti taip, lyg žinotumėte, ką darote 😄

Jei klasifikatorius kursite tik žaislų duomenų rinkiniuose, jausitės įstrigę. Išbandykite projektus, kurie primena realų darbą:

Bazinio lygio ir pirmojo mašininio mokymosi projektas („scikit-learn“): švarūs duomenys → stipri bazinė linija → klaidų analizė. [3]
LLM + paieškos programa: įkelti dokumentus → fragmentą → įterpti → gauti → generuoti atsakymus su citatomis.
Modelio stebėjimo mini prietaisų skydelis: registruoja įvestis/išvestis; seka signalus, panašius į poslinkį (net ir paprasta statistika padeda).
Atsakingas dirbtinio intelekto mini auditas: dokumentų rizikos, kraštutiniai atvejai, gedimų poveikis; naudoti lengvą sistemą. [5]

Atsakingas ir praktiškas diegimas (taip, net ir individualiems statybininkams) 🧯

Realybės patikrinimas: įspūdingos demonstracinės versijos yra lengvos; patikimos sistemos – ne.

Turėkite trumpą „modelio kortelės“ stiliaus README failą: duomenų šaltiniai, metrikos, žinomos ribos, atnaujinimų dažnis.
Pridėkite pagrindines apsaugos priemones (greičio apribojimus, įvesties patvirtinimą, piktnaudžiavimo stebėjimą).
Bet kokiems su naudotoju susijusiems ar pasekminiams atvejams taikykite rizika pagrįstą metodą: nustatykite žalą, išbandykite kraštutinius atvejus ir dokumentuokite mažinimo priemones. NIST dirbtinio intelekto RMF yra sukurtas būtent tam. [5]

Dažni spąstai (kad galėtumėte jų išvengti) 🧨

Šokinėjimas nuo vieno pamokos prie kito – „dar vienas kursas“ tampa visa jūsų asmenybe.
Pradedant nuo sunkiausios temos – transformatoriai yra šaunūs, bet už paprastus daiktus mokama nuoma.
Ignoruojant vertinimą – vien tikslumas gali būti akivaizdus. Naudokite tinkamus matavimo rodiklius. [3]
Neužsirašinėkite – darykite trumpus užrašus: kas nepavyko, kas pasikeitė, kas pagerėjo.
Jokių diegimo praktikų – net paprastas programėlės apvalkalas daug ko išmoko.
Praleisti rizikos mąstymą – prieš siųsdami prekes, parašykite du punktus apie galimą žalą. [5]

Baigiamosios pastabos – per ilga, neskaičiau 😌

Jei klausiate, kaip išmokti dirbtinio intelekto, štai paprasčiausias sėkmės receptas:

Pradėkite nuo praktinių mašininio mokymosi pagrindų (trumpas įvadas + „Kaggle“ stiliaus praktika).
Norėdami išmokti realių mašininio mokymosi darbo eigų ir metrikų, naudokite „scikit-learn“ . [3]
Norėdami gilaus mokymosi ir mokymo ciklų, pereikite prie „PyTorch“ . [4]
Įgykite teisės magistro (LLM) įgūdžių naudodamiesi praktiniais kursais ir API greitomis instrukcijomis.
Sukurkite 3–5 projektus , kurie apimtų: duomenų paruošimą, modeliavimą, vertinimą ir paprastą „produkto“ apvalkalą.
Riziką / valdymą traktuokite kaip „atlikto darbo“ dalį, o ne kaip papildomą priedą. [5]

Ir taip, kartais pasijusite pasimetę. Tai normalu. Dirbtinis intelektas yra tarsi mokyti skrudintuvą skaityti – įspūdinga, kai veikia, šiek tiek baugu, kai neveikia, ir reikia daugiau iteracijų, nei kas nors pripažįsta 😵💫

Nuorodos

[1] Stanfordo CS229 paskaitų užrašai. (Pagrindiniai mašininio mokymosi pagrindai, prižiūrimas mokymasis, tikimybinis rėminimas).
https://cs229.stanford.edu/main_notes.pdf

[2] MIT 6.S191: Įvadas į gilųjį mokymąsi. (Gilaus mokymosi apžvalga, šiuolaikinės temos, įskaitant teisės magistro studijas).
https://introtodeeplearning.com/

[3] „scikit-learn“: modelio vertinimas ir metrika. (tikslumas, preciziškumas/atkūrimas, ROC-AUC ir kt.).
https://scikit-learn.org/stable/modules/model_evaluation.html

[4] „PyTorch“ mokymo priemonės – susipažinkite su pagrindais. (Tenzoriai, duomenų rinkiniai / duomenų įkėlėjai, mokymo / vertinimo ciklai).
https://docs.pytorch.org/tutorials/beginner/basics/intro.html

[5] NIST dirbtinio intelekto rizikos valdymo sistema (AI RMF 1.0). (Rizika pagrįstos, patikimos dirbtinio intelekto gairės).
https://nvlpubs.nist.gov/nistpubs/ai/nist.ai.100-1.pdf

Papildomi ištekliai (spustelėjami)

„Google“ mašininio mokymosi greitasis kursas: skaitykite daugiau
„Kaggle Learn“ – įvadas į mašininį mokymąsi: skaitykite daugiau
„Kaggle Learn“ – vidutinio lygio mašininis mokymasis: skaitykite daugiau
fast.ai – Praktinis gilusis mokymasis programuotojams: skaitykite daugiau
„DeepLearning.AI“ – mašininio mokymosi specializacija: skaitykite daugiau
„DeepLearning.AI“ – gilaus mokymosi specializacija: skaitykite daugiau
scikit-learn Pradžia: skaitykite daugiau
„PyTorch“ mokymo programos (turinys): skaitykite daugiau
Apkabinančio veido teisės magistro kursas (įvadas): skaitykite daugiau
„OpenAI“ API – greitas kūrėjo paleidimas: skaitykite daugiau
„OpenAI“ API – koncepcijos: skaitykite daugiau
NIST AI RMF apžvalgos puslapis: skaitykite daugiau

Raskite naujausią dirbtinį intelektą oficialioje dirbtinio intelekto asistentų parduotuvėje

Apie mus

Atgal į tinklaraštį