Dirbtinio intelekto naujienos, 2026 m. gegužės 29 d

Dirbtinio intelekto naujienų santrauka: 2026 m. gegužės 29 d

„Cognition“ atstovas Scottas Wu teigia, kad dirbtinio intelekto kodavimo agentai neturėtų pakeisti žmonių ↗

„Cognition“ atstovas Scottas Wu atmetė mintį, kad „Devin“ sukurtas tam, kad visiškai pakeistų programuotojus. Tai šiek tiek keista pozicija, atsižvelgiant į tai, kad bendrovė taip pat teigia, jog „Devin“ didžiąją dalį savo kodo kuria pats.

Jo posakis labiau primena „dirbtinio intelekto programuotojo bičiulį“ nei „tavo darbą suvalgė nešiojamojo kompiuterio goblinas“. Vis dėlto įtampos sunku nepastebėti – geresni agentai, mažiau pasiteisinimų išsipūtusioms inžinierių komandoms... arba bent jau taip teigiama.

Šis dirbtinio intelekto startuolis nemokamai valys jūsų namus ir apmokys būsimus robotus ↗

„Shift“ siūlo nemokamą namų valymą su vienu patogiu ir šiek tiek nerimą keliančiu triuku: valytojai dėvi kameromis aprūpintą „stebuklingą skrybėlę“, kad įmonė galėtų rinkti robotų mokymo duomenis.

Pasiūlymas paprastas – jūs gaunate švarų butą, o jie – namų ruošos darbų vaizdo įrašą. Galbūt tvarkingas sandoris.

„Shift“ teigia, kad ji sulieja jautrias detales ir anonimizuoja filmuotą medžiagą, tačiau platesnis klausimas vis dar guli ten kaip kojinė po sofa: kiek namų privatumo žmonės nori aukoti dėl patogumo?

„Anthropic“ išleidžia „Claude Opus 4.8“ ↗

„Anthropic“ išleido „Claude Opus 4.8“ su patobulinimais, skirtais kodavimui, agentų darbo eigoms, samprotavimams ir profesionaliam darbui. Svarbiausias privalumas – patikimumas – mažiau nepagrįstų teiginių, geresnis įrankių naudojimas ir daugiau savikontrolės funkcijų.

„Claude Code“ taip pat turi dinaminius darbo eigą, leidžiantį modeliui planuoti, paleisti lygiagrečius subagentus, tikrinti rezultatus ir teikti ataskaitas. Tai skamba sausai, kol nesupranti, kad tai iš esmės projektų valdymas užmaskuotame ore.

Kainodara išlieka padalinta tarp standartinio ir greitojo režimų, o „Anthropic“ labiau orientuojasi į pastangų valdymą, kad vartotojai galėtų kompromisuoti dėl greičio, kokybės ir žetonų deginimo.

„Foxconn“ pirmininkas teigia, kad dėl dirbtinio intelekto kyla didžiulis augimo pagreitis ↗

„Foxconn“ pirmininkas teigė, kad dirbtinio intelekto paklausa keičia įprastą bendrovės sezoninį ritmą. Senas tiekėjų nuosmukis metų viduryje? Matyt, nebeveikia įprastai.

Priežastis – milžiniškos debesų kompiuterijos milžinių išlaidos dirbtiniam intelektui, kurias „Foxconn“ laiko savo rinkos galimybe. Tai dirbtinio intelekto bumo aparatinės įrangos pusė, mažiau blizgi nei pokalbių robotai, bet būtent iš jos skamba pinigų srautai.

„Foxconn“ jau yra viena pagrindinių „Nvidia“ serverių gamintojų, todėl jos optimizmas iš esmės yra dirbtinio intelekto infrastruktūros lenktynių temperatūros patikrinimas.

Bendras patikimų trečiųjų šalių vertinimų vadovas ↗

„OpenAI“ paskelbė trečiųjų šalių dirbtinio intelekto vertinimų gaires, teigdama, kad testuose reikia aiškiau aprašyti, kas buvo vertinama, kaip tai buvo testuojama ir ką gali įrodyti rezultatai.

Pagrindinis teiginys yra stebėtinai praktiškas: dirbtinio intelekto vertinimai negali būti tik spėlionės, paremtos lyderių lentelėmis. Vertintojai turi paaiškinti testuojamą sistemą, raginimus, apsaugos priemones, galiojimo patikrinimus ir kur baigiasi teiginiai.

Tai svarbu, nes modeliams tampant vis labiau agentiškiems, paviršutiniški testai gali parodyti, kad sistemos yra saugesnės ar stipresnės, nei yra iš tikrųjų. Maža popierizmo energija, didelės pasekmės.

DUK

Ar dirbtinio intelekto kodavimo agentai, tokie kaip Devinas, skirti pakeisti programuotojus?

Scottas Wu DI kodavimo agentus apibūdina kaip kodavimo partnerius, o ne kaip visiškus žmonių programuotojų pakaitalus. Tačiau straipsnyje atkreipiamas dėmesys į prieštaravimą: Devinas taip pat apibūdinamas kaip prisidėjęs prie didelės dalies paties „Cognition“ kodo. Praktiškai tai reiškia, kad šie įrankiai gali sumažinti kai kuriuos įprastus inžinerinius darbus, tuo pačiu vis tiek pasikliaujant žmonių sprendimais, nurodymais ir atskaitomybe.

Kodėl „Shift“ siūlo nemokamą namų valymą naudojant dirbtinio intelekto mokymo duomenis?

„Shift“ siūlo nemokamą namų valymą, nes jai reikia fizinio pasaulio vaizdo duomenų apie namų ruošos darbus, kad galėtų apmokyti būsimus robotus. Valytojai dirbdami dėvi kameromis aprūpintą „stebuklingą skrybėlę“, kuria filmuotą medžiagą, kuri gali padėti dirbtinio intelekto sistemoms suprasti namų ruošos užduotis. Mainai aiškūs: klientai gauna švarius namus, o įmonė gauna duomenis iš privačių gyvenamųjų erdvių.

Kaip „Shift“ tvarko privatumą rinkdama namų valymo filmuotą medžiagą?

Straipsnyje teigiama, kad „Shift“ teigia, jog ji sulieja jautrias detales ir anonimizuoja filmuotą medžiagą. Tai gali sumažinti tam tikrą privatumo riziką, tačiau nepašalina platesnio masto susirūpinimo dėl filmavimo žmonių namuose. Vartotojams pagrindinis klausimas yra, ar nemokamo valymo patogumas vertas tokio lygio duomenų rinkimo.

Kas naujo „Claude Opus 4.8“ versijoje?

„Claude Opus 4.8“ apibūdinamas kaip patobulintas kodavimas, agentiniai darbo eigos, samprotavimai ir profesionalus darbas. Atnaujinime daugiausia dėmesio skiriama patikimumui, įskaitant mažiau nepagrįstų teiginių, tvirtesnį įrankių naudojimą ir daugiau savikontrolės. „Claude Code“ taip pat įgauna dinaminių darbo eigų, kur modelis gali planuoti, vykdyti lygiagrečius subagentus, tikrinti rezultatus ir teikti ataskaitas apie rezultatus.

Kodėl „Foxconn“ optimizmas dėl dirbtinio intelekto bumo yra svarbus?

„Foxconn“ pasitikėjimas yra svarbus, nes jis atspindi dirbtinio intelekto bumo techninės įrangos pusę. Bendrovės pirmininkas teigė, kad dirbtinio intelekto paklausa keičia įprastą sezoniškumą, o debesų gigantų išlaidos infrastruktūrai sukuria didelę rinkos galimybę. Kadangi „Foxconn“ jau yra didelė „Nvidia“ serverių gamintoja, jos komentarai yra stiprus signalas apie dirbtinio intelekto infrastruktūros paklausą.

Kas, pasak „OpenAI“, trečiųjų šalių dirbtinio intelekto vertinimus daro patikimus?

„OpenAI“ teigia, kad dirbtinio intelekto vertinimams reikia aiškesnių paaiškinimų, kokia sistema buvo testuota, kaip ji buvo testuota ir ką iš tikrųjų rodo rezultatai. Tai apima informaciją apie raginimus, apsaugos priemones, galiojimo patikrinimus ir bet kokių teiginių ribas. Šis aspektas ypač svarbus agentiškesniems modeliams, kur paviršutiniški testai gali parodyti, kad sistemos yra saugesnės arba pajėgesnės, nei yra iš tikrųjų.

Prekė įdėta į krepšelį