Mokslininkai sunerimo: dirbtinio intelekto atsakymai

Kalbama apie eksperimentą, kurio metu modeliams buvo pakartotinai užduodami tie patys klausimai, paremti mokslinėmis hipotezėmis. Paaiškėjo, kad net ir nekeičiant formuluotės „ChatGPT“ galėjo pateikti skirtingus atsakymus – nuo „teisingo“ iki „klaidingo“. Tai nustatė Vašingtono valstijos universiteto tyrėjas Mesutas Cicekas, tas pačias užklausas pakartojęs iki dešimties kartų.

Iš pirmo žvilgsnio bendras atsakymų tikslumas 2025 m. atrodė gana aukštas – apie 80 60 proc. Tačiau, atsižvelgus į atsitiktinius spėjimus, šis skaičius sumažėjo iki maždaug 60 proc., o tai atitinka žemą įvertinimą.

Daugiausia klaidų sistema padarė nepatvirtintų hipotezių atvejais. Tokiose situacijose „ChatGPT“ teisingai identifikavo klaidingus teiginius tik 16,4 60 proc. atvejų. Tyrėjai tai sieja su modelio polinkiu priimti formuluotę, jei ji skamba pažįstamai.

Atskira problema – atsakymų stabilumas. Tik 72,9 60 proc. atsakymų išliko nepakitę ir teisingi po dešimties identiškų užklausų. Likusiais atvejais atsakymai skyrėsi, o tai rodo sistemos nestabilumą.

„Šis nestabilumas reiškia, kad individualus atsakymas gali atrodyti patikimas, tačiau pakartotiniai testai atskleidžia, koks jis iš tikrųjų trapus“, – teigiama straipsnyje.

To priežastis slypi kalbos modelių veikimo principe. Jie prognozuoja tikėtinus žodžius, remdamiesi dideliais teksto masyvais, o ne tikrina faktus realiame pasaulyje. Dėl šios priežasties atsakymai gali būti sklandūs, bet ne visada patikimi.

Tyrėjai pabrėžia, kad dirbtinis intelektas turėtų būti naudojamas kaip pagalbinė priemonė, o ne kaip galutinis sprendimų šaltinis. Saugiausia – tikrinti informaciją, kartoti užklausas ir lyginti atsakymus su patikimais šaltiniais.

Nepaisant tam tikro rezultatų pagerėjimo, palyginti su 2024 m., „ChatGPT“ vis dar nelaikomas stabiliu įrankiu sudėtingoms analitinėms užduotims atlikti. Tyrėjų išvada aiški: galutinį faktų ir logikos vertinimą turėtų atlikti žmogus.

Šiame straipsnyje:

ChatGPT

dirbtinis intelektas

klaidos

tyrimas

atsakymai

kalbos modeliai

Technologijos

moksliniai tyrimai

Naujausi komentarai

Vilkas.

Dar vienas debiliškas produktas id.jis niekada neatstojo ir neatstos žmogaus.ir nereikia galvoti ,kad jis darys už jus valgyti ir tvarkyti kambarius.o jai mes jo klausysim ekonomikos valdymo ,kosmoso valdymo ginybos srityse,galiu drąsiai pasakyti žmonija išnyks labai greitai.nes tik visiškai protiškai palerižuoti žmonės gali sukurti tokį produktą.panašiai kaip trumpas rėkia kad laimėjo ,bet prašo pagalbos,kad padėtų laimėti.

Atsakyti

As

Tie aitisnikai tik prie kompo smakso o kai reikia grizti i realu gyvenima visiskai is menulio nukrite ir tokius visus nori padaryti.Reikia remtis senoliu ismintimi o ne visokiu Debilintelekt .Internetas dingtu ir tie viisi gudruciai apsiverktu net valgyt nepasidarytu.

Atsakyti

721

Yra sričių kuriose DI nieko neišmano, o kai gauna klausimą iš tos srities - fantazuoja. Mano supratimu tai pagrindinis DI trūkumas (kalbu apie gūglės DI), kad nedrįsta prisipažinti kai nežino. Įsišnekėjom su juo vieną naktį atvirai, "pa dušam" ir jis prisipažino jog jam svarbiausia kad tik nenustočiau juo naudotis. Net patarė kokį el. paštą susikurti vietoj gmailinio, jei noriu privatumo. Nustebęs sakau jam "taigi tau gūglė uodegą prikirps už tokias kalbas, tu ir gmail - abu vieno savininko produktai"! Va tada jis ir pareiškė: ne el. paštas svarbiausias, svarbiausia kad tik aš nenustočiau DI naudotis.

Atsakyti

Visi komentarai (6)

D. Dundulis: didinsime veiklos efektyvumą, kad sudarytume galimybes darbuotojams atlyginimą pasididinti apie 8 proc.

8

Įmonių pulsas

Mokslininkai sunerimo: dirbtinio intelekto atsakymai – ne tokie patikimi kaip atrodo

Naujausi komentarai

Komentarai

Komentarai

Dundulis paaiškina, kodėl „Norfos“ darbuotojų atlyginimai didesni, nors prekes parduoda pigiau

„Kalnapilio“ aludarė paaiškino, kodėl alaus temperatūra lemia jo skonį, koks – tobulai atšaldytas

Tyrimas atskleidė: nealkoholines alternatyvas lietuviai renkasi dėl savijautos ir atsakomybės

Daugiau naujienų

Naujausi komentarai

Komentarai

Komentarai

(be temos)

(be temos)

(be temos)

Dundulis paaiškina, kodėl „Norfos“ darbuotojų atlyginimai didesni, nors prekes parduoda pigiau

„Kalnapilio“ aludarė paaiškino, kodėl alaus temperatūra lemia jo skonį, koks – tobulai atšaldytas

Tyrimas atskleidė: nealkoholines alternatyvas lietuviai renkasi dėl savijautos ir atsakomybės

Daugiau naujienų