Kompiuterinė rega nepavaldi emocijoms Pereiti į pagrindinį turinį

Kompiuterinė rega nepavaldi emocijoms

2025-07-06 10:00
„Kauno diena“, KTU inf.

JAV nacionalinės greitkelių eismo saugumo administracijos (NHTSA) duomenimis, net 94 proc. eismo įvykių įvyksta dėl žmogaus pasirinkimo ar klaidos. Galima išeitis – autonominės transporto priemonės. Ar technologija gali padaryti tai, ką ne visada sugebame mes?

Technologijos: autonominės sistemos remiasi daugybe duomenų iš skirtingų šaltinių – jutiklių, vaizdo kamerų, radarų.
Technologijos: autonominės sistemos remiasi daugybe duomenų iš skirtingų šaltinių – jutiklių, vaizdo kamerų, radarų. / „Shutterstock“ asociatyvi nuotr.

Teoriją papildo praktika

Kauno technologijos universiteto (KTU) studentas Bartas Lisauskas įsitikinęs, kad gali.

Jis vysto sistemą, kuri leistų kompiuterinei regai veikti efektyviai net tada, kai naudojami itin riboti skaičiavimo resursai.

Programų sistemų inžinerijos studijas baigiantis Bartas tikslingai ieškojo sprendimų, kurie turėtų praktinę vertę. Jį labiau domino ne teoriniai modeliai, o tai, kaip technologijos veikia realiomis sąlygomis. Šiandien tokios paieškos tampa vis aktualesnės – autonominės sistemos jau diegiamos ne tik transporte, bet ir pramonės, logistikos, aptarnavimo sektoriuose.

„Sukurti efektyvias ir saugias autonomines technologijas, kurios būtų naudingos realiame gyvenime, yra ganėtinai sudėtinga užduotis, reikalaujanti nemažai laiko ir pastangų“, – teigė B. Lisauskas.

Situacija gerėja, tačiau norint, kad šios technologijos būtų plačiai taikomos, būtina galvoti ir apie jų įgyvendinimo praktiką – tiek infrastruktūroje, tiek kasdienėse paslaugose. Viena iš sričių, kur, pasak jo, dar matomas neišnaudotas potencialas – išmanusis eismo valdymas miestuose.

Tikslumas ir operatyvumas

Autonominėms sistemoms reikia daugiau nei gebėjimo judėti – jos turi atpažinti aplinką, spręsti, kaip elgtis konkrečioje situacijoje, ir tai padaryti greitai.

Vienas svarbiausių komponentų – kompiuterinė rega. Ji leidžia sistemai stebėti, identifikuoti ir klasifikuoti objektus aplinkoje, pavyzdžiui, kitus automobilius, pėsčiuosius, kelio ženklus ar eismo juostas.

B. Lisauskas tikslingai ieškojo sprendimų, kurie turėtų praktinę vertę.

„Autonominės sistemos veikia remdamosi daugybe duomenų iš skirtingų šaltinių, tokių kaip jutikliai, vaizdo kameros, radarai. Visa ši informacija turi būti apdorota ir integruota, kad sistema galėtų suprasti savo aplinką ir priimti sprendimus realiu laiku“, – aiškino KTU magistro studijas baigiantis studentas.

Jis pabrėžė, kad kompiuterinės regos sprendimai ne tik leidžia tiksliai matyti aplinką, bet ir padeda sistemai prisitaikyti prie dinamiškų situacijų. Tai ypač svarbu autonominėse transporto priemonėse ar robotizuotuose įrenginiuose, kurių veikimas turi būti ne tik techniškai tikslus, bet ir saugus.

„Žmogaus sprendimai dažnai būna paremti patirtimi ar emocijomis, o kompiuterinė rega, jei tinkamai įgyvendinta, gali užtikrinti nuoseklų situacijų vertinimą“, – pridūrė jis.

Rytis Maskeliūnas, šio mokslinio projekto vadovas ir KTU Informatikos fakulteto (IF) Programų inžinerijos katedros profesorius, džiaugėsi, kad studijų metu studentai sprendžia realius, praktinius iššūkius, naudodami pažangius dirbtinio intelekto metodus. Barto projektas – puikus pavyzdys.

Transformerių architektūra

Vienas pagrindinių iššūkių – kaip užtikrinti, kad aplinkos suvokimas būtų ne tik tikslus, bet ir įgyvendinamas ribotų išteklių sąlygomis.

Šiam uždaviniui spręsti Bartas sukūrė semantinio segmentavimo modelį, pritaikytą efektyviam veikimui be galingos skaičiavimo įrangos.

Jo tikslas – suskirstyti vaizdą į atskiras kategorijas, tokias kaip kelias, automobilis, dangaus zona ar šaligatvis. Ši užduotis reikalauja didelio skaičiavimo pajėgumo, ypač jei siekiama aukšto tikslumo.

„Tokia sistema kuriama ribotų resursų aplinkoje, kurioje nėra galingos įrangos, o visus skaičiavimus reikia atlikti greitai ir efektyviai“, – sakė jis.

Modelis paremtas transformerių architektūra, papildyta dėmesio valdymo moduliu. Šis mechanizmas leidžia sistemai skirti daugiau skaičiavimo išteklių svarbiausioms vaizdo sritims, o mažiau – fonui ar nereikšmingiems elementams. Toks sprendimas leidžia padidinti efektyvumą neaukojant rezultatų tikslumo.

„Transformerių architektūra padeda efektyviai apdoroti duomenis, o kartu naudojamas dėmesio valdymas leidžia sistemai koncentruotis į svarbiausias vaizdo dalis. Tokia kombinacija suteikia geresnius rezultatus ribotų resursų sąlygomis“, – aiškino Bartas.

Pasak jo, reikia rasti balansą tarp modelio našumo ir efektyvumo: „Daugelis esamų modelių veikia gerai, tačiau reikalauja daug resursų. Mano tikslas – sukurti sistemą, kuri būtų ganėtinai lengva, kad ją būtų galima naudoti realiame įrenginyje, bet kartu ganėtinai tiksli, kad būtų naudinga.“

R. Maskeliūnas pabrėžė, kad šis darbas apie efektyviai skaičiavimo išteklius naudojančią semantinę segmentaciją per transformeriais grįstas architektūras rodo ne tik techninį gylį, bet ir puikų praktinių diegimo apribojimų suvokimą – esminį intelektinių sistemų inžinerijos aspektą.

„Barto sprendimui nereikia nei galingo grafinio apdorojimo procesoriaus, nei brangios plokštės – sprendimas puikiai veikia sename kompiuteryje. Studento tyrimas praplečia KTU plėtojamų dirbtinio intelekto inovacijų kryptį – dirbtinio intelekto integravimą su signalų apdorojimu, siekiant sukurti sistemas, kurios būtų ir protingos, ir efektyvios dinamiškoje realioje aplinkoje“, – teigė KTU profesorius.

Naujausi komentarai

Komentarai

  • HTML žymės neleidžiamos.

Komentarai

  • HTML žymės neleidžiamos.
Atšaukti
Komentarų nėra

Daugiau naujienų