Roboti koji razumiju kontekstualne naredbe

Two robots talking to each other. Gone wrong (Lipanj 2019).

Anonim

Unatoč onome što možete vidjeti u filmovima, današnji roboti još uvijek su vrlo ograničeni u onome što mogu učiniti. Mogu biti odlične za mnoge zadatke koji se ponavljaju, ali njihova nemogućnost razumijevanja nijansi ljudskog jezika čini ih uglavnom beskorisnim za složenije zahtjeve.

Na primjer, ako stavite određeni alat u alatnu traku i zamolite robota da ga "pokupi", to bi bilo potpuno izgubljeno. Podizanje gore znači biti u mogućnosti vidjeti i identificirati objekte, razumjeti naredbe, prepoznati da je "to" je alat koji ste stavili dolje, vratite se natrag u vrijeme da se sjetite trenutka kada stavite dolje alat i razlikovati alat koji ste odbačena od drugih sličnih oblika i veličina.

Nedavno su istraživači iz MIT-ovog Computer Science i Artificial Intelligence Laboratory (CSAIL) postali bliže olakšavanju takvog zahtjeva: u novom su radu predstavljeni Alexa sličan sustav koji robotima omogućuje razumijevanje širokog niza naredbi kojima je potrebna kontekstualna znanja o objektima i njihovim okruženjima. Oni su nazvali sustav "ComText" za "naredbe u kontekstu".

Gornja situacija alata bila je među vrstama zadataka koje ComText može podnijeti. Ako reći sustavu da "alat koji sam stavio dolje je moj alat", dodaje tu činjenicu u svoju bazu znanja. Nakon toga možete ažurirati robot s više informacija o ostalim objektima i izvršiti niz zadataka poput podizanja različitih skupova objekata na temelju različitih naredbi.

"Gdje ljudi razumiju svijet kao zbirku predmeta i ljudi i apstraktnih koncepata, strojevi ga vide kao piksele, točke-oblake i karte 3-D generirane od senzora", kaže CSAIL postdoc Rohan Paul, jedan od vodećih autora papir. "Ova semantička praznina znači da bi roboti trebali razumjeti ono što im želimo, trebaju mnogo bogatiju zastupljenost onoga što radimo i kažemo."

Tim je testovao ComText na Baxteru, dvobojnom humanoidnom robotu razvijenom za Rethink Robotics od strane bivšeg ravnatelja CSAIL-a Rodneyja Brooksa.

Projekt je vodio istraživač Andrei Barbu, uz istraživački znanstvenik Sue Felshin, viši znanstveni znanstvenik Boris Katz i prof. Nicholas Roy. Predstavili su članak na Međunarodnoj konferenciji o umjetnoj inteligenciji (IJCAI) u Australiji prošlog tjedna.

Kako radi

Stvari poput datuma, rođendana i činjenica su oblici "deklarativne memorije". Postoje dvije vrste deklarativne memorije: semantička memorija, koja se temelji na općim činjenicama kao što je "nebo je plavo" i epizoda sjećanja, koja se temelji na osobnim činjenicama, kao što je sjećanje na ono što se dogodilo na zabavi.

Većina pristupa učenja robota usmjerena je samo na semantičku memoriju, koja očito ostavlja veliki nedostatak znanja o događajima ili činjenicama koje mogu biti relevantni kontekst za buduće akcije. U međuvremenu, ComText može promatrati raspon vizualnih i prirodnih jezika kako bi prikupio "epizodnu memoriju" o veličini, obliku, položaju i vrsti objekta, pa čak i ako pripada nekom drugom. Iz te baze znanja može onda razumjeti, zaključiti značenje i odgovoriti na naredbe.

"Glavni doprinos je ta ideja da bi roboti trebali imati različite vrste memorije, baš kao i ljudi", kaže Barbu. "Imamo prvu matematičku formulaciju za rješavanje ovog problema, a mi istražujemo kako ove dvije vrste memorije igraju i rade jedni od drugih."

S ComTextom, Baxter je uspio izvršiti pravu naredbu oko 90 posto vremena. U budućnosti, tim se nada da će robotima omogućiti razumijevanje složenijih informacija, poput naredbi s više koraka, namjere djelovanja i upotrebe svojstava o objektima da bi ih prirodnije reagirale.

Na primjer, ako kažete robotu da jedna kutija na stolu ima krekere, a jedna kutija ima šećer, a potom od robota da "podigne snack", nadamo se da robot može zaključiti da je šećer sirovina i stoga vjerojatno neće biti netko "snack".

Stvaranjem mnogo manje ograničenih interakcija, ova linija istraživanja mogla bi omogućiti bolju komunikaciju za niz robotskih sustava, od samohodnih automobila do kućanskih pomoćnika.

"Ovaj je rad lijep korak prema robnim objektima koji mogu mnogo više komunicirati s ljudima", kaže Luka Zettlemoyer, izvanredni profesor računarstva na Sveučilištu u Washingtonu koji nije sudjelovao u istraživanju. "Osobito će pomoći robotima bolje razumjeti imena koja se koriste za prepoznavanje objekata u svijetu i tumačiti upute koje koriste te nazive kako bi bolje radile ono što korisnici traže".

menu
menu