Gripper mācās ... izmantojot izmēģinājumu un kļūdas

Dec 26, 2019

Iedvesmojoties no cilvēka rokas, LearningGripper ir četri pirksti. Ar mašīnmācīšanās programmatūras palīdzību šis satvērējs var apgūt sarežģītas darbības, piemēram, raksta uzņemšanu un orientēšanu. Iepriekš jādefinē pirkstu pamatpozīcijas un atgriezeniskās saites funkcija no vides; satvērējs iemācās visas citas kustību secības, izmantojot izmēģinājumu un kļūdu.

Kā parādīts ilustrācijā, LearningGripper uzdevums bija pagriezt bumbiņu, līdz logotips atrodas augšpusē. Sākumā satvērējs nejauši pārvietoja bumbu. Vietas sensors bumbā sniedza atgriezenisko saiti par to, cik tālu logotips atradās no satvērēja plaukstas. LearningGripper saņēma balvu, kuras pamatā bija punktu sistēma; punkti tiek apstrādāti mašīnmācīšanās programmatūrā. Laika gaitā programmatūra izstrādāja kustības stratēģiju, un satvērējs uzzināja, kādas darbības veikt noteiktā brīdī. Tas maina savus priekšlikumus saņemt pēc iespējas vairāk pozitīvu atgriezenisko saiti un visbeidzot atrod uzticamu risinājumu savam uzdevumam. Ja viena satvērēja stratēģija tiek nodota citam, otrais satvērējs to izmanto kā zināšanu bāzi, lai efektīvāk apgūtu savu stratēģiju.

LearningGripper parāda, kā sistēmas nākotnē spēs autonomi atrisināt sarežģītus uzdevumus bez sarežģītas programmēšanas. Pašmācības sistēmas, piemēram, LearningGripper, varēja uzstādīt uz ražošanas līnijas un pēc tam tām ļāva patstāvīgi optimizēt savu uzvedību