Дресирування роботів як альтернатива програмуванню, Комп’ютера

Найближчим часом слід очікувати масового випуску роботів різних моделей. Наділених цілком дієздатними «нервовими системами» – основами яких будуть і нейрочіпи, і надчутливі датчики та надкомпактні та наддешеві мікросхеми для «інтернету речей». І ці роботи зможуть взяти на себе більшу частину важкої, брудної і рутинної роботи. Тільки треба, щоб роботів хтось навчив це робити.

У п'єсі Карела Чапека “R.U.R”, яка і ввела у лексикон людства слово «робот», це навчання здійснювалося складі, куди надходили з фабрики свіжовиготовлені штучні працівники. Там «іде їхнє остаточне оздоблення». Там вони «вчаться говорити, писати та рахувати. … А потім їх сортують та розсилають замовникам.» В результаті робот, що надходить до споживача, був схожий на ідеально вишколеного дворецького, з яким можна говорити природною мовою і давати звичайнісінькі накази.

«Загалом, я сів за свій пульт, розгорнув програму і почав її вилизувати — команду за командою, групу за групою, поле за полем. Треба сказати, жодних дефектів не виявив. За цю частину програми, яку складав я сам, я й раніше був готовий відповідати головою, а тепер готовий був відповідати і своїм добрим ім'ям на додачу. Зі стандартними полями справа була гірша. Багато хто з них був мені знайомий мало, і якби я взявся кожне таке стандартне поле контролювати наново, обов'язково зірвав би графік робіт. Тому я наважився на компроміс. Я тимчасово вимкнув із програми всі поля, які поки не були потрібні, спростив програму до найвищої межі, ввів її в систему управління і поклав палець на пускову клавішу ... »

Чи не правда, ситуація, описана братами Стругацькими вповісті «Малюк» дуже знайома багатьом із наших читачів. Незважаючи на те, що справа там відбувається на далеких світах, а роботи-будівельники, яких програмує герой-оповідач, значною мірою побудовані з живих тканин – майже як прабатьки жанру, «потвора Франкенштейна» Мері Шеллі та роботи Чапека.

Але для масового споживача – а роботи мають шанси прижитися у побуті лише за масових обсягів збуту – програмування справа непідйомна. Радянський експеримент із масовим викладанням основ програмування у школах – причому на високому науковому рівні та чудовим методичним забезпеченням – канув у лету. Дітей нині прийнято не напружувати зайвими знаннями, а джентльменський набір «кваліфікованого споживача» вміння програмувати алгоритмічними мовами не входить; навпаки, пропонується не перевіряти грамотність випускників.

Отже – намічається протиріччя. Готовий новий споживчий товар, який потенційно може мати наймасовіший попит. Але, водночас, рівень грамотності споживачів виключає можливість більшості користуватися цим товаром… Проте суперечність це виявилося діалектичним, породжуючим розвиток. Яке ми і спостерігаємо як каліфорнійської фірми Brain Corporation.

Метою робіт цієї корпорації є позбавити власників та користувачів роботів від потреби у програмуванні. Дозволити їм не програмувати, а навчати робота приблизно так, як дресирується собака. Використовувати пульт дистанційного керування для того, щоб сервісний робот виконав кілька дій, наприклад, прибирання сміття. Ну а потім він зможе виконувати їх самостійно.

Старший віце-президент Brain Corporation Тодд Хілтон демонструє колісного робота, здатного навчатися слідувати жестамвласника.

Як центральний процесор буде використовуватися кристал фірми Qualcomm, яка за дивним збігом є інвестором у цей стартап. Саме він дозволяє роботу розпізнавати жести, пов'язувати їх з належними діями і надалі реагувати на них подібно до дресованої тварини.

Виглядає це дуже просто. Але під простими на перший погляд діями крихітних систем лежить величезний теоретичний доробок. Генеральний директор та співзасновник Brain Corporation Євген Іжикевич кілька років тому створив найбільшу на той момент модель кори головного мозку, яка змогла відтворити низку властивостей реального мозку. Він тісно співпрацював з Qualcomm у роботі над нейроморфними кристалами.

Але поточна версія BrainOS буде проводитися для роботи на класичних, фоннейманівських, багатоядерних процесорах. Мабуть, такий шлях був обраний для того, щоб у найкоротший час довести новий продукт для споживачів. Перехід на перспективні нейроморфні процесори слід чекати найближчим часом. При цьому значно збільшать «інтелектуальні» можливості роботів.

Підхід з демонстрацією роботу правильної поведінки прийшов на зміну методу «навчання з підкріпленням», що досліджувався раніше Brain Corporation, в якому робот демонстрував у випадковому порядку різні моделі поведінки, а правильні з них заохочувалися і закріплювалися навчальним. (Мартін Гарднер колись описував автомат для гри в «хрестики-нуліки», зроблений із сірникових коробок і який навчається за такою методикою…)

Але те, що добре при роботі з математичними моделями, куди менш придатне для реального світу. Роботи, пробуючи випадкові алгоритми поведінки, за словами Іжикевича, шкодять самі собі. «Через рік рибалка не витерпів і кинувся з човна в озеро,зв'язавши собі ноги мотузкою, щоб ненароком не поплисти. Потай він взагалі не вірив у смерть, головне ж, він хотів подивитися — що там є: може бути, набагато цікавіше, ніж жити в селі або на березі озера;…» Отже, все ж таки краще робити те, що роблять інші. Навіть роботам.

Підхід до навчання роботів, заснований на принципі «роби, як я», може суттєво прискорити масове впровадження сервісної робототехніки буквально у всі галузі рутинної людської діяльності, у тому числі й прибирання приміщень та дворів, і збирання ягід… Досить один раз показати машині, що треба робити, а далі вона справлятиметься сама. Втім, і тут потрібна обережність – як писав Марк Твен: «Китайця зазвичай не доводиться вчити чогось двічі. Він дуже переймливий. Якщо господареві трапилося б при своєму слузі китайці в пориві гніву розламати стіл і кинути тріски в грубку, то його слуга китаєць надалі завжди топив би печ меблями.». Не вийшло б так і з роботом.