Діалогові системи та машинне навчання

Лабораторія нейронних мереж та глибокого навчання МФТІ

Михаїл Бурцев, завідувач лабораторії:

— Лабораторія молода: у нашій команді поки що лише п'ятеро людей, роботи — неоране поле, але ми серйозно налаштовані. Основним напрямом обрали розробку та дослідження діалогових систем — онлайн-консультанти, помічники, які відповідають компетентно на всі питання користувача. У багатьох компаній і зараз є такі сервіси, однак або вони погано працюють, постійно видаючи помилки, або по той бік монітора сидить жива людина, яка не може бути в мережі 24/7, до того ж, їй треба платити. Ми хочемо розробити алгоритм, який дозволить створювати роботів, здатних до повноцінної розмови. Такий робот зможе за лічені хвилини купити вам квиток на літак або проконсультувати з будь-якого питання. Зараз такого рівня систем немає.

Нейронні мережі та штучний інтелект

Ідея нейронних мереж народилася в середині XX століття США разом з появою перших ЕОМ. Нейрофізіологи, які вивчали теоретичні аспекти роботи мозку, вважали, що організація роботи комп'ютера за образом і подобою людського мозку дозволить вже в найближчому майбутньому створити перший штучний інтелект.

Відмінність штучного інтелекту від усіх алгоритмів минулого покоління полягає в тому, що навчена нейронна мережа діє не заданим шляхом, а самостійно шукає способи найбільш ефективного досягнення мети. Робота одиночного комп'ютерного «нейрона» виглядає так: для навчання на вхід програми подаються об'єкти, що належать двом типам — А і Б — і мають якесь числове значення. Програма, виходячи з даних у навчальній вибірці, розуміє, які діапазони цього значення відповідають об'єктам А, а які —Б, і згодом може відрізняти їх самостійно. У реальних завданнях система повинна розрізняти безліч типів, кожен з яких, своєю чергою, може бути десятки властивостей. Для їх вирішення необхідна складніша структура з шарів нейронів, серйозні обчислювальні потужності та велика кількість навчальних тестів. XXI століття стало початком ери, в якій ці технології вже можуть застосовуватися для вирішення повсякденних завдань.

Михайло Бурцев, завідувач лабораторії нейронних мереж та глибокого навчання МФТІ

Михаїл Бурцев, завідувач лабораторії:

— Концепція роботи нейронних мереж досить проста: ми даємо машині великий обсяг тексту, а вона запам'ятовує, як слова поєднуються одне з одним. На основі цієї інформації вона може подібні тексти відтворювати — машині для цього не обов'язково знати правила синтаксису, відмінювання та відмінювання. Вже зараз є нейронні мережі, які навчившись на творах Пушкіна, намагаються писати в його стилі. У цьому ще одна особливість нейронних мереж: вони навчаються тому «стилю», який їм дають на навчання. Якщо як матеріал дати Вікіпедію, програма сипатиме термінами і використовуватиме переважно публіцистичний стиль. Оскільки наша лабораторія працює над створенням запитально-відповідних систем, для навчання мережі ми використовуємо готові діалоги. В одному з експериментів використовували субтитри з фільмів – дали вивчити нашій мережі цілу сагу про вампірів. Проаналізувавши цей масив даних, нейронна мережа вже зараз може підтримати розмову.

Діалоги співробітників лабораторії з нейронною мережею

Команда: сьогодні та завтра

Лабораторія співпрацює з великими дослідницькими центрами на базі НДЯУ МІФІ та Курчатівського інституту. У її діяльності такожберуть участь і іноземні фахівці в галузі машинного навчання та нейроінформатики, наприклад Сергій Пліс із The Mind Research Network. Крім цього, регулярно проводяться заходи, націлені на популяризацію діяльності лабораторії та пошук молодих талантів. Перемога у хакатоні чи успішне проходження курсів дають непогані шанси потрапити до лабораторії.

Валентин Малих, співробітник лабораторії:

— Мій шлях до лабораторії був дуже непростим. Ще чотири роки тому я практично не стосувався теми машинного навчання. Потім зайнявся комп'ютерною лінгвістикою, і помчало. Кілька разів змінював роботу: спробував себе в робототехніці, займався розробкою програмного забезпечення, пов'язаного з комп'ютерним зором, там і познайомився з машинним навчанням, і мені захотілося займатися серйозними дослідженнями. За весь час роботи встиг з'їздити на кілька хакатонів, які організовувала лабораторія — мабуть найцікавіше, що сталося зі мною за той період. Після цього прийшов до хлопців і сказав, що хочу в них працювати. Мене забрали.

Хакатони, незважаючи на свою назву, ніяк не пов'язані зі зломом програмного забезпечення (hack — зламувати). Це командні змагання з програмування, в яких учасники протягом кількох днів, а іноді й тижнів б'ються над вирішенням якогось конкретного завдання. Тема хакатона оголошується заздалегідь, зазвичай беруть участь кілька сотень людей. Такі заходи організовують не лише інститути, а й великі компанії, які шукають талановитих спеціалістів. На базі Фізтеха лабораторія нейронних мереж і глибокого навчання організувала вже два хакатони — учасники протягом тижня слухали лекції про питання-відповіді та діалогові системи і писали код.

Учасникихакатона змагаються у вирішенні завдань

Владислав Бєляєв, співробітник лабораторії:

— Цього та минулого року ми влаштовували хакатони з машинного навчання. Заявок було дуже багато, причому не лише з України та СНД, а й з Європи, зі Штатів. Під час хакатону читали лекції вчені з Оксфорда та Стенфорда, Google DeepMind та OpenAI, та й українські колеги, звичайно. Зараз ми готуємо курс з нейронних мереж, розповімо все від початку і до кінця: від біологічної концепції та основних моделях у програмуванні до власне прикладного застосування та конкретної реалізації.

Михаїл Бурцев, завідувач лабораторії:

— Працювати доводиться багато, здається, я вже не пам'ятаю, що таке вільний час. Без жартів часу відпочити практично не знаходиться: за останні півроку ми разок змогли вибратися на шашлики компанією. Хоча в якомусь сенсі робота може бути відпочинком. На хакатонах та семінарах з'являється можливість поспілкуватись у менш формальній обстановці з колегами та завести нові знайомства. Традицій спільного проведення часу після роботи ми поки що завести не встигли — надто молоді. Влітку плануємо вибратися на природу всією лабораторією, зняти котедж і два тижні вирішувати найважчі та найцікавіші завдання разом — влаштуємо свій особистий міні-хакатон. Подивимося, наскільки такий підхід може бути ефективним. Можливо, це і стане нашою першою доброю традицією.

Зліва направо: Валентин Малих, Владислав Бєляєв, Олексій Озерін, Дмитро Хуснутдінов

Лабораторія буде розширюватись і вже зараз шукає нових співробітників. Найпростіший спосіб отримати місце — пройти двомісячне стажування, на яке відбирають за підсумками співбесіди. Необхідною умовою проходження співбесіди є виконання частини завдань курсуDeep Learning. Під час стажування є можливість взяти участь у виконанні оплачуваних проектів. Фінансування лабораторії поки що не налагоджено, проте, за словами співробітників лабораторії, найближчим часом цю проблему буде вирішено. «Потрапити до нас зараз означає отримати шанс стати «батьком-засновником» лабораторії в найперспективнішому напрямку інформаційних технологій», — каже Михайло Бурцев.

Зображення та фотографії надала лабораторія нейронних мереж та глибокого навчання МФТІ. Фотограф: Євген Пєлєвін.