Як домашній штучний інтелект робить простіше і складніше

Коли в Facebook приходять нові розробники, чи то випускники коледжу, чи солідні працівники рівня віце-президентів, перші півтора місяця вони занурюються в Bootcamp — інтенсивну програму вивчення всіх нюансів великої кодової бази компанії і набору інструментів програмування, що надаються в їхнє розпорядження.

На зорі існування Facebook його перший розробник Марк Цукерберг зробив більш вагомий внесок у створення кодової бази, ніж будь-хто. Але за програмою Bootcamp, яку було запущено 2006-го, через два роки після заснування компанії в кімнаті гарвардського кампусу, сам він не навчався.

Однак посада глави Facebook — не та, яку можна залишити на шість тижнів задля підвищення кваліфікації. «Формально я не проходив навчання з Bootcamp, — повідомив Цукерберг минулого тижня. — Але ви, напевно, здогадуєтеся, що коли я запитую людей, мені відповідають досить швидко». Наша зустріч відбулася у просторій вітальні його класичного 113-річного дерев'яного будинку у каліфорнійському Пало-Альто, куди я приїхав на демонстраційний показ Джарвіса. Марк дав перше інтерв'ю щодо проекту саморозвитку нинішнього року.

Цукерберг сказав, що часто після завершення сеансу програмування почувається так само, як у період вивчення китайської — мови, яка була включена до його завдань із саморозвитку на 2010 рік. У нього виникає відчуття, що мозок, активізуючись, починає працювати на повну потужність.

Після року coding, here's Jarvis.

Posted by Mark Zuckerberg on Tuesday, 20 December 2016

Культура програмування Facebook наказує, що у разі збою в роботі слід взяти паузу івиправити помилку. Але це абсолютно не застосовується до надзайнятого керівника компанії, що роз'їжджає по всьому світу. "Або мене будуть відривати від ділових зустрічей, або комусь доведеться правити мій код, чого робити не можна", - говорить він. Ось так і пройшло вже досить багато часу відколи він по-справжньому програмував на роботі.

Але повернемося до цього року, в якому Цукерберг витратив приблизно 100–150 годин на свій домашній проект, названий на честь Джарвіса, футуристичного помічника Тоні Старка зі штучним інтелектом із фільмів та коміксів серії «Залізна Людина». Однак його Джарвіс більше схожий на домашню, суто персональну версію чогось на кшталт Alexa від Amazon. Суть у тому, що Марк та його дружина Прісцілла Чан через додаток на iPhone або бот Facebook Messenger можуть включати та вимикати світло, відтворювати улюблену музику, відкривати ворота друзям, готувати тости і навіть будити свою однорічну дочку Макс уроками китайської мови.

ПОНЕУРОЧНИЙ ЕКСПЕРИМЕНТ

Коли ви підійдете до володіння Марка Цукерберга площею 1,6 тисяч квадратних метрів на тихій зеленій вуличці в шикарному районі Силіконової долини, Джарвіс дізнається про вас і автоматично сповістить господаря про ваше прибуття. Але, найдивовижніше, як тільки ви проминете дерев'яні ворота на цитрусово-кленовій алеї, Цукерберг особисто постане перед вами.

Обговорення тим на кшталт Джарвіса — завдання, безумовно, простіше. Сидячи на темно-зеленому дивані у своїй вітальні поруч із обвішаним дредами Бістом, угорською вівчаркою, Цукерберг доступно пояснював, як система, створювана ним протягом останнього року, спрощує життя — правда, часом і ускладнює — для нього, Прісцілли та Макс.

інтелект

Цукерберг почав з демонстраційного показу бота Messenger, який вінрозробив як зовнішній інтерфейс системи. Використовуючи свій iPhone, він набрав прості команди для вимикання та включення світла — і справді світло згасло, потім запалилося.

Крім цього, він також працював над системою в плані реагування на голосові команди через розроблений ним додаток на iOS. Тут результати були менш однозначними. Команду відключення світла йому довелося давати системі чотири рази, перш ніж вогні згасли.

"Нічого собі. Мабуть, найбільший збій за весь час», — зніяковів він.

Цукерберг хотів, щоб Джарвіс був здатний певною мірою розуміти лінгвістичні нюанси.

Використання системи для відтворення музики пройшло успішніше. "Включи нам якусь музику", - віддав він команду, і через пару секунд з динаміків у вітальні дуже тихо заграла композиція Would I Lie to You Давида Гетти. «Гучче», — двічі сказав він, і система виконала команду. Припинити відтворення теж вдалося не з першого разу.

Одна з рис Джарвіса, якою Цукерберг особливо пишається, — здатність враховувати музичні уподобання його та Прісцилли. Коли вона просить Джарвіса зіграти що-небудь, система вибере пісню, виходячи саме з її, а не його переваг. При проектуванні також закладалася здатність системи реагувати такі запити, як відтворення певного стилю музики: наприклад, легка, сімейна, чи конкретного виконавця.

"Включи щось Red Hot Chili Peppers", - скомандував Цукерберг Джарвісу. Через кілька секунд система голосно включила у вітальні хіт «Нірвани» Smells Like Teen Spirit. "Досить близька аналогія, як думаєте?" — практично стверджуючи, спитав Марк.

Йому хотілося, щоб Джарвіс був у стані певною міроюрозуміти лінгвістичні аспекти. "Коли ви кажете йому "зіграй що-небудь", він відповідає, що "це щось може бути піснею, набором пісень, виконавцем, альбомом, [або] рекомендацією"".

Непростим завданням для Цукерберга було змусити Джарвіса аналізувати дуже схожі фрази. Ідеальним прикладом стала Адель. «Фраза "включи Someone Like You" означає команду відтворити цю конкретну пісню, - пояснює він. - Фраза "включи щось типу Адель" означає команду знайти рекомендації щодо виконавців, схожих з Адель, і відтворити деякі з їхніх пісень. Фраза "включи щось з Адель" означає команду знайти деякі з її кращих пісень і скласти список відтворення.

Фрази "Someone Like You", "щось типу Адель" і "щось з Адель" дуже схожі, але позначають зовсім різні речі. Розробка діапазону можливостей для виконання безлічі різних завдань (а не просто вмикання-вимикання світла) та здатності вловлювати різницю через зворотний зв'язок — ось над чим було цікаво працювати».

«ДОБРИЙ СПОСІБ РОЗСЕРДИТИ ДРУЖИНУ»

Одна річ — домогтися відтворення правильної музики, зовсім інша — переконатися, що Джарвіс не дратує Прісциллу.

Навіть просте прохання увімкнути-вимкнути світло або відтворити музику може нести в собі дивну неоднозначність, якщо неясно, де саме це потрібно зробити. Наприклад, деякі речі Цукерберг та його дружина називають по-різному: він каже «гостяна», вона — «вітальня». Таким чином, Джарвіс потрібно розуміти синоніми. Але Цукерберг не хотів просто запрограмувати різні фрази — навчання Джарвіса фразам та інші нюанси контекстуального характеру були набагато цікавішим завданням.

«Відбувається, наприклад, ось що, – пояснює Марк. - Якщо я скажу “включисвітло в цій кімнаті”, а світло буде надто яскравим, Прісцілла попросить “приглуши світло”, але без вказівки, в якій саме кімнаті. Тобто система має знати, де ми знаходимося. Ось ще неправильна інтерпретація контексту: я говорю "включи музику" - і музика починає грати в кімнаті Макс, тому що. ми були там раніше».

А раптом Макс уже спить? «Це просто ні в які ворота, добрий спосіб роздратувати дружину».

ПРОЩЕ, НІЖ ОЧІКАЛОСЯ. АЛЕ…

Зазвичай Цукерберг встановлює лише одне щорічне завдання саморозвитку, але в 2016 році їх було дві. Друга – пробігти 365 миль. При розробці Джарвіса спосіб життя Марка не був таким нерухомим, як у період читання книги кожні два тижні — завдання 2015 року.

По суті, Джарвіс займав менше часу, ніж «бігове» завдання, значною мірою завдяки колекції інструментів Facebook, які стали в нагоді Марку, наприклад, для розпізнавання зображень і голосів.

Ось чого він точно не очікував, так це того, що левова частка часу піде на пошук способів приєднання Джарвіса до різних систем в будинку: до системи управління домашнім освітленням, дверима і температурою Crestron, до телевізора Samsung, охоронних систем, потокових приставок Sonos та Spotify для музики, до всього, чим він збирався керувати.

Холодильники, які підключаються до Інтернету, не мають сертифікатів безпеки Facebook.

Строго кажучи, домашня мережа Цукерберга є частиною корпоративної інфраструктури Facebook. З метою її захисту всі пристрої, що підключаються до неї, повинні мати сертифікат безпеки Facebook, по суті представляє собою цифровий автентифікаційний ключ, який підтверджує безпеку конкретного пристрою.

Це обмежило список пристроїв, якими Марк міг управляти. Наприклад,Холодильники, які підключаються до Інтернету, не мають сертифікатів безпеки Facebook. Для більшості людей це не проблема, але Марк Цукерберг – не більшість. Насамперед потрібно було забезпечити абсолютну безпеку будинку.

Один із способів, який Цукерберг застосував для безпечного керування певними приладами, — використання комутаторів, що підключаються до Інтернету, які дозволяють дистанційно вмикати та вимикати принаймні електроживлення. Він хотів, щоб Джарвіс був здатний робити тости на сніданок зі скибочок хліба, які сам Марк попередньо поміщав би в тостер. Але жоден сучасний тостер у неробочому режимі не дозволить вам проштовхнути хліб – з міркувань безпеки. Тому Марк купив старовинний, з 1950-х років, тостер, щоб реалізувати цей задум.

Зрештою, підключення всіх пристроїв саме таким чином, як він запланував, зажадало багатьох годин зворотної розробки програмного забезпечення, що постачається з продуктами та службами, які він застосовував, — і це було до того, як він розпочав безпосередньо програмування штучного інтелекту.

«ЦЕ НЕ СЕРІЙНА СИСТЕМА, ГОТОВА ДО ВИКОРИСТАННЯ»

Незважаючи на не зовсім ідеальну роботу Джарвіса у присутності журналіста, Цукерберг пишається тим, чого він досяг у цьому проекті, і хоче порівняти свої результати з доступними на ринку системами, такими як Echo від Amazon (на платформі Alexa) та Home від Google (на платформі Google Assistant).

«Це не серійна система, яка готова до масового використання, — наголошує він. — Але, якби я не зміг розробити систему, яка здатна робити принаймні те, що можуть [Echo і Home], я, мабуть, сильно розчарував би сам себе».

Він поспішає додати, що створення систем на кшталтпродуктів від Amazon і Google, розроблених з метою забезпечення мільйонів людей можливістю керувати безліччю пристроїв, завдання набагато складніше, ніж розробка штучного інтелекту для одного будинку, і що він жодним чином не применшує результатів цих компаній. Також він повідомив, що не планує робити цю систему продуктом Facebook.

«Але, — продовжує він, — якби я не міг розширити функціонал штучного інтелекту в галузі рекомендацій музики, або розпізнавання осіб, або розуміння контексту в рамках мого пересування по дому, то навряд чи можна було б вважати, що я по- справжньому розвиваю проект».

Одна з тем для вивчення пов'язана з тим, як ми взаємодіємо з текстом і голосом. Голосові команди Джарвіса та зворотний зв'язок від нього застосовні для відтворення музики. (У демо-версії, яку я отримав, Джарвіс розмовляє синтезованим жіночим голосом, що нагадує Siri або Alexa. Морган Фрімен ще не встиг записати весь текст для системи.) Але Цукерберг раптом зрозумів, що в багатьох випадках текстові команди кращі, особливо якщо навколо люди.

«Коли я пропускаю людину через ворота, це не стосується нікого довкола мене, — міркує він, — тож я, швидше за все, просто наберу текстову команду».

Навіть якщо він вимовляє команду, він часто вважає за краще, щоб Джарвіс відповідав йому в текстовій формі або «показував, а не промовляв те, що збирається робити». «Бо, — пояснює Марк, — коли він каже, це потребує уваги, і це своєрідна дратівлива річ».

Тим не менш, є моменти, коли голос стає вирішальним. «Якщо ви розмовляєте з ним і він може вам відповісти, виникає набагато сильніше почуття, - не стверджую, що він частина сім'ї, це вже занадто,- Він сприймається більш матеріалізованим, а Макс обожнює його», - говорить Цукерберг.

Цукерберг не має ілюзій, він розуміє, що створений ним менш ніж за 150 годин продукт не можна порівнювати з тим, що здатні виробити за тисячу і більше годин професіонали Facebook у галузі штучного інтелекту (не кажучи вже про окремих найбільш талановитих в галузі людей), до того ж що один інженер може присвятити якомусь проекту цілий рік.

Проте майже через рік всеосяжних допитливих досліджень він допрацював Джарвіса до того стану, коли готовий показати його світу. Він каже, що продовжуватиме возитися з ним, бо сам використовує його щодня, і що постійно вноситиме доробки чи нові функції. Але він цілком задоволений тим, що має зараз його сім'я.

«Це чудово - прокинувшись, просто сказати йому "доброго ранку". Або прокинутися, а за тобою прокидається будинок, — ділиться враженнями Марк. — І, знову ж таки, здорово, коли ти можеш лягти спати, не обтяжуючи себе вимкненням усіх приладів, а лише сказати «на добраніч» — і все в будинку вимикається, і можна бути впевненим, що двері замкнені».

Цукерберг, звичайно ж, не просто чоловік і батько, який хоче зробити життя своєї родини в будинку кращим. Він ще й голова компанії, доля якої залежить від того, наскільки ефективно вона дає змогу розробникам створювати великі речі. І одним із найкращих моментів у роботі над проектом «Джарвіс» було отримання оновленого уявлення про досвід програмування Facebook.

«Провівши стільки часу за програмуванням за допомогою інструментів Facebook — чим я в принципі не займаюся, будучи головою компанії, — я отримав повноцінний досвід подібно до новачків і досвідчених розробників у Facebook. І я ще більше оцінив те, з чимвпритул попрацював — всі ці внутрішні інструменти, які ми створили і які стали значною частиною культури компанії», — резюмує Марк.