Неймовірна Athena

Створення комп'ютерної графіки для кіноіндустрії - дуже складний процес, що вимагає багато апаратних ресурсів, часу та людських сил. Інтелектуальних, очевидно, як писав товариш Ленін. Сьогодні ми розповімо вам про компанію Bit Theory Inc. і її творця Аллен Болден, який разом з командою не просто робить красиві картинки, а фактично розробляє справжнісінький штучний інтелект!

Креативний штучний інтелект

Головний козир BTI – програмне ядро ​​Athena, з яким Болден спілкується. Наприклад, він хоче побачити сцену із зеленим літаком, який летить над хмарами, і пише у спеціальному полі "a green jet flies above the clouds". У відповідь відразу з'являється готова візуалізація сцени, повністю придатна до подальшого доопрацювання силами художників комп'ютерної графіки. Але найкрутіше у всьому цьому те, що Athena навчається в процесі вирішення кожного завдання, а потім використовує накопичений досвід у наступних проектах.

Багато в чому Athena схожа на Watson, систему штучного інтелекту, розроблену компанією IBM. У 2011 році вона справила справжній фурор у телевізійній вікторині Jeopardy!, аналогом якого в Україні є «Своя гра». Питання вікторини Watson порівнював з 15-терабайтною базою знань із різних областей. У підсумку суперкомп'ютер переміг двох чемпіонів шоу: вони здобули по 200 і 300 тисяч доларів, а Watson зірвав джек-пот – цілий мільйон.

Автор Athena вважає, що алгоритм дій Watson можна порівняти з тим, як працює раціональна ліва півкуля головного мозку. Дії ж Athena більше тяжіють до іншої, творчої півкулі. Програма розуміє, що їй пишуть, але не відповідає словами, а візуалізаціями.

До речі, спочатку Болден зовсім не збирався створюватиштучний інтелект. Його кар'єра почалася в компанії Marvel Comics, куди він прийшов стажистом і раптово зрозумів, що дуже подобається програмувати. Для вивчення цієї справи він тимчасово залишив роботу і вступив до університету Берклі. Закінчивши навчання Аллен отримав серйозні знання в галузі штучного інтелекту та мережевої інфраструктури та повернувся назад до Marvel. Там на нього вже чекали колеги, які до цього часу повністю поринули в кінобізнес: «Гей, чувак, ти ж рубаєш у компах, так?».

Болдена попросили допомогти у вирішенні проблеми, що виникла під час реалізації одного з важливих проектів. Дедлайн виявився жорстким – потрібно було розібратися з усім за 5 днів. Тут напрацювання в області ІІ і стали в нагоді. «Я просто думав, що мої знання зроблять деякі обчислення швидше, але зрештою вийшло щось набагато більше», – каже Аллен.

Отже, Athena перетворює природну мову на якісну заготівлю для майбутнього візуального продукту. Головну мету своєї розробки Болден бачить у тому, щоб зробити роботу художників комп'ютерної графіки творчішою, а всю рутинну частину на кшталт коду та налаштувань для створення анімації перекласти на віртуальні плечі Athena.

До речі, коли Болден пише програмі щось, що вона зрозуміти не може, то Athena виставляє в цьому місці серію знаків запитання. Далі у Аллена два варіанти - зробити більш докладний опис або дати посилання на потрібний візуальний об'єкт, вже створений вручну. Після того, як Athena завершує свою роботу, художники беруть її результати за основу для роботи в Maya та 3ds MAX. Поки вони доводять графіку до ідеалу, Athena ніби «спостерігає» за тим, що роблять фахівці, зберігаючи всі дії у своїй базі даних, що постійно зростає, щоб використовувати «знання» в майбутньому.

Алгоритм дій у графіків такий: спочатку художники вирізують фрагменти з акторами, ефектами та іншими об'єктами, що рухаються, з кожного кадру, потім заповнюють кадр візуалізацією оточення і потім повністю відтворюють всю сцену в 3D.

Коли Болден створив Athena, система використовувала для роботи потужності кластера з 70 комп'ютерів, а заодно будь-які інші допоміжні обчислювальні машини, які Аллену вдавалося добути. Сьогодні Athena працює з кластером із 30 Lenovo ThinkStation D20: в основному вони оснащені двома чотириядерними процесорами Intel.

Два роки тому Болден керував колективом із 45 художників комп'ютерної графіки. Сьогодні на фірму працюють 150 графіків у США плюс зовнішні співробітники з Тайваню, Гонконгу та Сеулу. На додаток до робочих станцій Lenovo, на яких зберігається вся база знань Athena, команда BTI використовує ThinkStation D20, C20 та S20.

Болден порівняв швидкість різних комп'ютерів, які використовував. Наприклад, фрагмент із фільму «Трансформери: Темна сторона Місяця» довжиною в 196 кадрів система із шестиядерним процесором та 8 ГБ оперативної пам'яті обробляла 96 хвилин. А Lenovo ThinkStation D20 з двома чотириядерними Xeon і 12 ГБ оперативної пам'яті впоралася з тим самим завданням всього за 25 хвилин.

В іншому тесті Болден потрібно було візуалізувати 21 об'єкт, покритий намальованими художниками комп'ютерної графіки в Autodesk Maya волоссям. Окремих волосків було понад 140 тисяч! Lenovo Think Station S20 справлялася з кожним кадром приблизно за 5 хвилин, а інші обчислювальні машини, які були в розпорядженні Болдена, таке завдання просто не потягнули.

А провідний фахівець BTI з перетворення 2D-графіки на 3D каже, що раніше його основна програма (NUKE від The ​​Foundry) постійно «падала» під час вирішенняскладних завдань, мало не по кілька разів на день. Після того, як у компанії з'явилися Lenovo ThinkStation D20, нічого такого взагалі не відбувається.

Аллен Болден, звичайно, продовжує день за днем ​​удосконалювати Athena. Його мета – постійне підвищення ефективності робочих процесів, він хоче зробити виробництво комп'ютерної графіки швидше та дешевше без втрати якості. Але поки що система все-таки знаходиться на ранній стадії розвитку, тому в BTI запустили 18-місячний R&D проект. Автор Athena вважає, що продуктивність сильно зросте, якщо запустити програмне ядро ​​на 40 робочих станціях Lenovo одночасно. У цьому криється комерційний потенціал використання Athena і в зовнішніх проектах, а не тільки всередині BTI.