Головна - Спеціалізація Yandex «Машинне навчання та аналіз даних»


Для кого ця спеціалізація
Для випускників і студентів

Для професійних аналітиків

Для директорів компаній
Особливості спеціалізації


Повністю українською

Підвищення кваліфікації на базі МФТІ
Дистанційно


Дипломний проект, застосовуваний на практиці
Працевлаштування в топові компанії

Лектори

Костянтин Воронцов

Вадим Стрижов

Євген Рябенко

Євген Соколов

Віктор Кантор

Емелі Драль
Програма навчання

Дипломний проект
«Математика та Python для аналізу даних»
Бібліотека Python та лінійна алгебра.
Оптимізація та матричні розкладання.
Аналіз даних та машинне навчання спираються на результати з математичного аналізу, лінійної алгебри та теорії ймовірностей. Без фундаментальних знань з цих наук неможливо зрозуміти методи аналізу даних.
Перший курс сформує цей фундамент. Ми без складних формул і доказів розкриємо зміст математичних понять та об'єктів.
«Навчання на розмічених даних»
Машинне навчання та лінійні моделі.
Лінійні моделі та оцінка якості.
Вирішальні дерева та композиції моделей.
Нейронні мережі та огляд методів.
Навчання на розмічених даних чи навчання з учителем — це можливість передбачити величину будь-якого об'єкта, маючи кінцеве число прикладів. Наприклад, рівеньпробок на ділянці дороги, вік користувача щодо його дій в інтернеті, ціну на уживану машину. На цьому курсі ви навчитеся формулювати та вирішувати такі завдання.
«Пошук структури даних»
Зниження розмірності та матричні розкладання.
Візуалізація даних та пошук аномалій.
З курсу ви дізнаєтеся про алгоритми кластеризації даних, за допомогою яких можна шукати групи подібних клієнтів мобільного оператора. Ви навчитеся будувати матричні розкладання та вирішувати завдання тематичного моделювання, знижувати розмірність даних, шукати аномалії та візуалізувати багатовимірні дані.
«Побудова висновків за даними»
Основи статистики та перевірка гіпотез.
АБ-тести: основи планування, дизайн та інтерпретація результатів.
Чи знання методів аналізу даних на рівень заробітної плати впливає? Чи працює система оцінки кредитоспроможності клієнтів банку? Чи справді новий банер кращий за старий? Щоб відповісти на такі запитання, потрібно зібрати дані. 99% даних містять " шум " , тому висновки з їхньої основі не вірні, лише ймовірні. На цьому курсі ви навчитеся робити коректні висновки, оцінювати параметри, перевіряти гіпотези та встановлювати причинно-наслідкові зв'язки.
"Прикладні завдання аналізу даних"
Рекомендації та ранжування.
У цьому курсі ми розберемо прикладні завдання з різних галузей аналізу даних: аналіз тексту та інформаційний пошук, колаборативна фільтрація та рекомендаційні системи, бізнес-аналітика, прогнозування часових рядів.
Ви навчитеся зводити завдання замовника до формальної постановки задачі машинного навчання та зрозумієте, як перевіряти якість побудованої моделі на історичних даних та в онлайн-експерименті. На кожному завданні ми вивчимо плюси та мінусипройдених алгоритмів машинного навчання
"Аналіз даних: фінальний проект"
Прогнозування відтоку клієнтів
Прогнозування часових рядів на карті
Аналіз тональності відгуків
Відгуки студентів
Дуже хороший старт, дозволив багато згадати і систематизувати. Якщо є розуміння із мат. аналізу, лінійної алгебри та статистики, то можна сміливо братися за курс, якщо ні, то краще десь придбати перед початком. Команді, який працював над курсом, хочеться сказати слова подяки та побажання не знижувати планку надалі.
Відмінний курс від одного з найкращих навчальних закладів України. Прекрасно підійде для охочих розпочати вивчення Machine Learning. Достатньо образно пояснено базові поняття, наведено приклади та посилання для подальшого самостійного вивчення матеріалу (або повторення забутого після вузу). Практичні завдання прості та забезпечені вичерпними прикладами.
Курс розрахований на аудиторію з навичками програмування, хоча завдання більш ніж на 20 рядків коду не зустрічаються.
Курс дозволяє освіжити в пам'яті основи математики, які були успішно забуті після одержаних заліків та іспитів в інституті. Дозволяє вивчити щось нове як для мене була статистика та Python. І все в курсі дуже професійно і доступно подано, тому хочеться вчитися і виконувати перевірочні роботи, що, наприклад, не завжди спостерігається в тому ж інституті. Залишився дуже задоволений курсом та планую далі продовжувати спеціалізацію.
Дякую за курс!
Я зараз наближаюся до завершення своєї підготовки з машинного навчання і незабаром шукатиму роботу. Ваша серія курсів дуже допомогла в освоєнні цього тернистого шляху. Хотілося здобути саме глибоке розумінняобговорюваних тем. І 41 з 1058 (сподіваюся, поки що) місце в конкурсі kaggle від Bosch, на мій погляд, підтверджує високу якість освоєння матеріалу.
На жаль, особисто для мене освоєння такої масштабної області як машинне навчання виявилося фізично і психічно занадто непідйомним при поєднанні з основною роботою. Тому покинула роботу і останні місяці щільно займаюсь навчанням. Про що, до речі, не шкодую. Якість засвоєння набагато вища, ніж при навчанні тільки у вихідні.
Дуже сподобалася адекватна розбивка по тижнях, вдається йти за графіком без поспіху, на відміну багатьох інших курсів.
Дякую за курс!
Шикарний курс Особливо вдячний за завдання про червиві яблука з Туреччини. Завдяки їй я досі не пам'ятаю формулу Байєса, але тепер розуміння і будь-якої миті можу відтворити. Чомусь це головне захоплення. Дякую, Євгене. Так само хочеться ще раз подякувати Євгену за чуйність у слеку та пояснення відмінностей довірчих інтвервалів від передбачуваних.
Крім статистики, дуже класне і виразне пояснення математики було загалом. Може тільки про визначник і свд западає, я скоро забуду знову, якось інтуїтивне розуміння не склалося в голові. Натомість зрозумів методи оптимізації та матричні операції. Дякую!
Приємно, що викладачі власними силами дуже компетентні люди, які цікавляться тим, чим займаються. Сподобався розділ "Додаткові матеріали", де наводяться різні цікаві посилання на ресурси, статті та картинки. Загалом, величезне Вам ДЯКУЄМО!
Як основний MIPT alumni, я веселився з яскравим вивчанням Емелі Драйл, Віктор Кантор, Evgeniy Sokolov і Evgeniy Ryabchenko. Вони helped me to brush up my knowledge в Linear Algebra and Probability and begin to learn Pythonat last (currently I work on C++). Великі тенденції! Hope to prolong this spec study with entusiasm, hope to realize мої future projects з help taken courses.
Були дуже цікаві практичні завдання. Деякі з них зажадали досить багато часу, але це того варте. Паралельно довелося підтягувати математику, що дуже корисно саме собою. Тим, хто проходитиме цей курс у майбутньому, рекомендую освіжити знання зі статистики та теорії ймовірностей — це знадобиться.
З викладачів окремо відзначу Євгена Соколова, який дуже просто та доступно пояснив тему вирішальних дерев. Ще запам'яталася одна з лекцій Емелі Драль, де вона на прикладах показала типові помилки фахівців-початківців з аналізу даних. Інші хлопці теж чудово впоралися зі своєю справою. Курс дуже крутий. Жодного разу не пошкодував, що записався.
25 років, за освітою спеціаліст з інформаційної безпеки, близько 3 років працювала розробником.
«Взяла цей курс, бо дуже люблю машинне навчання та аналіз даних. До цього проходила курси від закордонних ВНЗ, як тільки з'явився курс українською мовою – одразу записалася. Хоча багато тем було мені відоме, все одно було цікаво і корисно (особливо статистика!), і були нові матеріали, з якими не працювала.
Виконала перший проект — добре документований, цікавий, найбільш наближений до науки та практики.
Велике спасибі творцям курсу за виконану роботу!»
«Хлопці, вас би до нас у МДТУ ім. Баумана (років 5 тому). Дякую за спеціалізацію! Емелі та Євген Соколов дуже просто і зрозуміло пояснюють, хочеться побачити вас живою. Євген Рябенко та весела статистика — нероздільні речі. Віктор уміє дуже невимушеним тоном говорити про матюку. аналізі, якніби це тапочки, які він учора залишив на взуттєвій полиці».
Закінчив економічний факультет МДУ 1989 року. Займався використанням систем ERP, економічними дослідженнями.
«Багато з курсу нам викладали ще у 80-х. Із задоволенням усвідомив, що метод опорних векторів, SVM, ми проходили невдовзі після його відкриття, адже математика не була нашим профільним предметом!
На курсі оцінив практичність та простоту реалізації деяких речей. Мене цікавлять аналіз часових рядів та методи кластеризації. Дуже сподобалося, як було зроблено заняття з тематичного моделювання, але особисто не знаю, де це застосовувати.
Чомусь я більше чув про R, а не про Python, спочатку це насторожувало. У мене був непоганий досвід програмування на С менше С#, С++.
То був мій перший досвід онлайн-курсів, мені сподобалося. Дякую!".
Студент київського політеху, факультет прикладної математики.
Дуже крутий курс, все сподобалося! Викладачі просто топ, єдине – додав би ще практики. Курс зроблено на високому рівні, особливо сподобалося викладання Віктора та Євгена, імпонує їхній стиль подання інформації.
Курс зроблено доступно, зрозуміло. Здорово, що завжди є можливість отримати відповідь на своє запитання у чаті.».