Експрес-курс з машинного навчання
Розкажіть друзям про подію
Рекомендовані події
Вибачте, реєстрацію закрито. Можливо, на подію вже зареєструвалося дуже багато людей, або минув термін реєстрації. Подробиці Ви можете дізнатись у організаторів події.
6 занять у неділю. Цей курс підійде як серйозний старт у Data Science. При цьому поріг входу нижче, ніж на курсах, які можна знайти в онлайні.
Розкажіть друзям про подію
Заняття №4
– На цьому занятті нарешті поговоримо про метод найближчих сусідів. - Навчимося робити крос-валідацію та знаходити оптимальні параметри алгоритму. - Розберемо хатинку ( https://github.com/ CommanderDuck/express_ml/ blob/master/lesson3/ visualization_task.ipynb ) - Поговоримо про різні метрики алгоритмів
Докладніше про курс:
6 занять у неділю. Цей курс підійде як серйозний старт у Data Science. При цьому поріг входу нижче, ніж на курсах, які можна знайти в онлайні.
Веде курс Ігор Слинько працює в Яндексі, робить Пошук. У вільний час створить цікаві проекти в області Data Science, читає лекції у ВШЕ (https://cs.hse.ru/dpo/datamining).
Плюси: - Майже без формул - Багато графіків - Працюючі на практиці алгоритми - Практичні завдання на заняттях
Програма: 25.06 Вступ: які завдання можна успішно вирішувати, що таке Big Data, навіщо потрібні нейромережі? У практичній частині передобробляємо та візуалізуємо дані на Python за допомогою бібліотек numpy, matplotlib та pandas.
02.07 Знайомство із найпопулярнішою бібліотекою ML: scikit-learn. Завдання зниження розмірності та кластеризації. У практичній частині робимо розпізнаваннярукописні цифри в 10 рядків коду.
09.07 Алгоритм RandomForest. Передбачаємо долю пасажирів Титаніка, виходячи із даних на квитку.
16.07 Метрики оцінки якості пророцтв. Алгоритм KNearestNeighbors. Вирішуємо змагання на kaggle.
23.07 Лінійна та логістична регресія. Чому лінійні моделі працюють? Обробка текстових даних: TF-IDF, word2vec. Оцінюємо емоційне забарвлення відгуків на IMDB.
30.07 SVM та XGBoost. Передбачаємо, чи віддасть клієнт банку кредит на даних від Tinkoff
Чого не буде в цьому курсі: - Нейросет. Ми їх трохи торкатимемося, але я свідомо хочу винести їх в окремий курс. Немає сенсу вчити нейромережі без переліку тим вище. - Reinforcement Learning. Це супер-цікава тема, і я дуже хочу колись про неї зробити окремий курс. Аргументи такі ж як із нейромережами. - Big Data. Ми не будемо працювати з даними, які не розміщуються на жорсткому диску. Хороша новина: майже завжди вони розміщуються на жорсткому диску☺
Кожне заняття триває 3 години і коштує 1500 грн. Можна сплатити відразу весь курс зі знижкою.