Dev & Data Science

Time Series

На курсі освоїмо фундамент, на якому будується весь Time Series.

Про курс

Прогнозування продажів, ефективності маркетингової стратегії, попиту на той чи інший товар та навіть детекція поз людини — ці завдання можна вирішити за допомогою Time Series (часових рядів).

Упродовж курсу зрозуміємо, що взагалі таке часові ряди. Дізнаємося фундаментальні принципи Time Series і навчимося працювати з необхідними бібліотеками. Будемо формувати й перевіряти гіпотези. Зрозуміємо, як адаптувати тези машинного навчання з інших дисциплін для роботи з Time Series.

На курсі студенти працюватимуть з кейсом від Fozzy Group. Після курсу отримаємо фундамент для роботи з часовими рядами та чітке розуміння сфер застосування Time Series.

березень 2022 курс триває 3 місяці,
вебінари та відеолекції
10 000 грн/міс 30 000 грн при повній оплаті курсу
10 500 грн/міс при оплаті частинами
20 студентів кожен студент отримує регулярний фідбек від кураторів групи

Кураторка

Анна Вітюк

CEO та співзасновниця у Reactive Capital.



Програма курсу

Екскурс в математичну статистику

— Поняття безумовної та умовної ймовірності.
— Поняття ймовірнісних просторів, поняття розподілу ймовірності, середнього, дисперсії, стандартного відхилення, перекосу, ексцесу, довірчого інтервалу та їх приклади.

Типи завдань машинного навчання — регресія, класифікація, ранжування

— Природа випадкової величини, що моделюється (дискретна, безперервна).
— Гранична теорема у визначенні природи шуканої випадкової величини (у).
— Структура даних і різноманіття задач часового ряду; чим часовий ряд відрізняється від звичайної регресії / класифікації.
— Приклади датасетів.

Що таке часовий ряд

— Поняття дано, шукане і вікно прогнозу. Важливість підбору вікна прогнозу і його горизонту. Поняття довірчого інтервалу та ймовірносних просторів. Взаємозв'язок довірчого інтервалу ймовірності й горизонту вікна прогнозу.
— Уніваріантність і мультиваріантність часового ряду. Ендогенні й екзогенні ознаки.
— Порівняння завдань класичного машинного навчання і часового ряду. Рекурентна залежність шуканого від самого себе у часі в задачах часового ряду і NLP.

Моделі ARIMA й ознайомлення з бібліотекою statsmodels: ARMA, ARIMA, SARIMA, SARIMAX

— Порядки авторегресії, сезону, рухомого середнього, їх призначення та оптимальні значення.
— Підбір вікна прогнозу.

Поняття сезонності й огляд моделі SARIMA

Мультиваріантний часовий ряд з сезонною компонентою SARIMAX і без — ARIMAX.

Підбір гіперпараметрів для сімейства S/ARIMA/X

Введення в тест Акаіке.

Введення в машинне навчання для часового ряду

— Повторення основних тез машинного навчання з інших дисциплін, адаптація їх для задач часового ряду.
— Ознайомлення з бібліотекою scikit-learn, xgboost, catboost, lightgbm.
— Деревовидні та бустингові моделі.

Формування і перевірка гіпотез, статистичні тести з прикладами

Поняття крос-валідації для часового ряду, її особливості та приклади на scikit-learn.

Авторегресія та інженерія ознак. Поняття автокореляції

— Перевірка даних на автокореляції.
— Витяг лагів (shift, expanding) з сирих даних.
— Витяг множини ознак з єдиної величини — часові й автокореляційні.

Рухомі статистики для інженерії ознак

Поняття регресії до середнього на прикладі з лінійною регресією, поняття рухомої середньої та інших статистик, а також їх ймовірнісні перетини з шуканим (у).

Рекурентні нейронні мережі в задачах класифікації часового ряду

Приклади класифікації людської активності з використанням LSTM.

Cracking the Data Science deadline😱

— Автоматизація крос-валідації, підбору моделей і передпідготовки даних — бібліотека PyCaret.
— Прискорення розробки в кілька разів за допомогою автоматизації пайплайну.
— Швидка валідація гіпотез і прототипування моделей.
— Багаторазове підвищення ймовірності не тільки встигнути до дедлайну, але ще й здивувати вашого менеджера результатами ;)

Кому буде корисним цей курс

Програмістам

Програмістам з інших сфер, які розуміють Python (класи, функції) та мають хоча б базові знання із Pandas і NumPy.

Junior Data Scientist-ам

Початківцям в Data Science, які хочуть освоїти Time Series.

Час

8+ годин на тиждень на виконання домашніх завдань

Мова викладання

українська

Про навчання

Відеолекції та вебінари

Вебінари з кураторкою та групою будуть проходити щочетверга о 19:30, а відеолекції відкриватимуться щовівторка та щоп'ятниці.

Real-life завдання

У нас діє Practicult — культ практики. Тому ви будете робити багато складних домашок із реальних робочих буднів. Have fun & survive.

Unlimited фідбек

У нас немає базових та преміум режимів. Тільки преміум, завжди. Отримайте від кураторів все. І так, десята ітерація — це нормально.

Сертифікат за справи

Видаємо лише тим, хто своїм потом, часом і силами його заслужив.

ГРАФІК

Старт занять

березень 2022

Вебінари

щочетверга о 19:30

Відеолекції

щовівторка та щоп'ятниці

Запитання-відповіді

З яким софтом працюємо на курсі?

Pandas, Numpy, PyTorch, Keras, Stats Models

Які вимоги для вступу на курс?

— досвід від 1 року в Data Science;
— знання Python

Що, якщо мені не сподобається?

Повернемо гроші протягом 7 днів від дати старту курсу.

Як відбувається комунікація на курсі і в якому форматі куратор дає фідбек?

Вся комунікація на курсі відбуватиметься через платформу Slack (робочий чат групи, канали для домашніх завдань і корисних посилань). Куратор надає фідбек у вигляді коментарів на домашні завдання і обговорення на вебінарах.

Чи будуть доступні відеозаписи після закінчення курсу?

Так, у вас залишається доступ після завершення курсу.

Чи отримаю я сертифікат після проходження курсу?

Тільки за умови виконання всіх домашніх завдань, а також успішного захисту курсового проєкту.

Реєстрація

Ще маєте питання?
Не соромтесь їх задати.

Проконсультуйте мене

Кому будет полезно