Про курс
Під час навчання на курсі ви зрозумієте природу текстових даних та як їх збирати, зберігати й аналізувати. Дізнаєтесь про різні методи попередньої обробки тексту та про те, які є підходи до аналізу тексту загалом. Зрозумієте, для яких NLP задач найефективніше застосовувати ML підходи, а для яких — систему правил.
На практиці ви самостійно створите, обробите і проаналізуєте дані, а також реалізуєте власний продакшн сервіс для вирішення NLP завдання. Ви не тільки опануєте основні навички, необхідні для обробки природної мови, а й освоїте найпопулярніші бібліотеки та технології для реалізації NLP рішень.
Бонусом курсу буде інформація про те, як і де шукати свою першу роботу комплінгвіста та як успішно пройти співбесіду.


10 500 грн/міс. при оплаті частинами

Програма курсу
NLP in the Real World
— Що таке NLP/NLU/NLG/NLI.
— Для рішення яких бізнес задач використовуються техніки та методи NLP. Найтрендовіші NLP завдання останніх років.
— Якими бувають цикли сучасних NLP проєктів.
— Якою може бути команда NLP проєкту та що представляють собою щоденні задачі комплінгвістів/NLP інженерів.
— Які навички та вміння необхідні комплінгвістам/NLP інженерам, щоб бути ефективними в команді.
Data Mining
— Які типи даних існують та які їхні особливості.
— Де взяти дані.
— Як зберігати дані.
— Чому комплінгвісту потрібно знати SQL.
Python Tips for Textual Data Analysis
— Чому саме Python.
— Які Python-хаки найкраще підходять для маніпуляцій із текстом.
— Які найпопулярніші NLP інструменти та бібліотеки для обробки текстових даних.
Text Pre-processing
— Принцип GIGO. Чому важливий етап предопрацювання.
— Чим відрізняється препроцесинг структурованих текстів від відгуків. Як з ними працювати.
— Які техніки для предопрацювання існують.
— Як знати, коли предопрацювання завершене.
Handling Text Data: From Word-Level to Semantic Analysis
— Регулярні вислови.
— N-grams та яке їхнє застосування в NLU задачах.
— Техніки синтаксичного аналізу тексту.
— Part-of-speech (POS) tagging.
— Що таке парсинг.
— Граматика незалежних складників і залежностей. У чому різниця та для яких задач використовуються.
— Техніки семантичного аналізу.
— Co-reference resolution (анафора).
— Word sense disambiguation (багатозначність слів).
— Named entity recognition (розпізнання іменованих сутностей).
— Онтологія та інструменти для її створення + Semantic role labeling (смислова анотація слів).
Machine Learning for NLP
— Які бізнес завдання можна вирішити за допомогою алгоритмів ML.
— Типи машинного навчання.
— Базові алгоритми ML.
— Класичний ML/NLP pipeline.
— Як підготувати дані для машинного навчання та на що звернути особливу увагу.
— Метрики якості результатів моделей.
— Confusion Matrix/Accuracy/Precision and Recall.
Text Representation
— Що таке вектори та для чого вони потрібні.
— Bag of words.
— TF-DF.
— Bag of N-grams.
— Word embedding.
Topic Modeling
— Що таке тематичні моделі та якими вони бувають.
— Метод латентного розміщення Діріхле.
— Тематичне моделювання коротких текстів.
Text Classification
— Класифікація на основі правил.
— Машинне навчання із вчителем для класифікації тексту.
— Машинне навчання без вчителя для класифікації тексту.
Rule-based vs Machine Learning Approaches
— Переваги та недоліки кожного з підходів.
— Що коли обрати.
How to find the first job and to successfully pass interview
— Як отримати свою першу роботу в NLP та як найкраще підготуватися до співбесіди.
— Чекліст топових запитань для співбесіди.
Курс для вас, якщо ви
Студент ВНЗ
за напрямком комп'ютерна лінгвістика і хочете поглибити знання у сфері NLP
Комп’ютерний лінгвіст
рівня Junior/Middle low, Data Scientist і вже працюєте з NLP та відчуваєте потребу зміцнити базу
Спеціаліст
із суміжних з NLP галузей
Час
10-12+ годин на тиждень для виконання домашніх завдань
Мова викладання
українська
Як відбувається навчання
Вебінари та відеолекції
Вебінари з кураторкою та групою будуть проходити щосуботи об 11:00, а відеолекції відкриватимуться щопонеділка та щочетверга.
Real-life завдання
У нас діє Practicult — культ практики. Тому ви будете виконувати багато складної домашки з реальних робочих буднів. Have fun & survive.
Регулярний фідбек
У нас немає базових та преміум режимів. Тільки преміум, завжди. Отримайте від кураторки все. І так, десята ітерація — це нормально.
Сертифікат за справи
Видаємо лише тим, хто своїм потом, часом і силами його заслужив.
ГРАФІК
Старт навчання
6 серпня 2022
Вебінари
щосуботи об 11:00
Відеолекції
щопонеділка та щочетверга
Запитання
Що потрібно вміти для навчання на курсі?
Для проходження курсу вам необхідно знати основні поняття програмування і мати базове розуміння Python (змінні, цикли, функції). Також ви маєте володіти англійською на рівні Intermediate і вище.
З яким софтом будемо працювати на курсі?
Для роботи знадобиться Anaconda Notebooks, а вебінари проходитимуть на платформі Zoom.
Чи можна дивитися заняття в будь-який зручний день?
Можна, але важливо встигати виконувати домашні завдання, які ви будете отримувати щотижня.
Як відбувається комунікація на курсі та в якому форматі кураторка дає фідбек?
Уся комунікація на курсі відбуватиметься через платформу Slack (робочий чат групи, канали для домашніх завдань і корисних посилань). Кураторка дає фідбек у вигляді коментарів до домашніх завдань і обговорення на вебінарах.
Чи будуть мені доступні відеозаписи лекцій після завершення курсу?
Доступ до архіву випускника зберігається на 3 роки від моменту старту курсу.
А сертифікат буде?
Ви отримаєте сертифікат, якщо виконуватимете домашні завдання та захистите курсовий проєкт.
Що, якщо мені не сподобається?
Ми зможемо повернути гроші протягом 7 днів від дати старту курсу, якщо ви передумаєте.