Dev & Data Science

NLP Beginning

Здобуваємо фундаментальні знання, щоб вирішувати завдання, пов'язані з обробкою текстової інформації.

Про курс

Під час навчання на курсі ви зрозумієте природу текстових даних та як їх збирати, зберігати й аналізувати. Дізнаєтесь про різні методи попередньої обробки тексту та про те, які є підходи до аналізу тексту загалом. Зрозумієте, для яких NLP задач найефективніше застосовувати ML підходи, а для яких — систему правил.

На практиці ви самостійно створите, обробите і проаналізуєте дані, а також реалізуєте власний продакшн сервіс для вирішення NLP завдання. Ви не тільки опануєте основні навички, необхідні для обробки природної мови, а й освоїте найпопулярніші бібліотеки та технології для реалізації NLP рішень.

Бонусом курсу буде інформація про те, як і де шукати свою першу роботу комплінгвіста та як успішно пройти співбесіду.

10 грудня 2022 курс триває 3 місяці
10 000 грн/міс. 30 000 грн при повній оплаті курсу
10 500 грн/міс. при оплаті частинами
15 місць кожен студент отримує регулярний фідбек від кураторки

Куратори

Кураторка Наталя Аванесова
Менторка Ніка Сніжко

Курсовий проєкт

Студенти курсу виконуватимуть проєкт від наших партнерів — Uklon.



Програма курсу

NLP in the Real World

— Що таке NLP/NLU/NLG/NLI.
— Для рішення яких бізнес задач використовуються техніки та методи NLP. Найтрендовіші NLP завдання останніх років.
— Якими бувають цикли сучасних NLP проєктів.
— Якою може бути команда NLP проєкту та що представляють собою щоденні задачі комплінгвістів/NLP інженерів.
— Які навички та вміння необхідні комплінгвістам/NLP інженерам, щоб бути ефективними в команді.

Data Mining

— Які типи даних існують та які їхні особливості.
— Де взяти дані.
— Як зберігати дані.
— Чому комплінгвісту потрібно знати SQL.

Python Tips for Textual Data Analysis

— Чому саме Python.
— Які Python-хаки найкраще підходять для маніпуляцій із текстом.
— Які найпопулярніші NLP інструменти та бібліотеки для обробки текстових даних.

Text Pre-processing

— Принцип GIGO. Чому важливий етап предопрацювання.
— Чим відрізняється препроцесинг структурованих текстів від відгуків. Як з ними працювати.
— Які техніки для предопрацювання існують.
— Як знати, коли предопрацювання завершене.

Handling Text Data: From Word-Level to Semantic Analysis

— Регулярні вислови.
— N-grams та яке їхнє застосування в NLU задачах.
— Техніки синтаксичного аналізу тексту.
— Part-of-speech (POS) tagging.
— Що таке парсинг.
— Граматика незалежних складників і залежностей. У чому різниця та для яких задач використовуються.
— Техніки семантичного аналізу.
— Co-reference resolution (анафора).
— Word sense disambiguation (багатозначність слів).
— Named entity recognition (розпізнання іменованих сутностей).
— Онтологія та інструменти для її створення + Semantic role labeling (смислова анотація слів).

Machine Learning for NLP

— Які бізнес завдання можна вирішити за допомогою алгоритмів ML.
— Типи машинного навчання.
— Базові алгоритми ML.
— Класичний ML/NLP pipeline.
— Як підготувати дані для машинного навчання та на що звернути особливу увагу.
— Метрики якості результатів моделей.
— Confusion Matrix/Accuracy/Precision and Recall.

Text Representation

— Що таке вектори та для чого вони потрібні.
— Bag of words.
— TF-DF.
— Bag of N-grams.
— Word embedding.

Topic Modeling

— Що таке тематичні моделі та якими вони бувають.
— Метод латентного розміщення Діріхле.
— Тематичне моделювання коротких текстів.

Text Classification

— Класифікація на основі правил.
— Машинне навчання із вчителем для класифікації тексту.
— Машинне навчання без вчителя для класифікації тексту.

Rule-based vs Machine Learning Approaches

— Переваги та недоліки кожного з підходів.
— Що коли обрати.

How to find the first job and to successfully pass interview

— Як отримати свою першу роботу в NLP та як найкраще підготуватися до співбесіди.
— Чекліст топових запитань для співбесіди.

Курс для вас, якщо ви

Студент ВНЗ

за напрямком комп'ютерна лінгвістика і хочете поглибити знання у сфері NLP

Комп’ютерний лінгвіст

рівня Junior/Middle low, Data Scientist і вже працюєте з NLP та відчуваєте потребу зміцнити базу

Спеціаліст

із суміжних з NLP галузей

Час

10-12+ годин на тиждень для виконання домашніх завдань

Мова викладання

українська

Як відбувається навчання

Вебінари та відеолекції

Вебінари з кураторкою та групою будуть проходити щосуботи о 16:00, а відеолекції відкриватимуться щопонеділка та щочетверга.

Real-life завдання

У нас діє Practicult — культ практики. Тому ви будете виконувати багато складної домашки з реальних робочих буднів. Have fun & survive.

Регулярний фідбек

У нас немає базових та преміум режимів. Тільки преміум, завжди. Отримайте від кураторки все. І так, десята ітерація — це нормально.

Сертифікат за здобутки

Видаємо лише тим, хто своїм потом, часом і силами його заслужив.

ГРАФІК

Старт

10 грудня 2022

Вебінари

щосуботи о 16:00

Відеолекції

щопонеділка та щочетверга

Читальня. Дізнайся більше

PROJECTOR MAG Do you speak human language? Або хто такий NLP інженер та чим він займається
PROJECTOR MAG За кафедрою Олександр Руппельт: як будують лінійку Data Science в Projector

Запитання

Що потрібно вміти для навчання на курсі?

Для проходження курсу вам необхідно знати основні поняття програмування і мати базове розуміння Python (змінні, цикли, функції). Також ви маєте володіти англійською на рівні Intermediate і вище.

З яким софтом будемо працювати на курсі?

Для роботи знадобиться Anaconda Notebooks, а вебінари проходитимуть на платформі Zoom.

Чи можна дивитися заняття в будь-який зручний день?

Можна, але важливо встигати виконувати домашні завдання, які ви будете отримувати щотижня.

Як відбувається комунікація на курсі та в якому форматі кураторка дає фідбек?

Уся комунікація на курсі відбуватиметься через платформу Slack (робочий чат групи, канали для домашніх завдань і корисних посилань). Кураторка дає фідбек у вигляді коментарів до домашніх завдань і обговорення на вебінарах.

Чи будуть мені доступні відеозаписи лекцій після завершення курсу?

Доступ до архіву випускника зберігається на 3 роки від моменту старту курсу.

А сертифікат буде?

Ви отримаєте сертифікат, якщо виконуватимете домашні завдання та захистите курсовий проєкт.

Що, якщо мені не сподобається?

Ми зможемо повернути гроші протягом 7 днів від дати старту курсу, якщо ви передумаєте.

Реєстрація

Ще маєте запитання?
Не соромтесь їх ставити.

Проконсультуйте мене