Dev & Data Science

NLP Beginning

На практиці вчимося вирішувати завдання, пов'язані з обробкою текстової інформації. Від основ до перших практичних кейсів.

Про курс

Під час навчання на курсі ви зрозумієте природу текстових даних та як їх збирати, зберігати й аналізувати. Дізнаєтесь про різні методи попередньої обробки тексту та про те, які є підходи до аналізу тексту загалом. Зрозумієте, для яких NLP задач найефективніше застосовувати ML підходи, а для яких — систему правил.

На практиці ви самостійно створите, обробите і проаналізуєте дані, а також реалізуєте власний продакшн сервіс для вирішення NLP завдання. Ви не тільки опануєте основні навички, необхідні для обробки природної мови, а й освоїте найпопулярніші бібліотеки та технології для реалізації NLP рішень.

Бонусом курсу буде інформація про те, як і де шукати свою першу роботу комплінгвіста та як успішно пройти співбесіду.

березень 2024 курс триває 3 місяці
10 000 грн/міс. 30 000 грн при повній оплаті курсу
10 500 грн/міс. при оплаті частинами
15 місць кожен студент отримує регулярний фідбек від куратора

Кураторки

Авторка програми Наталя Аванесова
Кураторка Ніка Сніжко
Кураторка Валерія Білоус



Програма курсу

  • NLP у реальному світі

    • — Що таке NLP/NLU/NLG/NLI.
    • — Для рішення яких бізнес задач використовуються техніки та методи NLP. Найтрендовіші NLP завдання останніх років.
    • — Якими бувають цикли сучасних NLP проєктів.
    • — Якою може бути команда NLP проєкту та що представляють собою щоденні задачі комплінгвістів/NLP інженерів.
    • — Які навички та вміння необхідні комплінгвістам/NLP інженерам, щоб бути ефективними в команді.
  • Data Mining

    • — Які типи даних існують та які їхні особливості.
    • — Де взяти дані.
    • — Як зберігати дані.
    • — Чому комплінгвісту потрібно знати SQL.
  • Переваги Python для аналізу текстових даних

    • — Чому саме Python.
    • — Які Python-хаки найкраще підходять для маніпуляцій із текстом.
    • — Які найпопулярніші NLP інструменти та бібліотеки для обробки текстових даних.
  • Попередня обробка тексту

    • — Принцип GIGO. Чому важливий етап предопрацювання.
    • — Чим відрізняється препроцесинг структурованих текстів від відгуків. Як з ними працювати.
    • — Які техніки для предопрацювання існують.
    • — Як знати, коли предопрацювання завершене.
  • Обробка текстових даних: від рівня слова до семантичного аналізу

    • — Регулярні вислови.
    • — N-grams та яке їхнє застосування в NLU задачах.
    • — Техніки синтаксичного аналізу тексту.
    • — Part-of-speech (POS) tagging.
    • — Що таке парсинг.
    • — Граматика незалежних складників і залежностей. У чому різниця та для яких задач використовуються.
    • — Техніки семантичного аналізу.
    • — Co-reference resolution (анафора).
    • — Word sense disambiguation (багатозначність слів).
    • — Named entity recognition (розпізнання іменованих сутностей).
    • — Онтологія та інструменти для її створення + Semantic role labeling (смислова анотація слів).
  • Машинне навчання для NLP

    • — Які бізнес завдання можна вирішити за допомогою алгоритмів ML.
    • — Типи машинного навчання.
    • — Базові алгоритми ML.
    • — Класичний ML/NLP pipeline.
    • — Як підготувати дані для машинного навчання та на що звернути особливу увагу.
    • — Метрики якості результатів моделей.
    • — Confusion Matrix/Accuracy/Precision and Recall.
  • Текстова репрезентація

    • — Що таке вектори та для чого вони потрібні.
    • — Bag of words.
    • — TF-IDF.
    • — Bag of N-grams.
    • — Word embedding.
  • Тематичне моделювання

    • — Що таке тематичні моделі та якими вони бувають.
    • — Метод латентного розміщення Діріхле.
    • — Тематичне моделювання коротких текстів.
  • Класифікація тексту

    • — Класифікація на основі правил.
    • — Машинне навчання із вчителем для класифікації тексту.
    • — Машинне навчання без вчителя для класифікації тексту.
  • Підходи на основі правил проти машинного навчання

    • — Переваги та недоліки кожного з підходів.
    • — Що коли обрати.
  • Як знайти першу роботу й успішно пройти співбесіду

    • — Як отримати свою першу роботу в NLP та як найкраще підготуватися до співбесіди.
    • — Чекліст топових запитань для співбесіди.

Курс для вас, якщо ви

Філолог, лінгвіст

знаєте основи Пайтон та хочете поєднати все це, працюючи з NLP

Комп’ютерний лінгвіст

рівня Junior/Middle low, Data Scientist, уже працюєте з NLP та відчуваєте потребу зміцнити базу

Python програміст

хочете освоїти Natural Language Processing

Досвід

базове розуміння Python (змінні, цикли, функції).

Час

10-12+ годин на тиждень для виконання домашніх завдань

Мова викладання

українська

Як відбувається навчання

Вебінари та відеолекції

Вебінари з куратором та групою будуть проходити щосуботи о 11:00, а відеолекції відкриватимуться щопонеділка.

Real-life завдання

У нас діє Practicult — культ практики. Тому ви будете виконувати багато складної домашки з реальних робочих буднів. Have fun & survive.

Курсовий проєкт

Для проєкту працюватимемо з даними реального замовника. Адже принцип курсу — все як у житті.

Регулярний фідбек

У нас немає базових та преміум режимів. Тільки преміум, завжди. Отримайте від куратора все. І так, десята ітерація — це нормально.

Сертифікат за здобутки

Наші сертифікати справді цінують на ринку. Тому ми видаємо їх лише тим студентам, які виконали щонайменше 70% домашніх завдань та захистили курсовий проєкт.

ГРАФІК

Старт

березень 2024

Вебінари

щосуботи о 11:00

Відеолекції

щопонеділка

Кейси, з якими студенти працювали на курсі

Не кейс, але радимо підписатися Осередок технарів, Development & Data Science новин, фізри для мозку, непроханих порад та соціально-наукового холівару
Студенти створили чат-бот, який дає відповіді на найпопулярніші запитання волонтерів, які хочуть долучитися до ініціативи, і містить корисні посилання на соцмережі проєкту та банку для донатів
Студенти створили продукт, який визначає емоційне забарвлення англомовного відгуку користувача, його тематику та готує короткий звіт за кожним відгуком

Запитання

Чи потрібні якісь навички для вступу на курс?

Це базовий курс для людей без досвіду в галузі, усе потрібне вивчатимемо з нуля. Проте вам знадобиться знання основних понять програмування й базове розуміння Python (змінні, цикли, функції). Також ви повинні володіти англійською на рівні Intermediate і вище.

Ми цінуємо ваш час і хочемо, щоб навчання було для вас релевантним. Тому після реєстрації надішлемо коротку анкету. Вона допоможе кураторові дізнатися про ваш попередній досвід, а також оцінити мотивацію й загальне розуміння галузі.

Якщо все добре –– ми вам одразу повідомимо про зарахування. А за кілька днів до старту курсу надішлемо лист з інформацією про процес навчання. Важливо: місце в групі бронюється тільки після внесення оплати.

Якщо ви отримаєте відмову –– не засмучуйтеся. Ми надішлемо також список корисних посилань. Ознайомтеся з цими матеріалами, а відтак сміливо подавайтеся на курс знову.

З яким софтом будемо працювати на курсі?

Для роботи знадобиться Anaconda Notebooks, а вебінари проходитимуть на платформі Zoom.

Чи можна дивитися заняття в будь-який зручний день?

Можна, але важливо встигати виконувати домашні завдання, які ви будете отримувати щотижня.

Як відбувається комунікація на курсі та в якому форматі куратор дає фідбек?

Уся комунікація на курсі відбуватиметься через платформу Slack (робочий чат групи, канали для домашніх завдань і корисних посилань). Куратор дає фідбек у вигляді коментарів до домашніх завдань і обговорення на вебінарах.

Чи будуть мені доступні відеозаписи лекцій після завершення курсу?

Доступ до архіву випускника зберігається на 3 роки від моменту старту курсу.

А сертифікат буде?

Буде, якщо ви докладете зусиль. Щоб отримати сертифікат, потрібно виконати щонайменше 70% домашніх завдань, отримати фідбек та «зараховано» від куратора, а також здати й захистити курсовий проєкт. Дедлайном для здачі та зарахування робіт є дата випуску та захист перед замовником.

Що, якщо мені не сподобається?

Ми зможемо повернути гроші протягом 7 днів від дати старту курсу, якщо ви передумаєте.

Хто такий NLP інженер?

Natural Language Processing (NLP) — це обробка природної мови. NLP інженери — люди, які розробляють продукти, що пов'язані з обробкою природної мови.

Також ви могли чути назву «комп’ютерний лінгвіст». Так інакше називають професію NLP інженера. Якщо спробувати визначити різницю між цими термінами, то дуже умовно можна виокремити одну розбіжність: комп’ютерний лінгвіст має ширшу експертизу в мовознавстві та теорії, а NLP інженер — більше технічного, програмного бекграунду.

Із якими продуктами працюють NLP спеціалісти ?

Будь-який аналіз, розуміння, синтез природної мови (письмової чи усної) — це все natural language processing (NLP). Серед реальних прикладів можна виділити такі:
— машинний переклад;
— побудова чатботів — запитання/відповідь;
— розробка голосових помічників на кшталт Alexa чи Siri;
— обробка великих обсягів текстових даних і видобування з них необхідної інформації;
— аналіз відгуків користувачів, зокрема їхня класифікація — позитивний чи негативний, про сервіс чи про ціну тощо.

Реєстрація

Ще маєте запитання?
Не соромтесь їх ставити.

Проконсультуйте мене