Про курс
Раніше у нас не було моделей, що могли б наслідувати природну мову, а тому якісне вирішення багатьох NLP завдань залишалося неможливим. Однак сьогодні майже будь-яку бізнес проблему можна ефективно вирішити за допомогою Deep Learning підходів. Глибокі нейронні мережі дозволяють створювати чатботів, які спілкуються з користувачами на тому ж рівні, що й живі люди. А ще — перекладають, знаходять та виправляють помилки в тексті, розпізнають іменовані сутності та ключові слова.
Саме завдяки Deep Learning підходам пошуковик так чітко розуміє ваші запити, а детектор плагіату ідентифікує крадений текст, навіть якщо ви замінили всі слова синонімами.
Курс буде цікавий Data Science спеціалістам та спеціалісткам, що вже працюють з класичним NLP, але бажають покращити свою експертизу у сфері найбільш сучасних підходів вирішення NLP завдань.

вебінари

16 800 грн/міс при оплаті частинами

Кураторка

Senior Data Scientist в Delivery Hero. Має досвід в створенні end-to-end NLP рішень, що сфокусовані на аналізі даних для high-load систем з метою ідентифікації необхідних властивостей й подальшої трансформації текстових даних.
Програма курсу
Review of neural networks architectures: forward NNs, RNNs, CNNs, transformers.
Поговоримо про те, яким чином працюють найбільш популярні архітектури нейронних мереж та про те, які з них найчастіше використовуються в deep learning NLP моделях.
Language models: from Word2Vec to BERT.
N-gram language models, Word2Vec, GloVe, GPT-1 and GPT-2, BERT.
Named entity recognition: CRF vs. ELMo.
Розглянемо проблему розпізнавання іменованих сутностей з точки зору і статистичних моделей (PGMs), і глибоких нейронних мереж.
Text summarization: LexRank vs. attention-based NN.
Як створювати короткі саммарі тексту за допомогою класичних методів машинного навчання (LexRank) й складніших методологій (BERT).
Text similarity measurement: from string-based similarity to embedding-based similarity.
Вимірювання схожості текстів за допомогою різних підходів:
— string-based similarity;
— corpus-based similarity;
— knowledge-based similarity;
— hybrid similarity measures.
Machine translation: probabilistic models vs. deep NNs.
Поетапно розглянемо підходи до розв'язання проблеми автоматичного перекладу — від класичних моделей, що базуються на теорії ймовірності, до глибоких нейронних мереж.
Information extraction: keywords, topics and more.
Розпізнавання релевантної інформації в тексті за допомогою алгоритмів keywords extraction й topic modeling. Імплементація алгоритмів за допомогою класичних підходів (RAKE, LDA, etc.) і підходів Deep Learning.
Grammatical error correction: noisy channel modeling vs. transformers.
Класичні моделі та глибокі нейронні мережі для виправлення помилок в тексті.
Deep NNs deployment: TensorFlow vs. PyTorch vs. Hugging Face use cases.
Як найкраще передати модель в продакшн, як зробити її швидкою, ефективною та легко задеплоїти її, використовуючи найбільш популярні фреймворки Deep Learning.
Кому буде корисним цей курс
Data science спеціалістам / спеціалісткам
Щоб покращити навички вирішення NLP завдань за допомогою Deep Learning.
Комп’ютерним лінгвістам / лінгвісткам
Щоб заповнити прогалину у знаннях під час створення глибоких нейронних мереж в контексті NLP.
Cтудентам / студенткам технічних ВНЗ
Для поглиблення знань у сфері сучасних підходів до вирішення NLP завдань.
Час
8+ годин на тиждень на виконання домашніх завдань
Мова викладання
українська
Як відбувається навчання
Вебінари
Вебінари з кураторкою та групою будуть проходити щовівторка щосереди та щоп'ятниці о 19:30
Real-life завдання
У нас діє Practicult — культ практики. Тому ви будете робити багато складних домашок із реальних робочих буднів. Have fun & survive.
Курсовий проєкт
Під час курсу ви зробите великий проєкт. Адже принцип курсу — все як в житті.
Регулярний фідбек
У нас немає базових та преміум режимів. Тільки преміум, завжди. Отримайте від кураторів все. І так, десята ітерація — це нормально.
Сертифікат за справи
Видаємо лише тим, хто своїм потом, часом і силами його заслужив.
ГРАФІК
Старт занять
зима 2023
Вебінари
щовівторка, щосереди та щоп'ятниці о 19:30
Запитання-відповіді
З яким софтом працюватимемо на курсі?
Anaconda, Zoom, Python (TensorFlow/PyTorch), Spacy, SKLearn
Які вимоги для вступу на курс?
— досвід від 1го року в Data Science;
— знання Python (middle)
— базове розуміння концептів Deep Learning
— бажаний досвід з NLP (basic text analysis)
Скільки всього буде занять?
Тричі на тиждень буде спілкування з кураторкою на вебінарах.
Чи можна дивитися заняття в будь-який зручний день?
Можна, але важливо встигати виконувати домашні завдання, які ви будете отримувати після кожного заняття.
Що, якщо мені не сподобається?
Повернемо гроші протягом 7 днів від дати старту курсу.
Як відбувається комунікація на курсі та в якому форматі куратор дає фідбек?
Вся комунікація на курсі відбуватиметься через платформу Slack (робочий чат групи, канали для домашніх завдань і корисних посилань). Куратор надає фідбек у вигляді коментарів на домашні завдання і обговорення на вебінарах.
Чи будуть мені доступні відеозаписи лекцій після завершення курсу?
Так, у вас зберігається доступ після завершення курсу.
Чи отримаю я сертифікат після проходження курсу?
Тільки за умови виконання всіх домашніх завдань, а також успішного захисту курсового проекту.
Чи будуть записуватися вебінари?
Ми щоразу організовуємо запис, однак краще забронювати час, щоб приєднатися до онлайн-зустрічі — обговорити питання з одногрупниками та проконсультуватися з кураторами.