Графові бази: принцип роботи та застосування
Архівне. Ми у процесі перезапису всіх лекцій, а поки ви можете відфільтрувати лекції українською
відфільтруватиВсеволод Дьомкин віддалено працює у Franz Inc. над графовою базою AllegroGraph. У вільний час робить опен-сорс для обробки природних текстів на Lisp'і.
Ми розглянемо створення програми для агрегації текстів з різних джерел, таких як twitter, блоги, reddit тощо — їх автоматичної, а потім ручної обробки для формування дайджесту новин за певною темою. На цьому прикладі ми проаналізуємо, які переваги дає використання графових баз даних, обговоримо їх можливості та обмеження.
Як конкретна БД буде використана система Franz AllegroGraph і ми ознайомимося з її екосистемою, що включає можливості побудови API та веб-додатків, а також із середовищем Allegro Common Lisp, на якій вона побудована. Особливу увагу буде приділено використанню машинного навчання та NLP під час вирішення завдань роботи з текстом, зокрема, всередині AllegroGraph.
Обговоримо:
- у чому особливості, як працюють, переваги/недоліки графових БД;
- як вирішувати базові завдання обробки текстів із використанням інструментарію ML/NLP;
- як побудувати повноцінний додаток з ядром обробки тексту на основі графової БД та ML/NLP технологій;
- як влаштовано екосистему Common Lisp і як можна задіяти її для створення серверних програм.
Лекція буде корисною: розробникам, які цікавляться темою графових баз даних та/або ML/NLP.