Введение 11
Часть I. Компоненты 14
Глава 1. Компьютерная морфология 14
-
Как найти слова 14
-
Каким может быть анализ слов 16
-
Лексическая неоднозначность 18
-
Анализ морфологии на основе правил 20
-
Что хранить в словарях? 20
-
Морфологические модули АОТ 21
4 3. Морфологический анализатор Pymorphy2
и словарь проекта OpenCorpora 24
4.4. Анализатор Mystem 26
-
Статистические методы анализа слов 27
-
Статистическая частеречная разметка 27
-
Триграммная скрытая Марковская модель 29
-
Частеречная разметка незнакомых слов 31
Литература 32
Электронные ресурсы 33
Глава 2. Компьютерный синтаксис 35
-
Разные подходы к анализу синтаксических структур 35
-
Что такое парсинг 35
-
Грамматики зависимостей 36
-
Грамматики непосредственных составляющих 40
-
Комбинированные теории анализа предложения 43
-
Неоднозначность и проблема комбинаторного взрыва 44