Как измерить тональность текста
Каким образом можно извлечь мнение из большой коллекции отзы- вов? Сам по себе автоматический поиск в текстах положительно или от- рицательно окрашенных слов не дал бы результатов, поскольку язык ис- пользует их слишком разнообразно. В предложениях могут встретиться отрицание, саркастические замечания или другие приемы, которые приве- дут к ошибочной интерпретации высказывания, меняя его тональность на противоположную. Поэтому были разработаны специальные методы, ко- торые позволяют частично решать эти сложные проблемы.
Как и в других задачах прикладной лингвистики, основные подходы к автоматическому определению тональности текста можно разделить на две большие группы. Алгоритмы первой группы основаны на правилах (rule-based), а алгоритмы второй группы используют методы машинного обучения (machine learning). Для русского языка чаще применяется пер- вый подход, а для английского второй. Это связано во многом с тем, что для английского языка существует большое число общедоступных разме- ченных коллекций, на которых можно тренировать модели машинного обучения и большое количество программных продуктов с открытым ко- дом, заточенных так же на английский язык, тогда как русскоязычных ре- сурсов практически не существует.
Подход с использованием правил и словарей
Достарыңызбен бөлісу: |