Словари оценочной лексики
Хотя ранее было сказано, что простой поиск лексики в текстах не приведет к желаемому результату, тем не менее словари весьма полезны и активно используются в задачах, связанных с автоматическим анализом тональности. В словарях оценочной лексики хранятся слова и словосоче- тания, каждому из которых присвоен уровень эмоциональной оценки (см. табл. 1).
Таблица 1
Слово /словосочетание
|
Уровень эмоциональной оценки
|
отвратительный
|
–5
|
с гулькин нос
|
–2
|
модный
|
+3
|
усталый
|
–2
|
В зависимости от словаря используются разные шкалы оценок. Так, словам может быть приписана только одна оценка (как в примере, приве- денном выше). В некоторых системах (например, SentiStrength [Thelwall et al.2010]) группы слов получают не одну, а две тональные оценки (положи- тельную и отрицательную). Также существуют лексиконы, в которых сло- вам приписываются разные эмоции, к ним относится, например, NRC Word-Emotion Association Lexicon [NRC Word-Emotion Association
Lexicon]. В словаре приводится список из 14 тысяч слов, каждому из кото- рых вручную были сопоставлены эмоции (такие как «гнев», «страх»,
«предчувствие», «вера», «удивление», «грусть», «отвращение», «радость») и тональные оценки (положительная или отрицательная). Ниже приведен пример для слова «frank» (рус. «откровенный», см. табл. 2). Данный спи- сок был переведен на несколько десятков языков, среди которых есть и русский.
Достарыңызбен бөлісу: |