Автор: Мария Владимировна Хохлова, выпускница 2007 года, доцент кафедры математической лингвистики СПбГУ
Компьютер отслеживает чувства
Как узнать общественное мнение по какому-нибудь вопросу? Можно спросить друзей, знакомых, соседей, устроить опрос в коллективе или на улице. В век электронной коммуникации нам могут помочь отзывы в со- циальных сетях и на сайтах с обратной связью. Но информации там слиш- ком много — настолько много, что прочитать все сообщения невозможно. Надо извлечь из них самое ценное — например, фотоаппарат делает по- трясающие снимки, а отель настолько понравился, что невозможно не по- ехать. Этим занимаются системы извлечения мнений (opinion mining). По своим технологиям они близки к системам извлечения информации (information extraction или data mining), описанным в главе 9.
Данная глава будет посвящена системам автоматического анализа тональности (sentiment analysis). На первый взгляд термин может пока- заться странным, но это направление чрезвычайно популярно и развивает- ся сейчас очень быстро. Анализ тональности не предполагает извлечения фактографической информации, он занимается только степенью эмоцио- нальной окраски сообщений. Например, на прошлой неделе фамилию не- которого политика упоминали с сильной отрицательной эмоцией, а на этой неделе начали говорить о нем с положительным оттенком. Несколько месяцев назад этот товар упоминался нейтрально, а сейчас, после прове- дения рекламных акций, его начали хвалить.
Анализ тональности отслеживает не что говорят о каком-то человеке или явлении, а насколько эмоционально о нем говорят. Ведь содержание быстро забывается, а «нехороший осадок» остается: «То ли он украл, то ли у него украли, но была там какая-то неприятная история».
В русском языке за англоязычным термином sentiment analysis закре- пились сразу несколько эквивалентов. Анализ тональности — это самый распространенный его перевод. Встречаются также названия сентимент- анализ, анализ мнений, анализ эмоциональной составляющей сооб- щений.
Достарыңызбен бөлісу: |