С развитием технологий машинного обучения, а особенно с возрос- шей популярностью нейронных сетей, разработчики диалоговых систем обратили внимание на статистические подходы и начали искать способы их применения.
Исследования 2015 года предлагают абсолютно новый подход: непре- рывное обучение без разделения системы на компоненты, что значительно уменьшает объем необходимой ручной работы. В основе данного подхода лежит модель последовательность к последовательности (seq2seq или sequence to sequence). Каждую реплику пользователя можно трактовать как произвольную последовательность, а ответную реплику — как после- довательность, которая должна ей соответствовать. Тогда получается, что модель (рекуррентная нейронная сеть, обученная на реальных диалоговых
данных) должна предсказать очередную последовательность для реплики, т. е. ответную реплику.
На основе этого подхода были обучены две модели: одна на данных логов службы поддержки пользователей, а вторая на корпусе субтитров к фильмам. Оба эксперимента оказались довольно успешными: ответы обу- ченных моделей были вполне уместны и превзошли ожидания исследова- телей. Такой успех нового подхода позволяет надеяться на скорый прорыв в области диалоговых систем. Подробнее о результатах этого эксперимен- та можно прочитать в статье [Vinyals and Le Quoc 2015].
Достарыңызбен бөлісу: |