11 Часть I. Компоненты 14 Глава Компьютерная



бет19/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   15   16   17   18   19   20   21   22   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

алгоритм Витерби (Viterbi algorithm). Он позволяет решать такие за- дачи коротким путем, не перебирая все возможные варианты. В сети есть много его описаний, поэтому мы не будем здесь его подробно рассматри- вать, а перейдем к еще одной лингвистической проблеме.



    1. Частеречная разметка незнакомых слов

Допустим, в новом предложении упоминается чиновник с фамилией Неподкупнов. Такой фамилии не было в обучающем корпусе, поэтому па- раметр s(Неподкупнов|t) не определен ни для какого тега. Как быть?

Одно из решений может быть таким. Очень редкие слова в обучаю- щем корпусе заменяются псевдословами. Вот примеры возможных замен:







Достарыңызбен бөлісу:
1   ...   15   16   17   18   19   20   21   22   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет