статистические методики используются для разрешения многих лингвистических задач,
таких как машинный перевод, распознавание и синтез речи, средства проверки орфографии и
грамматики и т.д. Так, устойчивые словосочетания представляют
собой с семантической
точки зрения неделимую смысловую единицу, что очень важно учитывать в лексикографии,
системах автоматической обработки текста. На материале корпуса статистическими
методами можно определить, какие слова встречаются вместе регулярно и, таким образом,
могут быть отнесены к устойчивым словосочетаниям [Захаров, 2005]. В этом отношении
Коми медиатека пока не имеет широкие возможности определения частотности тех или иных
языковых
элементов, но работы в этом направлении ведутся.
Программа дает возможность поиска не только целых лексем, но
и разных
формообразовательных и словоизменительных элементов.
Например, суффикс
–лаздор- со значением «сторона, направление того, что названо в
корне слова»
.
А. Евгений Александрович Игушев, г. Сыктывкар, (00:16:26-00:16:30):
«
Кодор
лаздор
лань
чужемнас пукалэмен кань мыссе, сыладорсянь и гöсь воас». -
В
какую сторону
мордой сидя умывается кошка, оттуда и гость придет.
Б. Николай Никитич Чупров, с. Ловозеро, (00:29:03-00:29:07):
«Рыбачей
лаздор
ын, сэн мыттэм кöрыс вöлі, а кöрсэ вед быредісныс»
. -
Возле
Рыбачьего
,
там ведь сколько оленей было, но всех оленей ведь извели.
Наряду с морфологическими исследованиями Коми медиатека является прекрасной
базой для исследования диалектного синтаксиса.
При этом надо отметить, что крупных
научных исследований по коми диалектному синтаксису просто нет.
Несомненно, Коми медиатека будет развиваться и
далее за счет постоянного
пополнения текстовой базы за счет записей по другим диалектам коми языка и параллельных
текстов на коми литературном языке, а также за счет технической модернизации.
Достарыңызбен бөлісу: