11 Часть I. Компоненты 14 Глава Компьютерная



бет91/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   87   88   89   90   91   92   93   94   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute
Латын тілі 4,5 - дәріс 2, 169-182 фил, Вопросы на русском языке, 6 үж

Корпусная лингвистика


Автор: Виктор Павлович Захаров, выпускник 1970 года, доцент кафедры математической лингвистики СПбГУ


1. Корпусы вчера и сегодня


Корпусная лингвистика (corpus linguistics) — это раздел лингвисти- ки, существующий более полувека и занимающийся созданием и исполь- зованием корпусов для решения разнообразных лингвистических (и не только) задач.
Первый корпус был создан в 1960-е годы в США в Брауновском уни- верситете Генри Кучерой и Нельсоном Фрэнсисом — он так и называется

  • Брауновский (Brown University Standard Corpus of Present-Day American English). Сегодня корпусная лингвистика это нечто большее. Сегодня кор- пусы (или корпусá) стали неотъемлемой частью лингвистики, одним из ее краеугольных камней, как словари и грамматики. После появления корпу- сов вся лингвистическая наука стала другой, можно сказать, вся лингвис- тика стала корпусной.

Правда, можно сказать, что лингвисты все время занимались корпус- ной лингвистикой, не подозревая об этом. Не случайно статья Н. Фрэнсиса называется Corpora B. C. (корпусы до нашей эры) [Francis 1992]. Здесь, конечно, игра слов: автор имел в виду корпусы до компьютеров (Corpora Before Computers). Но в статье речь идет о том, что идеи корпусной лин- гвистики действительно зародились в докомпьютерную эпоху. Лингвисты и лексикографы всегда в своей работе использовали эмпирический мате- риал, цитаты из текстов, которые выписывались на карточки и образовы- вали «корпусы» под названием картотеки.
Зачем нужен корпус в современной лингвистике?

  1. На основе корпусов создаются словари и грамматики.

  2. Корпусы помогают и в теоретической лингвистике: при исследовании какого-то явления можно быстро собрать нужные данные в их естест- венном контексте и проанализировать.

  3. На основе корпусов проводится машинное обучение для самых раз- ных областей прикладной лингвистики.




  1. Они могут пригодиться и для любых других задач, связанных с язы- ком — однажды созданный и подготовленный корпус может исполь- зоваться многократно, различными исследователями и в разных це- лях.





    1. Достарыңызбен бөлісу:
1   ...   87   88   89   90   91   92   93   94   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет