11 Часть I. Компоненты 14 Глава Компьютерная


Буквы и звуки: как определить, на каком языке написан текст? — Дешифровка



бет180/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   176   177   178   179   180   181   182   183   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

Буквы и звуки: как определить, на каком языке написан текст? — Дешифровка


Современные лингвисты рассматривают язык как системно- структурное образование, состоящее из элементов, связанных друг с дру- гом определенными отношениями. Значащие единицы языка — прежде всего, слова и части слов (морфемы) — являются знаками, состоящими из экспонента и денотата. Экспонент — материальный носитель значения (звуковой образ слова), денотат — понятие, связанное с данным экспонен- том (значение слова). Экспонент и денотат связаны друг с другом, но эта связь условная и произвольная. Так, в русском языке денотат «дерево» связан с экспонентом дерево, а в английском с экспонентом tree.

Элементы, из которых состоят экспоненты слов и морфем, называют фонемами. Фонемы — это не знаки, а односторонние сущности, имеющие только экспонент. Такие сущности называют фигурами. Число фонем в каждом языке ограничено, но из этого конечного набора фонем можно образовать бесконечное количество слов.


На подсчете экспонентов разнообразных единиц языка и их сочета- ний основана квантитативная методика.
Рассмотрим минимальные элементы языка — фонемы. Очевидно, что существуют определенные правила сочетания фонем в слова. Кроме того, для записи звукового образа слова можно использовать символы естест- венного языка — транскрипцию — так же как буквы используются для записи слов: /d’er’eva/ и /tri:/. Письменная запись слова есть некоторый аналог транскрипции, только менее точный, поэтому существуют правила орфографии и орфоэпии — правила записи звучащего слова и правила чтения записанного слова.
Закономерности сочетаемости фонем в разных языках различаются, а значит различаются и правила сочетаемости букв разных языков. Этот принцип применяется в теории дешифровки и в методике определения языка, на котором написан текст.
Зная частотность букв в разных языках, мы можем определить, на ка- ком языке написан текст, если мы подсчитаем частотность букв в этом тексте. Если язык известен и текст зашифрован простым способом, то есть, каждая буква текста заменена на другой символ (букву, цифру, кар- тинку), мы можем расшифровать этот текст, подсчитав частотность каждо- го символа и сравнив ее с частотностью букв в данном языке. Если язык неизвестен, можно вначале по такой же методике попытаться определить, какой это язык. Можно считать частотность не только отдельных букв и символов, но и частотность сочетаний этих букв или символов (комбина- ции по два, три, четыре, пять и т. д.). В этом случае скорость и точность дешифровки возрастет. Используя компьютеры, таким способом можно за секунды определять язык, на котором написан текст. А затем использовать более сложные алгоритмы исследования текста на уже известном языке.
Дешифровка любых буквенных шифров на современном компьютере тоже не представляет особой сложности. Поэтому для современных сис- тем шифрования (криптографии) используют не простые методы замены, а сложные математические методы, которые поддаются дешифровке толь- ко с использованием таких же сложных математических методов (крип- тоанализ).
Тем не менее, в лингвистике проблема дешифровки остается актуаль- ной по отношению к текстам на языках, которые нам неизвестны, на кото- рых есть только письменные памятники, записанные неизвестным нам письмом. Для дешифровки таких памятников недостаточно простой ста-

тистики. Необходимы знания о том, какие языковые структуры могут встречаться, как могут быть устроены системы письма. Но и этой инфор- мации не всегда достаточно. Необходимы исторические сведения о людях, которые создали эти тексты, о том, чем они занимались, с кем торговали и воевали. Необходимо изучать письменные памятники соседних народов.


Часто имена правителей и названия городов служат ключом к дешиф- ровке письменности, потому что они встречаются в документах соседних народов, язык которых мы знаем. Следовательно, мы можем предполо- жить, что они есть и в письменных памятниках, подлежащих дешифровке. Таким образом французский востоковед Ж. Ф. Шампольон раскрыл тайну египетских иероглифов. В ХХ веке была расшифрована слоговая крито- микенская письменность и иероглифическая письменность Майя. Но еще ждут расшифровки другие письменные памятники, например, надписи, найденные на острове Пасхи.
Более подробно о дешифровке можно прочитать в [Савенкова 1996, Сингх 2007].




  1. Достарыңызбен бөлісу:
1   ...   176   177   178   179   180   181   182   183   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет