11 Часть I. Компоненты 14 Глава Компьютерная



бет62/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   58   59   60   61   62   63   64   65   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

Определение структуры и разметки документа

В первую очередь определяется формальная структура текста, подле- жащего озвучиванию, и производится интерпретация его существующей разметки. Здесь могут учитываться стиль форматирования абзаца, исполь- зующиеся знаки препинания, иные аннотационные пометы. На этом же этапе отфильтровывается служебная и метаинформация (например, заго- ловок электронного сообщения).



      1. Нормализация текста, расшифровка аббревиатур и специальных знаков, исправление ошибок

В процессе нормализации текста осуществляются поиск в нем со- кращений, аббревиатур, цифр, других символов и преобразование их в стандартную орфографическую запись. Например, «и т. д.» должно быть записано «и так далее». В следующей таблице приведены примеры фраг- ментов текста до и после нормализации.





Достарыңызбен бөлісу:
1   ...   58   59   60   61   62   63   64   65   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет