В первую очередь определяется формальная структура текста, подле- жащего озвучиванию, и производится интерпретация его существующей разметки. Здесь могут учитываться стиль форматирования абзаца, исполь- зующиеся знаки препинания, иные аннотационные пометы. На этом же этапе отфильтровывается служебная и метаинформация (например, заго- ловок электронного сообщения).
В процессе нормализации текста осуществляются поиск в нем со- кращений, аббревиатур, цифр, других символов и преобразование их в стандартную орфографическую запись. Например, «и т. д.» должно быть записано «и так далее». В следующей таблице приведены примеры фраг- ментов текста до и после нормализации.