1.2. Управление данными. Файловые системы
Организация данных на машинных носителях (предварительные соображения)
Накопители на магнитных носителях, файлы, циклы обработки.
Накопители данного типа являются основной средой хранения информации в ЭВМ и разделяются на магнитные ленты
(НМЛ) и магнитные диски (НМД). Появлявшиеся в различное время магнитные барабаны и магнитные карты особого распространения не получили. В настоящее время устоялось следующее представление: НМД используются для оперативного (во время решения задач) хранения информации, НМЛ — для резервного (архивного) хранения (стримеры).
Файл (набор данных на внешнем носителе) рассматривается как совокупность записей одинаковой структуры, каждая из которых представляет собой набор (агрегат) разнородных данных (в языках программирования PL/1, Pascal, Си за подобными объектами так и закрепилось название структура — structure).
Понятие файла появляется впервые в операционной системе OS/360 фирмы IBM, причем в ранних версиях системы «настоящим файлом» считался только перфокарточный массив (file = = картотека), данные на МД и МЛ обозначались как DS (Data Set — набор данных). В последующих ОС (RSX, UNIX, MS-DOS) файлами становятся именованные организованные наборы данных на любых носителях и устройствах, за сохранность и обновляемость которых (а также передачу в прикладные программы/из прикладных программ) и несет ответственность ОС ЭВМ.
В зависимости от типа и назначения файлов и возможностей ОС (методов доступа) файл может передаваться в прикладную программу как целое, или блоками (физическими записями) и логическими записями (строками, словами, символами).
В системе OS/360 основную роль играли два типа файлов:
символьные (исходные программы или данные);
двоичные (программы в машинных кодах).
В современных системах активно используется значительно большее разнообразие файлов, из которых мы перечислим наиболее типичные (табл. 1.8):
текстовые файлы — обобщенное название для простых и размеченных текстов, ASCII-файлов и других наборов данных символьной информации, которые интерпретируются и обрабатываются текстовыми редакторами, процессорами, анализаторами (Lexicon, Word, TEC, анализаторы SGML, HTML);
текст без разметки (планарный) — файл, содержащий только отображаемые (воспроизводимые на всех печатающих устройствах и терминалах) символы кода ASCII, а так
Таблица 1.8. Основные типы файлов, обрабатываемых в ПЭВМ
Тип, расширение имени
|
Вид информации, содержащейся в файле
|
exe, com
|
Программа, готовая к исполнению
|
bat
|
Текстовый командный файл
|
sys
|
Системный файл
|
ovl, ovr
|
Оверлейный файл
|
txt, 1st
|
Текстовый файл в формате DOS
|
doc
|
Документ (чаще всего в формате WinWord)
|
rtf
|
Размеченный текстовый файл (Rich Text Format)
|
dot
|
Файл формата документа (Document Type)
|
pdf
|
Формат документа Adobe Acrobat
|
wri
|
Документ редактора Write для Windows;
|
bak, old
|
Старая копия файла, создаваемая перед его изменением
|
arj, rar, zip, lzh, arc
|
Архивные файлы
|
bas
|
Текст программы на языке Basic
|
pas
|
Текст программы на языке Pascal
|
с
|
Текст программы на ЯП Си
|
bmp, pcx, gif, tif, jpg
|
Графические файлы
|
dbf
|
Файлы базы данных формата DBase, Foxpro, Cliper
|
xls
|
Электронные таблицы EXCEL
|
lib, dll
|
Файлы библиотек
|
hip
|
Файл справки (подсказки, помощи)
|
mnu
|
Файл меню
|
wav, mid, mp3, mod
|
Звуковые файлы
|
avi, mov, mpg
|
Файлы видеоклипов
|
же простейшие управляющие символы: возврат каретки (cr); перевод строки (lf); символ табуляции (tab), иногда — новая страница (lf);
текст с разметкой — планарный файл, содержащий бинарную, или символьную, разметку, управляющую отображением информации (программно и/или аппаратурно);
ASCII-файл — содержит только отображаемые коды кодовой таблицы ASCII (латиница и служебные символы), обычно применяется для хранения документов с символьной разметкой (RTF, SGML, HTML);
табличный файл — содержит форматированные данные (символьные, численные и др.), образующие строки и столбцы таблиц, создаваемых и обрабатываемых табличными СУБД (FoxPro, Clipper, MS Access) и/или процессорами (SuperCalc, MS Excell и др.);
графический файл — бинарный файл, содержащий графическую информацию. Форматы: tif (Tagged Image File), BMP
(Bit-Mapped Picture), а также ряд других — PCX, pic и т. д.;
мулыпимедиафайлы — бинарные, содержащие оцифрованную аудио- (типы wav или MIDI-Sequencer), видео- (фор
мат MPEG) или смешанную информацию.
Цикл обработки файла (например, внесение изменений в счета клиентов) включает следующие операции:
открытие файла — занятие устройства, на котором файл размещен (например, МД), создание в ОП управляющего
блока, в котором записывается справка о состоянии файла и буфера (или набора буферов — буферного пула) для хранения текущей, обрабатываемой записи файла;
организация цикла, управляемого файлом (заканчивается по исчерпании записей файла — наступлении состояния EOF — end-of-file), после чего выполняется некоторый оператор, обычно завершения обработки. Цикл должен содержать команду типа read, get (ввод записи), put, write (вывод записи) либо rewrite (обновить запись). Команда read может являться функциональным аналогом заголовка цикла;
закрытие файла — выполнение операций по внесению всех окончательных изменений в файл и его реквизиты, освобождение памяти, отведенной под файл, и устройства, на котором он размещался.
Достарыңызбен бөлісу: |