При решении задач часто требуется использование больших объемов данных. Это различные справочники или таблицы, архивы запросов или протоколов работы и т.п. Местом хранения всех этих данных являются магнитные диски или ленты. Информация, расположенная на них имеет определенную структуру. в файлы. Совокупность данных записанных под одним именем называется файлом. Файлы помещаются в определенном каталоге (директории). В операционной системе Windows-95 каталоги называются “папками”. Каждый файл обязан иметь имя и расширение, по которому в большинстве случаев можно определить тип файла — текстовый, графический, исполняемый и т.п. Расширение отделяется от имени файла точкой. Совокупность указанных частей носит название полное имя файла, например OBL1. DOC — полное имя файла, где OBL1 — собственное имя файла; DOC — расширение, указываемое, что файл представляет собой документ и создан (скорее всего) с помощью текстового редактора Word.

Операционная система позволяет организовать на любом диске (электронном, гибком или жестком) систему каталогов, Каждый из которых имеет свое собственное имя. Система организована иерархично, образуя древовидную структуру. Самый верхний уровень называется корневым каталогом (ROOT). Из него выходят подкаталоги верхнего уровня, которые в свою очередь содержат собственные подкаталоги.

Перечень команд работы с файлами содержит шесть групп. Это команды создания файлов, удаления с диска, переименования, перемещения в другой каталог или диск, открытия для операций с данными, содержащимися в файле и команды изменения атрибутов самого файла. Операционная система MS DOS имеет для работы с каталогами имеет следующие команды: создание подкаталога — MKDIR, установка текущего каталога — CHDIR, уничтожения пустого подкаталога — RMDIR.

Операция создания файла подразумевает запись на диск информации о файле: полном имени с расширением, атрибуты файла, дату и время его создания, а также указателя на позицию в таблице размещения файлов — FAT. Многие программные средства и прикладные программы, в числе которых можно примести язык программирования Basic, не содержат специальной команды создания файлов. Им достаточно задать команду на открытие файла для операции вывода в файл. При открытии сначала идет поиск данного файла на диске, и если он не найдет, то создается под указанным именем.

Операция уничтожения файла не уничтожает его физически с диска. Она заменяет первый байт имени файла другим значением и изменяет FAT с тем, чтобы сектора данного файла были доступны для записи новой информации. Такая организация позволила разработать программы восстановления стертых файлов. К ним относится в частности UNERASE из комплекса NORTON UNTILITES.

Переименование файла заключается в изменении имени файла. При операции переименования файл не изменяет своего положения на диске.

Операция перемещения представляет собой две элементарных операции: уничтожения и копирования. Операция производит уничтожение требуемого файла в данном каталоге и создание его в другом каталоге. Уничтоженный файл можно восстановить специальными программами. Часто операция перемещения совмещается с переименованием имени файла или его расширения.

Понятие открытия файла подразумевает создание небольших участков памяти, где будет храниться информация о файле. Этот участок носит название буфера. Информация передается при записи из памяти в буфер, а затем в файл и наоборот при чтении. В операционной системе MS-DOS количество открытых файлов и, соответственно, количество буферов определяется параметром команды FILES . Многие программные продукты способны самостоятельно устанавливать число буферов.

Каждый файл содержит группу определенных реквизитов. К ним относятся спрятанный, защищенный, системный, архивный. Все они устанавливаются специальными программами.

К существующему на диске файлу можно получить доступ двумя методами — прямым или последовательным, которые отличаются друг от друга расположением в них элементов данных. Операционная система представляет возможность работать с файлами прямого доступа как с последовательными файлами и наоборот.

Последовательные файлы помещают каждый элемент данных последовательно один за другим. Если в операторе вывода отсутствует разделители запятая или точка с запятой, то каждый элемент оканчивается кодами ВКПС. Числовые переменные при выводе преобразовывают в строку, содержащую число, если нет указателя на хранение в числовом виде. Операция чтения происходит последовательно, начиная с первого элемента. Строки содержащие число могут быть считаны в строковые или числовые переменные. Если попытка преобразования строки в число не удается, то генерируется ошибка.

Файлы прямого доступа заранее отводят на диске фиксированное число байт для каждого элемента данных. Если отведенное место не полностью занято данными, то остаток заполняется пробелами. Элемент данных называется записью, а число байт — длиной записи. Нумерация записей начинается с единицы. Определение местонахождения требуемой записи в файле в разных программных системах происходит по-разному. Бейсик, например, находит нужную запись, вычислив номер байта в файле по формуле:

B = N*L-L,

где: B — первый байт записи; N -номер требуемой записи, L — длина записи. Отсчет байтов, как видно из формулы, начинается с нуля.

Каждая запись в файле прямого доступа состоит из полей, содержащих однородные данные и имеющих неповторяющееся имя. Кроме имени каждое поле имеет определенную длину и тип. Тип поля зависит от программного продукта создающего файл.