Таким образом, огромное количество информации хранится в виде данных на различных материальных носителях: в книгах, тетрадях, архивных документах, файлах интернета и пр. В этом море информации выделяются большие хранилища данных: библиотеки, архивы, базы данных, информационные фонды.
Для того, чтобы указать, где находится необходимая информация, необходимо назвать соответствующее хранилище. Но, кроме того, нужно указать конкретный элемент данных, содержащий нужную информацию, назвать необходимую «порцию» информации.
В процессе фиксации информации происходит занесение некоторой «порции информации» на какой-то материальный носитель в виде текста, представляющего собой «порцию данных». Будем далее «порцию информации» обозначать термином «сообщение».
При непосредственном общении «порция данных» сразу же поступает в «обработку», т.е. реализуется передача данных в режиме «адресант адресат». При отложенном общении «порция хранимых данных» поступает к получателю в режиме поиска: «запрос ответ». По инициативе получателя задается запрос, в соответствии с которым воспринимающая система выдает ответ. Для обеспечения этого процесса необходимо, чтобы воспринимающая система могла найти ту «порцию данных», где зафиксировано нужное сообщение.
Поэтому важнейшими вопросами построения процесса обработки информации (данных) являются вопросы о том, какова структура хранимых данных и как сопоставляются «порция информации» (сообщение) и соответствующая ей «порция данных» (текст).
Структура данных определяется, прежде всего, структурой материального носителя, на котором находятся данные. Материальный носитель представляется как совокупность некоторых «кусков», т.е. материальных объектов с определенными физическими свойствами. В качестве материального объекта может выступать лист бумаги, сброшюрованная пачка листов бумаги, магнитный или оптический диск, кусок холста и др.
Все пространство хранения данных это совокупность материальных объектов, на которых зафиксированы те или другие данные. Таким образом, основным структурным элементом данных является совокупность данных, расположенных на одном материальном объекте. Такую совокупность обычно связывают с понятием «документ».
Не всякий материальный объект с зафиксированными на нем данными является документом. Например, только что найденный в Великом Новгороде кусочек бересты с текстом не является документом, и станет им тогда, когда будет зафиксировано, где и когда он был найден, а сам кусочек получит учетный номер.
Для того чтобы выбрать объект, идентифицировать, т.е. однозначно обозначить его, нужно знать его характеристики, отличающие его от других объектов. Если выбор осуществляет непосредственно человек, то он может ориентироваться как на «информационные» характеристики объекта (название, автор, год издания, текстовое описание и пр.), так и на характеристики, воспринимаемые чувственно (цвет, форма, размер, вид носителя и пр.). Например: «Дедушкина толстая синяя записная книжка». Если же поиск осуществляется с помощью вспомогательных средств (каталоги, компьютер), то объект можно идентифицировать только «информационно», с помощью таких характеристик как шифр, инвентарный номер, и т. п.
Документ это идентифицируемый материальный объект, содержащий информацию.
Это определение имеет наиболее общий характер. В разных отраслях деятельности человек имеет дело с документами разного вида, к ним применяются различные дополнительные требования. Например, юридически значимые документы должны быть оформлены специальным образом, содержать подписи, печати и т. д. Документом является и паспорт человека, и завещание, и надгробная плита, и книга, и картина художника, и аудиозапись, и файл на магнитном носителе.
Определение документа отражает две разные ипостаси документа, в соответствии с которыми он может быть интересен потребителю: «что это за информационный объект» и «про что он». А именно: иногда интересно иметь сведения о документе как объекте, о его правовом статусе и других характеристиках, в том числе, может быть, и об информации, отражаемой в этом документе. В других случаях потребителя интересует собственно информация о чем-то, в том числе, может быть, сведения о документе (объекте), содержащем эту информацию.
Чаще всего, конечно, документ интересен с точки зрения его информации. Но чтобы найти нужный документ, необходимо найти тот материальный объект, на котором зафиксирована эта информация.
Документ является особым типом объектов. Объект это нечто, существующее в реальной действительности. Объекты характеризуются какими-то свойствами: цвет, форма, размер, назначение и пр. Объекты отличаются друг от друга разными значениями их свойств. Для того, чтобы обозначить объект, следует назвать отличающие его значения некоторых свойств. Например: марка, год выпуска, цвет, номер регистрации автомобиля; фамилия, должность, табельный номер сотрудника. Значения некоторых свойств однозначно определяют объект (номер регистрации автомобиля или табельный номер сотрудника), значения других свойств позволяют найти несколько объектов (все красные автомобили или все инженеры).
Документы представляют собой особый тип объектов: «Документ это объект, отличающийся от обычного объекта тем, что он содержит информацию». Поэтому для того, чтобы описать документ, необходимо, во-первых, описать некий материальный объект, а во-вторых, описать содержащуюся на нем информацию. И при поиске документов можно задавать как их свойства, характеризующие объект (год издания книги, название, автор), так и характеристики информации, содержащейся в документе. Например: найти произведения А.С.Пушкина, изданные в 1999 г, в которых говорится о Пугачеве и о заячьем тулупчике.
Операции с данными. Двоичный код. Единицы измерения информации
Операции с данными. В ходе информационного процесса данные преобразуются из одного вида в другой. Обработка данных включает в себя множество различных операций. В ходе развития человечества усложняются условия управления производством и обществом, увеличивается и объем обрабатываемых данных. Появляются и внедряются новые носители данных, средства их хранения и доставки. В структуре возможных операций с данными можно выделить следующие основные:
Сбор данных накопление информации с целью обеспечения достаточной полноты ее для принятия решений;
Формализация данных приведение данных, поступающих из различных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;
Фильтрация данных отсеивание «лишних» данных, в которых нет необходимости для принятия решений;
Сортировка данных упорядочение данных по заданному признаку с целью удобства использования, повышает доступность информации;
Архивация данных организация хранения данных в удобной и легко доступной форме;
Защита данных комплекс мер, направленных на предотвращения утраты, воспроизведения и модификации данных;
Транспортировка данных прием и передача данных между удаленными участками информационного процесса, при этом источник данных принято называть сервером, а потребителя клиентом;
Преобразование данных перевод данных их одной формы в другую или из одной структуры в другую.
Преобразование данных часто связано с изменением типа носителя, например книги можно хранить в обычной бумажной форме или в электронной. Необходимость в многократном преобразовании данных возникает также при транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных. Например, для транспортировки цифровых потоков данных по каналам телефонных сетей необходимо преобразование цифровых данных в некое подобие звуковых сигналов. Этим занимаются специальные устройства телефонные модемы.