Информатика и ИТ. Нейросети. - Морозов Николай Петрович читать книги онлайн бесплатно полностью без регистрации стр 11.

Книгу можно купить на ЛитРес.
Всего за 140 руб. Купить полную версию

Шрифт

Фон

Формы представления чисел в компьютере и кодирование числовой информации рассматривались в предыдущей главе. Важными источниками информации являются кроме числовых текстовые, звуковые и графические данные.

Для записи слов была изобретена дискретная система кодирования алфавит, но она не подходит для хранения и автоматической обработки в вычислительной технике. Двоичное кодирование символьных данных производится с помощью кодовых таблиц, в которых каждому символу соответствует двоичный код.

Для представления изображений используют два способа растровый и векторный. Оба они используют двоичный код для хранения цветовых и пространственных характеристик.

Для представления звука в виде цифрового кода сигнал дискретизируют по времени и квантуют по уровню с помощью аналого-цифрового преобразователя.

Компьютерное представление текстовой информации

Текстовые данные являются важнейшим источником информации. Для записи слов человечеством были изобретены буквы, для указания оттенков речи знаки препинания. Все это символы, символьный способ хранения изначально дискретен, и способ компьютерного представления сводится к кодированию символов численным способом.

Все используемые способы представления символов в памяти компьютера, так или иначе, сводятся к нумерации символов алфавита и хранения полученных кодов как целых чисел. Этому коду драйвер видеокарты ставит в соответствие начертание символа (тем или иным шрифтом).

Такое кодирование производится размещением кодовых таблиц в оперативной памяти компьютера, по которым каждому символу ставится в соответствие двоичный код.

При кодировании языков, использующих алфавитную (не иероглифическую) письменность, достаточно 127 символов (в английском языке 26 букв +26 прописных «заглавных» +10 цифр + знаки препинания и арифметические знаки). Следовательно, для кодировки достаточно по 7 бит на каждый символ, этот принцип использует самая распространенная система кодирования латиницы ASCII (American Standard Code for Information Interchange американский стандартный код для обмена информацией). Код ASCII был разработан в 60-х годах XX века для любых видов передачи информации (телеграфа, телетайпа) и поэтому в нём, кроме информационных символов, используются символы-команды для управления связью. Эти символы: Начало текста, Конец текста, Звуковой сигнал, Горизонтальная табуляция и т. д. ныне вышли из употребления. Их коды являются служебными и трактуются большинством форматов как управляющие команды. Они занимают первые 31 позиции в таблице.

Таблица 3.1.

Таблица символов ASCII (128 255)

С 1981 г. в таблице ASCII для представления 1 символа используется 1 байт, т.е. таблица может описывать 2

Коды с десятичными номерами 0127 образуют основную страницу таблицы. В основной странице располагаются управляющие команды для принтеров (031 возврат каретки, перевод строки и т.д.), затем спецсимволы (#$%&*@ пр.), цифры и латинские буквы, прописные и строчные.

Коды с номерами 128255 (табл. 3.1) отданы под знаки национальных алфавитов и символов псевдографики (псевдографика широко использовалась в 80-е годы). Вид символов, имеющих значение кода больше 127, зависит от выбранного шрифта.

С распространением компьютеров, программных продуктов и использования информационных ресурсов по миру выяснилось, что во многих странах Юго-Восточного региона 128 кодов под национальные символы не хватает, и в 1991 г. был принят стандарт ISO-10646-1 (иначе UNICODE-3). Для этого стандарта на кодирование символа отводится 3 байта.

В Юникоде первые 128 символов тоже совпадают с соответствующими символами ASCII. Далее размещены основные алфавиты современных языков. В целом, UNICODE-3 описывает алфавиты всех известных (в том числе и «мертвых» языков; в кодировку внесены все математические и иные научные, и символьные обозначения, и даже придуманные языки письменность эльфов и Мордора.

В современных компьютерах используется укороченная, 16-битовая версия UNICODE. По этой системе каждый символ кодируется двухбайтовым числом, следовательно, таблица описывает 2

Существуют и другие таблицы кодирования.

UTF (Unicode Transformation Format) применяется в UNIX-подобных операционных системах, кодировка с переменным количеством байт/символ.

CP1251 «Code Page 1251» однобайтовая кодовая страница кодировки ОС Windows

Для представления русского варианта кириллицы были разработаны несколько кодовых таблиц, наиболее распространенной была КОИ-8 (Код Обмена Информацией, 8-ми битный).

Компьютерное представление графической информации

На сегодняшний день компьютерную графику по способу формирования и хранения изображений в памяти компьютера принято подразделять на растровую и векторную.

Растровое изображение формируется цветовыми точками. Растровые графические данные, в зависимости от способа сжатия, выбора глубины цветовой палитры, возможности хранения слоев и прочих возможностей при кодировании подразделяются по форматам стандартных способов записи файлов.

Векторное изображение формируется из набора объектов, описываемых с помощью математических формул.

Векторную графику, в свою очередь, по методу отображения можно разделить на большие категории:

2D-графику (плоскостную);

3D-графику (объемную);

фрактальную графику (создание регулярных структур).

Изображения векторной графики также имеют собственные стандарты форматов хранения файлов.

По назначению компьютерную графику можно разделить на:

Конструкторскую (инженерную) графику;

Полиграфическую;

Web-графику и т. д.

В таком делении учитываются требования области применения: для конструкторских работ важна точность отображения, но не слишком велики требования к цветовым характеристикам; для полиграфии наоборот, точная цветопередача является основным требованием; в Web-графике существуют ограничения по объему файлов, к тому же, во всемирной паутине весьма ограничены цветовые палитры.

Цветовые модели. Разрешение

Для каждой точки растрового изображения (или для каждого объекта векторного изображения) должна сохраняться цветовая характеристика.

Если изображение монохромное (черно-белое) то хранить нужно только один признак цвета есть цвет или нет, т.е. достаточно одного бита на каждый пиксель (объект) изображения.

Для описания градации одного цвета применяется обычное кодирование, в котором номер обозначает градацию. Чем больше значение, тем сильнее проявляется цвет. Таким образом, появляется возможность задавать оттенок цвета. Чтобы получить реальные полутона (для монохромного изображения), для хранения каждой цветовой точки нужно отводить большее количество разрядов. В этом случае черный цвет будет представлен нулевым значением, а белый максимально возможным числом. Например, при восьмибитном кодировании получится 256 разных значений яркости (оттенки серого, Grayscale).

В более сложных случаях, когда речь идет о кодировании сложного цвета с большим количеством оттенков, рассматривают разложение цвета на несколько отдельных компонентов, которые, смешиваясь (т.е. действуя в одной точке), образуют заданный цвет.

Для цветных изображений нужно закодировать яркость и оттенок точки. Для получения наивысшей точности цветопередачи необходимо иметь по 256 значений для каждого из основных цветов (вместе это дает 23*8 более 16 миллионов оттенков).

Ваша оценка очень важна

Шрифт

Фон

Морозов Николай Петрович - Информатика и ИТ. Нейросети. стр 11.

Компьютерное представление текстовой информации

Компьютерное представление графической информации

Помогите Вашим друзьям узнать о библиотеке

Скачать книгу

Популярные книги автора