Социальная информатика - Соколова Ирина Викторовна читать книги онлайн бесплатно полностью без регистрации стр 9.

Шрифт

Фон

Полисемия – основная проблема языковой формы информационного обмена, фактор внесения искажения и ошибок (семантического шума) на пути передачи информации. Поэтому устранение многозначности является одним из наиболее важных направлений в разработке формальных приемов представления знаний. Создание языка науки или языка деловой прозы, называемого часто «канцеляритом», является естественным шагом на этом пути. «Канцелярит» предназначен для объективизации изложения информации, использует, как правило, переводимые категории и языковые формы, лишен синонимии, оперирует конкретными фактами и понятиями, не избыточно информативен и логичен.

Все перечисленные выше свойства не присущи литературному языку, которому свойственна субъективность форм, возможность применения непереводимых конструкций, бесконечно богатая синонимия, образность высказываний и т. д.

Продвижение в сторону формализации знаний приводит к понятиям «класс» и «классификация».

Классификация – распределение предметов, объектов и понятий по группам (классам) в соответствии с обнаруженными свойствами.

В контексте информатизации общества ставится, например, вопрос о необходимости анализа и построения логических моделей сети Интернет с целью более полного извлечения содержащейся в нем информации: не фактической, как это делается в настоящее время, а аналитической, не представленной в сети явным образом[50].

Рассмотрим основные системы классификации знаний: иерархическую, морфологическую, древовидную, реляционную.

Классификация как метод научной систематики играет важную роль в формировании ядра знаний того или иного научного направления. Классификационные системы такого типа имеют выраженную иерархическую структуру, в которой все объекты (понятия, факты) разделены на уровни, связанные между собой отношением «старший – младший».

Классификация может проявить себя не только как инструмент организации научных знаний, но и как фактор социального порядка, способствующий активизации социальных отношений. Так, существующие системы тарифов и ставок, ученых степеней и званий, структура должностей и служебных постов в гражданской службе и армии играют не только организующую, но и стимулирующую роль. Подобная модель классификации знаний получила в науке и практике название иерархической.

Достоинства данной системы классификации заключаются в том, что она проста в освоении, легко обновляется и эффективно решает задачу разнесения новых понятий по иерархическим уровням.

Недостатки иерархической модели знаний: прямые связи между понятиями соседних уровней обозначены слабо, или вовсе отсутствуют; иерархическая классификация наиболее эффективна, когда при переходе от уровня к уровню работает один и тот же тип отношений, например, родовидовой.

Систематика, лежащая в основе классификации, может применяться как сильное средство исследования. Так, иногда оказывается полезным при рассмотрении группы объектов выделить несколько характерных для них признаков в качестве определяющих и ввести меру степени их проявления. Подобный подход называется морфологическим, так как использует идею разложения объекта на его части (признаки). Часто подобная группировка приводит к выявлению неизвестных закономерностей, связывающих объекты каждой группы.

Упомянутые выше недостатки иерархической модели классификации свойственны и морфологическим моделям. Их удается устранить, используя так называемые ветвящиеся (древовидные) структуры (модели) представления знаний, которые, в частности, лежат в основе актуальных в контексте развития Интернет гипертекстовых технологий. В последнее время исследователи активно разрабатывают способы автоматического построения гипертекстов. Идея динамического гипертекста состоит в том, что вместо разбивки текста на фиксированные узлы, текст связывается большим количеством связей между входящими в текст одноименными поисковыми единицами: словами, терминами, текстовыми константами и т. д. Разработанная в ИПИ РАН по концепции динамического гипертекста система ТЕРМИН-3[51] обеспечивает построение гипертекстовых сред в автоматическом режиме. Система предназначена для разработки конкретных гипертекстов, информационно-поисковых систем фактографического типа, электронных книг и тезаурусов, частотных словарей и т. п.

Отдельные понятия, факты, знания, связаны между собой отношениями, выражающими суть имеющихся между ними связей. Как и в иерархической модели, это могут быть родовидовые отношения, но также и другие типы отношений: «быть представителем», «иметь», «наследовать» и т. п. Однозначность связей в древовидной структуре и разнообразие охватываемых ею отношений позволяет повысить «динамизм» системы знаний. Действительно, система знаний, представленной иерархической или морфологической моделями, статична (декларативна).

В древовидной структуре можно прослеживать восходящие и нисходящие ветви связей, делая как индуктивные (от частного к общему) и дедуктивные (от общего к частному), так и индуктивно-дедуктивного выводы.

Благодаря такой организации представленные знания получают как дополнение к декларативности процедуральность, т. е. способность к выводу общих знаний из структуры отношений и понятий. Древовидная структура знаний, несмотря на ее простоту и распространенность в информационном обмене, все-таки специфична. В ней, как и в предыдущей модели знаний, заложена парадигма иерархичности. В то же время некоторая система знаний может не соответствовать этой парадигме.

Например, совокупность знаний, описывающих конкретный трудовой коллектив, многоаспектна, и часто не удается установить отношения иерархии (род-вид), хотя связь между ними имеет место. Вот один из возможных аспектов: все представители трудового коллектива могут быть включены в алфавитный список с указанием табельного номера, года рождения, специальности и т. п. – «Список 1». Другой аспект: все члены коллектива работают на условиях сдельной оплаты, и величина их заработка определяется единой тарифной сеткой. Поэтому список специальностей и разрядов с указанием стоимости часа рабочего времени дает представление о системе оплаты труда. Назовем этот список – «Список 2». Третий аспект: при начислении зарплаты необходимо учитывать фактическую выработку работника на протяжении некоторого периода. Поэтому список, состоящий из табельных номеров и фактически проработанного каждым времени, – это «Список 3».

Все три списка содержат необходимый объем знаний о трудовом коллективе в контексте начисления заработной платы. Подобные модели представления знаний, состоящие из связанных списочных структур, получили название реляционных[52].

В реляционных моделях удается представить более сложные области знаний. В них каждый из аспектов может рассматриваться как автономный блок, внутри которого допускаются изменения. Удобным средством является комбинация устойчивых и изменяемых знаний. Так, знания Списка 2 длительно устойчивы. В Списке 1 представлены знания, которые могут меняться с течением времени – текучесть кадров, изменение квалификации и т. п. Список 3 обновляется каждый раз по мере необходимости. Не вызывает трудностей задача пополнения реляционной модели новыми знаниями путем расширения уже имеющихся списков и добавления новых списочных структур.

Ваша оценка очень важна

Шрифт

Фон

Соколова Ирина Викторовна - Социальная информатика стр 9.

Помогите Вашим друзьям узнать о библиотеке

Скачать книгу