– доступность. Информация, хранящаяся на компьютере доступна 24 часа в сутки 365 дней в неделю.
– надежность. Как говорит один из законов Мэрфи «Компьютеры ненадежны, но люди еще ненадежнее». Это свойство является следствием из принципов доступности и определенности структур данных.
– определенность структур данных. Компьютерная система должна позволять проанализировать себя пользователю. Внутренние механизмы компьютера должны быть понятны и прозрачны, то есть анализируемы. Напротив, форма хранения знаний человеком неопределенна. Механизмы хранения знаний человеком непрозрачны и недоступны для получения извне.
Разумеется, невозможно сравнивать компьютер и человека. Такое сравнение неизменно напоминает анекдоты вроде «чем девушка отличается от телевизора…» или же «чем отличаются орехи от мужа…». Тем не менее, использование универсальной информационной системы может дать следующие возможности:
– создание гибких и динамических систем принятия решения/управления некоторыми процессами и данными,
– выявление неочевидных связей между данными,
– существенное снижение затрат на программирование систем,
– создание баз знаний, модифицирующихся структур данных и самоорганизующихся процессов в информационных системах,
– существенное упрощение получения, интерпретации и формирования данных при взаимодействии системы с другими системами и с окружающим миром.
Реализация этих обширных планов невозможна без участия двух составляющих системы – данных и процессов, реализующих обработку данных. Эта пара реализует дуализм в информационных системах, выражающих статику и движение, соответственно. Модели данных, используемые на сегодняшний момент, не позволяют в достаточной степени удовлетворить требованиям, которые предъявят интеллектуальные информационные системы к этим моделям в силу множества ограничений по гибкости, заструктурированности и пр. Эти ограничения будут рассмотрены ниже. Получается, что жесткая структура данных, распространяет свое статическое влияние на процессы. Системам непременно потребуется новая модель данных, не отрицающая устоев существующих структур данных, но предлагающая принципиально новые подходы. Такая модель и является целью настоящей книги.
К сожалению, в теориях, описывающих глобальное взаимодействие множества агентов (независимых участников какой-либо системы, среды или социума) часто прослеживается идея «интеллектуального супа» или самозарождения жизни. Например, к таковым относятся макроэкономические теории, а в особенности теории, связанные с интеллектуальными технологиями. Некоторые теории предполагают, что достаточно создать некоторые начальные условия и структуры, и по прошествии некоторого времени мы сможем получить саморазвивающуюся интеллектуальную систему без дополнительных усилий по созданию такой системы. Такие теории считают, что для создания интеллектуальной системы достаточно создать «первичный бульон», а готовая система будет самостоятельным результатом эволюционных факторов и внешних влияний.
Анализ результатов работы подобных подходов говорит, что на практике в результате работы таких моделей никаких реальных результатов не появляется. «Интеллектуальный бульон» остаётся лишь набором ингредиентов, если только его не поражает гниль и плесень. Жизнь или не рождается сама, или ситуация с самостоятельным зарождением жизни похожа на теорему о бесконечных обезьянах («абстрактная обезьяна, ударяя случайным образом по клавишам пишущей машинки в течение неограниченно долгого времени, рано или поздно напечатает любой заданный текст»). Зато чаще всего такие декларации говорят о том, что теория недостаточно проработана и там, где теоретически должна зародиться самостоятельная жизнь, представления самих авторов теории о том, что же конкретно должно произойти в том месте, заканчиваются.
В этой книге я постараюсь ограничить себя от подобных недоработок.
Ограничения
Область действия интеллектуальных систем чрезвычайно широка – от распознавания текстов и речи до роботизированных систем.
Большая часть систем ориентирована на коммуникацию с человеческими системами – с письменностью, устной речью, лексическим анализом и пр. Обычно они производят наиболее яркое впечатление при демонстрации. Робот, моделирующий поведение человека вызывает ощущение, что перед тобой человек. В большинстве же случаев такая реализация – это не более чем моделирование отдельных составляющих человека, которые теряют смысл без всех прочих неотъемлемых частей, таких как коммуникация, хранение информации и пр.
В этой книге я сосредоточусь в большей степени на низкоуровневых механизмах, которые как раз позволят связать подходы естественного анализа, такие как логика, механизмы обучения, формирование потребностей, с техническими основами, такими как управление операциями и системы управления базами данных.
Вследствие этого все остальные части общей системы, будут отодвинуты на второй план как менее значимые. Например, всё взаимодействие с человеком будет рассматриваться на уровне традиционных экранных интерфейсов, а вопросы синтаксического анализа, например, анализ падежей и других конструкций языка, будут опущены как производные.
Картина мира
Агенты
Прежде чем переходить к частным вещам, таким как идентификация данных или связь лексических единиц, рассмотрим системы с точки зрения макро-элементов. То есть, рассмотрим среду, в которой существует информация, данные и информационные процессы. Это необходимо для определения этимологии информации, определения общих правил её распространения и для получения обобщенного взгляда на информационные процессы.
Так же, как и в окружающем нас мире, в интеллектуальных системах можно выделить несколько принципов, которые влияют на взаимодействие систем на макро-уровне. Разумеется, можно не брать во внимание это общее представление, абстрагироваться от него. В таком случае мы упростим систему, и тогда она будет ограничена только поставленными перед ней задачами обработки данных, и не будет ориентироваться на коммуникацию с внешними системами. В таком случае внешние системы, и как частный случай этих систем – человек, должны будут подстраиваться под эту систему, которая в свою очередь дистанцируется от взаимодействия с другими системами. Такая система, очевидно, будет похожа на образец систем 60-х годов прошлого века. В частности, Норберт Винер в своей «Кибернетике» писал: «В идеальную вычислительную машину все данные надо вводить сразу же в начале работы, и затем до самого конца она должна по возможности быть свободна от человеческого вмешательства. Это значит, что машина должна получить в начале работы не только все числовые данные, но и все правила их соединения, в виде инструкций на любую ситуацию, которая может возникнуть в ходе вычислений.» [1]. Для любого современного пользователя программных систем этот подход выглядит более чем анахронично в силу своей чрезвычайной закрытости и отсутствия интерактивности.
Мы же рассматриваем систему, которая должна иметь возможность постоянно развиваться, и которая будет способна к универсальности в выполнении задач. Под универсальностью понимается их возможность встраиваться в общую экологическую систему своего существования (общество).