Сайт Информационных Технологий

Каталог >> Теор. информации >>

Вяткин В.Б. Комбинаторно-семантический подход к определению количества информации, как новый инструмент познания окружающей действительности // Человек и общество в информационном измерении. Материалы региональной научной конференции. Екатеринбург: ЦНБ УрО РАН, 2001.


Излагаемый теоретико-информационный конструкт в настоящее время имеет название "Синергетическая теория информации"

В познавательной деятельности мы часто сталкиваемся с ситуацией (рис.1), когда в составе некоторой системы по признакам и , независимо друг от друга, выделяются два системных объекта и , и существует неопределенность их взаимного отражения как целостных образований. Выявляя третий системный объект , такой, что , мы снимаем эту неопределенность и получаем информацию , отражаемую каждым из объектов и относительно друг друга, и называемую негэнтропией отражения. Очевидно, что величина зависит от числа элементов в составе , соответственно. При этом отчетливо понимается, что при постоянстве значений и , является монотонно возрастающей функцией от , принимающей свое максимальное значение, когда и (или) . Актуальность количественного определения негэнтропии отражения во многих областях знания не вызывает сомнений. Вместе с тем констатируется, что традиционные подходы к количественной оценке информации (комбинаторный и вероятностный), изначально ориентированные на решение задач технической связи [ 9,10 ] , не дают удовлетворительных способов такого определения. (Является очевидным, что эти подходы, представляющие информацию, как снятую неопределенность выбора из множества возможностей, при покажут, что ). Отмеченный недостаток существующей теории информации инспирировал разработку специального подхода к определению количества информации, отражаемой системными объектами, получившего название "комбинаторно-семантический". Такое название подхода обусловлено тем, что, с одной стороны, в нем рассматриваются объекты, состоящие из конечного множества элементов, а, с другой стороны, информация обладает конкретным смыслом и представляет собой сведения о целом (в отличие от традиционного комбинаторного подхода, где термин "информация" изолирован от семантики сообщений). Основные положения комбинаторно-семантического подхода и информационно-теоретические результаты, полученные при его разработке, кратко сводятся к следующему.

1. Системный объект и каждый элемент соотносятся между собой как целое и его одноэлементная часть. Такое соотношение, рассматриваемое с диалектических позиций, обуславливает два существенных момента. Во-первых, целое не может состоять только из одного элемента и потому . Во-вторых, совокупность элементов, составляющих системный объект , представляет собой не механическое собрание предметов, обладающих признаком и существующих независимо друг от друга, а единое целостное образование, объединяясь в которое, элементы приобретают новые (интегративные) характеристики, не присущие им в их разобщенном виде. Естественно считать, что эти характеристики выступают в качестве информации о целом, которая имеет количественное выражение, если характеристики обладают числовым показателем, зависящим от общего числа элементов в составе целого.

2. Интегративной характеристикой элементов является их индивидуальный код, длина которого (число символов) функционально взаимосвязана с . При этом разность длин кодов любых двух элементов не превышает один символ. Соответственно, за количество информации (), самоотражаемой системным объектом , принята средняя длина интегративного кода его элементов, как функция от , то есть .

Исходя из интуитивного понимания того, что приращение

,
по мере роста уменьшается, сформулирована аксиома: для любых трех системных объектов , таких, что , , , имеет место неравенство:

. ( 1 )
С позиций аксиомы (1) установлено, что взаимно-однозначное соответствие между множествами значений и наблюдается только тогда, когда интегративные коды элементов составлены с помощью двоичного алфавита. Согласно этому, формула получена в следующем виде:

, ,
где: - целая часть ,


Так как , то в практическом отношении принято:
( 2 )

Особенности взаимоотношений и , и вытекающее из них утверждение (2) наглядно иллюстрируют рис. 2 и 3.

Форма выражения в (2) является математическим подобием информационной меры Хартли [9], взятой при единичном выборе и двоичном основании логарифма, но отличается от нее тем, что количество символов используемого алфавита в мере Хартли является числом логарифма, а в (2) – его основанием.

3. Негэнтропия отражения интерпретируется как величина средней длины интегративного кода элементов одного системного объекта, отраженная через пересекающийся (взаимодействующий) с ним другой системный объект. Формула негэнтропии отражения системных объектов и , взаимосвязанных между собой объектом , имеет вид:

( 3 )

Отмечается, что существенные признаки системных объектов выступают в качестве их полноправных представителей и являются носителями негэнтропии отражения. В соответствии с этим, формула (3) выражает также, как количество информации о системном объекте , отражаемое признаком , так и количество информации о системном объекте , отражаемое признаком .

4. Отражаемый системный объект считается закрытым в информационном отношении, если каждый из отражающих объектов является его подмножеством (Рис.4а). При анализе отражения закрытого системного объекта через множество отражающих объектов , такое, что ? , , установлено следующее. Энтропия отражения (), интерпретируемая как неотраженная часть средней длины интегративного кода элементов , и, определяемая через разность , где - аддитивная негэнтропия, равна:

. ( 4 )

Выражение (4) математически тождественно информационно-энтропийной мере Шеннона [10], занимающей фундаментальное положение в традиционной теории информации. Так как в наших рассуждениях является вторичной (выводимой) функцией, то данный факт выступает в качестве математического подтверждения вывода философа Урсула [8] о существовании двух видов информации: неразрывно связанной с управлением ( в "шенноновском" смысле) и генетически предшествующей ему ( и )). (Подобные математические совпадения, как писал академик Колмогоров, "следует всегда подчеркивать, так как сосредоточение на них внимания содействует прогрессу науки" [7, с.39] ). В отношении собственно и , исходя из выражения

, ( 5 )
утверждается, что они являются взаимодополняющими противоположностями, в сумме всегда составляют постоянную величину (при фиксированном ) и характеризуют отражение системных объектов с различных сторон: упорядоченности и хаотичности, соответственно.

5. Отражаемый системный объект считается открытым в информационном отношении, если хотя бы один из отражающих объектов не является его подмножеством (Рис.4б). Открытие системного объекта сопровождается (относительно его закрытого состояния) уменьшением аддитивной негэнтропии и увеличением энтропии отражения на одинаковую величину , где - аддитивная негэнтропия отражения системного объекта в открытом состоянии. является функцией взаимоотношений системного объекта с окружающей средой и называется внешней энтропией отражения. Соответственно, энтропия , характеризуя внутреннюю структуру отражаемого объекта по совокупности признаков, именуется его внутренней энтропией.

6. Информационно-энтропийный баланс отражения системных объектов, в общем случае, имеет вид:

( 6 )

Выражение (6) является устойчивым, однозначным соотношением между отражаемой, отраженной и неотраженной информацией, справедливым для любых системных объектов, представленных конечным множеством элементов (при (6) сводится к (5)). В соответствии с этим ему придается статус закона с названием "информационный закон отражения", который формулируется следующим образом: при отражении системных объектов, через совокупность непересекающихся между собой признаков, происходит разделение отражаемой информации на отраженную и неотраженную части, первая из которых равна аддитивной негэнтропии, а вторая – сумме внутренней и внешней энтропий отражения.

7. Структурная организация системных объектов (как автономных систем), рассматриваемая со стороны соотношения порядка и хаоса, характеризуется значениями -функции:

. ( 7 )
Если , то в структурной организации преобладает порядок, если , то – хаос. Установлено, что по характеру взаимоотношений и область возможных значений делится на три интервала (Рис.5): левый - , ; центральный - , между и любое отношение ( > , < , = ); правый - , . На основе сказанного все системные образования в структурном отношении классифицируются на 5 типов:

8. При анализе отражения термодинамической системы , состоящей из идеальных газов , установлено следующее. Энтропия Больцмана системы в ее структурно-упорядоченном состоянии () и в состоянии термодинамического равновесия (), а также энтропия смешения газов (), приближенно равны:

, , ,

где: , - постоянная Больцмана. (Относительная погрешность приближения в соответствии с числом Лошмидта составляет: 1см3 газа – 2,3 %, 1м3- 1,7 % и т.д.) Отсюда следует, что уравнение перехода системы из структурно-упорядоченного состояния в состояние термодинамического равновесия


и выражение информационного закона отражения для случая закрытых системных объектов (5), при , асимптотически эквивалентны друг другу. То есть, комбинаторно-семантический подход к определению количества информации имеет непосредственную взаимосвязь со статистической термодинамикой.

Нетрудно видеть, что приведенный аппарат комбинаторно-семантического подхода может найти свое приложение в самых различных областях знания при решении широкого круга задач, как теоретического, так и прикладного характера. Покажем это на нескольких примерах.

Геология. В практике количественного прогнозирования месторождений полезных ископаемых ключевое положение занимает задача оценки информативности признаков, как количественной характеристики их прогнозно-поисковой значимости. Одним из традиционных путей решения данной задачи является использование различных вероятностных мер, включая модификацию информационной меры Шеннона – формулу частной информации "от события к событию" [1]. Вместе с тем, как показывает анализ [2,3], такая методика дает неустойчивые, ситуационные значения информативности, которые могут приводить к противоречивым прогнозным заключениям в целом. Свободными от этого недостатка являются способы определения информативности признаков, основанные на их негэнтропии отражения относительно эталонных рудных объектов. Такое определение информативности признаков используется прогнозирующей системой ИНФОТ (ИНФормация и ОТражение), которая получила положительную оценку при поисках различных видов полезных ископаемых [4,5].

Физика атома. При анализе взаимосвязи структур электронных систем атомов химических элементов с их свойствами, внимание исследователей, как правило, концентрируется на распределении электронов по наружным оболочкам, "отвечающим" за химические свойства элементов. Структура внутренних оболочек и электронных систем в целом при этом остается в тени. С целью выяснения вопроса о наличии взаимосвязи свойств атомов химических элементов со структурой их электронных систем, как целостных образований, проведено определение значений -функции последних по совокупности электронных подоболочек. Анализ полученных результатов позволяет высказать следующее. График зависимости значений -функции от порядкового номера элемента (Рис.6) имеет периодический, в целом затухающий характер. В горизонтальном направлении периодической системы Менделеева во всех рядах наблюдается одна и та же закономерность: последовательное понижение значений -функции в начале ряда и повышение значений по мере приближения к его концу. Большой интерес представляет график приращений (Рис.7), периодический характер которого особенно отчетливо согласуется с периодическим изменением свойств химических элементов: в пределах каждого ряда, на всем его протяжении, значение последовательно увеличивается, а при переходе в начало следующего ряда резко падает. Из данного факта следует, что , по-видимому, является обобщенной количественной характеристикой ослабления металлических свойств и усиления металлоидных при последовательном переходе от одного химического элемента к другому. В пределах вертикальных групп таблицы Менделеева также наблюдается устойчивая взаимосвязь изменения значений -функции и свойств химических элементов (Рис.8): более сильному выражению металлических свойств элементов четных рядов больших периодов относительно элементов нечетных рядов и усилению металлических свойств в главных подгруппах элементов с увеличением номера больших периодов, соответствует понижение значений -функции. На основании сказанного периодический закон Менделеева получает следующую интерпретацию: периодичность изменения свойств химических элементов является отражением периодического изменения значений -функции электронных систем атомов, определенной по совокупности электронных подоболочек.

Особое внимание обращается на график -функции, определенной по совокупности s, p, d, f -подгрупп электронов (Рис.9). Данный график имеет ярко выраженный периодический характер и включает в себя 4 периода с числом элементов: 1-й период – 2, 2-й – 16, 3-й – 36, 4-й – 64. При этом нетрудно видеть, что каждый период, за исключением 1-го, точно охватывает 2 периода таблицы Менделеева. Из анализа распределения элементов по периодам следует, что общая формула числа элементов в периоде () имеет вид:

( 8 )
где: - номер периода, - степенной коэффициент, принимающий значения: (принципиально может иметь любое значение), , , . На протяжении 2-4 периодов график имеет форму бегущей волны (общий резкий спад значений в начале периода и относительно плавное их повышение при движении к его концу), в соответствии с чем эти периоды именуются волновыми. В пределах волновых периодов отношение числа элементов в нисходящей части графика к числу элементов в восходящей части остается постоянным и равно . Соответственно, число элементов в волновом периоде определяется по формуле:

( 9 )
Отмечается, что правая часть выражения (9), взятая с коэффициентом ?, тождественна форме представления периодических чисел, предложенной Ридбергом [6]. После подстановки (8) в (9) получается уравнение:

,
которое при не имеет решения. На этом основании можно сделать предположение, что в природе потенциально существует только 2 + 16 + 36 + 64 = 118 химических элементов. При этом 118-й элемент завершает 7-й период таблицы Менделеева и, соответственно, является инертным газом.

Структурная организация реальных систем. Одним из аспектов познания того, как устроен мир, является сравнительный анализ структурных "рисунков" системных образований различной природы. Экспериментальное проведение такого анализа с помощью -функции показало следующее: а). Значения -функции электронных систем атомов, разделенных на оболочки, варьируют в интервале от 1,0 до 3,6 при среднем значении 1,93. То же самое, для электронных систем, дифференцированных на подоболочки, составляет: варьирование – от 0,63 до 1.71, среднее значение – 0,82. При этом процесс дробления оболочек на подоболочки сопровождается уменьшением модуля разности и согласованным переходом электронных систем из левого интервала значений в центральный интервал. б). Объединенная электронная система совокупности атомов химических элементов, составляющих таблицу Менделеева: = 0,93. в). Превращения химических элементов, обусловленные радиоактивным распадом ядер, сопровождаются приближением значений -функции к единице: уран (0,715) ® радий (0,755) ® радон (0,782) ® свинец (0,783); торий (0,730) ® астат (0,779) ® свинец (0,783); протактиний (0,718) ® актиний (0,742) ® астат (0,779) ® свинец (0,783). г). Белковые молекулы. Гемоглобин человека: a -цепь аминокислот – 0,93, b -цепь – 0,98. Миоглобин кита – 0,87. д). Одно из наиболее совершенных поэтических произведений – поэма Пушкина "Евгений Онегин": 1-е четырнадцатистишие – 0,94, 2-е четырнадцатистишие – 0,98 и т.д. Совместный анализ пунктов а) ? д) позволяет предполагать, что в природе существует закон структурной организации системных образований, который регулирует антагонистические взаимоотношения хаоса и порядка таким образом, чтобы системные образования устойчиво функционировали в пределах центрального интервала значений , а значения системной -функции по мере их развития стремились к единице.

Социально-политические аспекты. Узаконенные в настоящее время критерии регистрации кандидатов в президенты РФ (сбор 1-го млн. подписей) и получения квоты мандатов в Гос. Думе для политических партий и движений (набирание 5 % голосов на выборах) основаны на субъективных факторах жизненного опыта и интуиции лиц принимающих решения. По этому поводу идут многочисленные дискуссии, большинство участников которых принципиально сходятся в одном: 1-го млн. подписей для регистрации кандидата в президенты РФ явно недостаточно, а 5 % барьер для политических партий и движений при выборах в Гос. Думу является относительно завышенной величиной. Изложенный подход к определению количества информации позволяет получить формализованное значение указанных критериев. Ход рассуждений при этом сводится к следующему. Минимальное значение аддитивной негэнтропии отражения для закрытых систем, независимо от числа их элементов, составляет 1 бит (отражения), что в излагаемом контексте соответствует отражению полной совокупности избирателей через максимально возможное разнообразие политических взглядов, представлений и мнений. Исходя из этого, разумно потребовать, чтобы количество информации (негэнтропии) о полной совокупности избирателей, отраженное через ту ее часть, которая априорно поддерживает кандидата в президенты или голосует за какую-либо партию или движение, было также не менее одного бита. Иначе говоря, информационная полнота отражения всей совокупности избирателей через одну качественно обособленную часть должна быть не ниже, чем при отражении совокупности через максимальное число таких частей. В математическом отношении сказанное выражается условием:

( 10 )

где: - общее число избирателей, - число избирателей, априорно поддерживающих -го кандидата в президенты или голосующих за -ю политическую партию или движение. Исходя их 106 млн. российских избирателей, согласно условию (10) получены следующие значения критериев: необходимое число подписей для регистрации кандидата в президенты РФ – 4,78 » 5,0 млн. подписей, проходной барьер для политических партий и движений при выборах в Гос. Думу – 4,51 » 4,5 % голосов.

Не вызывает сомнений, что действительная численность политических партий и движений, баллотирующихся на выборах в Гос. Думу, должна быть репрезентативной относительно общего числа избирателей. Критерий такой репрезентативности может быть получен из условия дробления системы на равнозначные части, когда хаотичность (энтропия) отражения системы через совокупность этих частей не превосходит его упорядоченность ( негэнтропию): . Отсюда следует, что действительная численность парламентских партий и движений, должна быть не ниже величины . Значение этой величины для РФ составляет 10296 » 10000 чел.

- * * * -

Разработка комбинаторно-семантического подхода к определению количества информации далека от своего завершения, но уже сейчас, на основе изложенного материала, можно утверждать, что речь идет о новом разделе в общей теории информации, имманентно ориентированном на создание формализованного информационно-количественного аппарата познания окружающей действительности. Учитывая, что все сказанное относится только к одномерному отражению, остается только догадываться о потенциальных результатах дальнейших исследований.

ЛИТЕРАТУРА

1. Вентцель Е.С. Теория вероятностей. – М.: Наука, 1969. – 576с.

2. Вяткин В.Б. К вопросу информационной оценки признаков при прогнозно-геологических исследованиях // Известия Уральского горного института. Сер.: Геология и геофизика. - 1993. - Вып.2. - с. 21-28.

3. Вяткин В.Б. Информационные прогнозно-геологические антиномии. // Компьютерное обеспечение работ по созданию государственной геологической карты Российской федерации: Материалы 5-го Всероссийского совещания-семинара. - Ессентуки, 1998 - с.116-119.

4. Вяткин В.Б., Автонеев С.В. Выделение новых потенциально золоторудных площадей в пределах Краснотурьинского рудного узла с помощью системы ИНФОТ // Геологическое картографирование и прогнозно-металлогеническая оценка территорий средствами компьютерных технологий: Материалы 6-го Всероссийского совещания-семинара по компьютерным технологиям – Красноярск, 1999 – с.175-178.

5. Вяткин В.Б. Страшненко Г.И., Мельник В.В. Прогнозная оценка Сакмарского кварценосного района с помощью системы ИНФОТ // Геологическое картографирование и прогнозно-металлогеническая оценка территорий средствами компьютерных технологий: Материалы 6-го Всероссийского совещания-семинара по компьютерным технологиям. – Красноярск, 1999 – с.178-181.

6. Зоммерфельд А. Строение атома и спектры. Т.1.– М.: Гостехиздат, 1956 – 541с.

7. Колмогоров А.Н. Теория информации и теория алгоритмов. – М.: Наука, 1987 – 304с.

8. Урсул А.Д. Проблема информации в современной науке. – М.: Наука, 1975 – 288с.

9. Хартли Р.В.Л. Передача информации. // Теория информации и ее приложения. М.: Физматгиз, 1959 – с.5-35.

10. Шеннон К. Работы по теории информации и кибернетике. – М.: Изд. иностр. лит., 1963 – 830с.


Site of Information Technologies
Designed by  inftech@webservis.ru.