Файл: Томпсон. Механистическая и немеханистическая наука. Исследование природы сознания и формы.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 29.06.2024

Просмотров: 444

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Дополнительные сведения из теории информации

279

Теорема 1

Пусть M есть вычисляемая функция, отображающая множество неотрицательных целых чисел в множество неотрицательных рациональных. Предположим, что M удовлетворяет следующему условию:

2" (29)

х

для некоторого целого v > 0 . Если для некоторого целого г > 0:

L(X\M\ к<2г ,то

M(X)$2C+V-L(X№,

(30)

гдес= 163 + 5,42г.

Доказательство данной теоремы содержится в книге Томпсона (Thompson, 1980), и она сохраняет свою силу при замене L( X \ M ) в (30) на L( X \ F,,..., FJ.

Следствие 1

При тех же самых предположениях относительно M и X получаем:

M(X)<2C+V+14M)-^X). (31)

Это следует из теоремы 1 и выражения (28) при условии т = О и F\ = M. При г - 30 из (31) вытекает неравенство (18) раздела 5.3. Условие г - 30 означает, что (18) применимо только для

Пусть Х\,...,Хт — неотрицательные числа, a G — функция, производящая некоторое отображение множества этих чисел на само себя. Предположим, что G(X\) = ... = G(Xm) = Y. В разделе 5.3 уже говорилось о том, что функция G может интерпретироваться как процесс наблюдения, a Y — как описание наблюдаемых свойств, общих для всех А}. Также мы указывали, что L(Y\ G) может рассматриваться как мера наблюдаемой информации, извлекаемой из Xj при помощи функции G, но не просто как ее след. Количество общей для всех Х\,...,Хт информации мы определим выражением

J(X)=

max

A HG),

(32)

X,G:G(A'l)=K.=G(A'm)=y '

где символом X обозначена совокупность { Х\,...,Х„, }.

280

Приложение 1

Функция ДХ) определяет максимальное количество информации, которое можно извлечь из каждого Xj в ходе какого-либо процесса наблюдения. Точно так же можно определить

J(X\Fi,...,F„), заменив в (32) L(Y\G) на L(Y\G,Fl,...,F„\

ДХ | FI,..., F„) задает количество информации, общей для всех Х}, не зависящих от F\,..., F„.

Теорема 2

Пусть M — мера вероятности на множестве целых чисел Q<x<N. Предположим, что M принимает рациональные значения, и что для записи ./V требуется не более 15 символов.

Если X — набор целых чисел 0 < Х\ ,К , Хт < N, и ДХ | М)<2г для некоторого целого г>0, то

M(X)<2'W(X|M),

(33)

где с'=337 +3,62г.

Эта теорема, доказанная в работе Thompson, (1980), остается

справедливой при замене ДХ|Л/) на J(X\M,F\,...,F„\

 

Следствие 2

 

В предположениях следствия 1:

 

М(Х) < 2c'+^W-Jm _

(34)

Это следствие также получается применением (28). Неравенства (24) и (22) в разделе 5.3 следуют непосредственно из (33) и (34). (Как и ранее, мы выбираем г = 30). В работе Thompson (1980) анализируются свойства и рассматривается ряд примеров использования функций наблюдения.

В разделе 5.2 мы говорили о том, что если длинная строка битов имеет низкое информационное содержание, то должна существовать сильная взаимозависимость между ее различными частями. Теперь мы покажем это формально. Пусть Хт есть строка битов с длиной hm, и предположим, что Хт разделена на подстроки Y\,...,Ym длины А. Если рассматривать Yk как двоичные числа, то можно положить Хо = 1 и

Xk+i = 2»Xk+Yk+l

(35)

для каждого 0<k<m. (Поскольку Хт может начинаться с нуля, мы помещаем впереди единицу, чтобы обратить его в двоичное число.)

Пусть N — очень большое фиксированное число. Будем говорить, что строка битов X является инициирующим сегментом


Дополнительные сведения из теории информации

281

строки битов X', если X' состоит из X, за которой следует n <> О дополнительных битов.

Обозначим через 1(Х) число строк битов X' таких, что L(X')< N и X есть инициирующий сегмент X'. Теперь пусть w

— строка битов (которая может начинаться с нулей). Введем F(h,w,X) как и>-е целое Y (в порядке возрастания), для которого

0<7<2Л и

I(2hX+Y)>2-l(w)I(X). (36)

Эту /"можно назвать генерирующей функцией (Fиспользовалась в Разделе 5.2, где параметр h для удобства опускался).

Использование FB уравнении (11) в разделе 5.2 основано на следующей теореме.

Теорема 3

Пусть Y\,...,Y„, те же, что и в (35), и мы предполагаем, что L(Xm)< N. Тогда существуют строки битов w\,...,wm такие, что

(37)

п-\

и для каждого \<п<т

(38)

Доказательство.

Пусть

К„=тп{К:1(Хп)>2-к1(Х„_1)}. (39)

Тогда

(40)

Из определения 1(Х) следует, что

(41)

Поэтому по крайней мере 2к' -1 из Y в интервале от 0 до 2Л- 1 могут удовлетворять неравенству

282

Приложение 1

l ). (42)

В соответствии с (39) неравенство (42) удовлетворяется при Y = Y„. Следовательно, Y„ есть w-e число из диапазона [О, 2Л- 1],

удовлетворяющее (42), где w лежит в интервале [1, 2К" -1]. Мы можем получить желаемую строку битов w„, добавляя, при необходимости, нули в начало строки w, пока длина строки не станет равной К„. Тогда будет выполнено условие (38).

Для того, чтобы доказать (37), заметим, что 7(Ло) не превышает числа строк X' с L(X'}< N и что оно не больше 2N. Теперь

пусть n = L(Xm)<N. Должна существовать некая программа P

длины п, вычисляющая Хт. Условия нашего языка программирования можно выбрать так, чтобы возможно было построить программу Q в форме Q = РА, где А — произвольная строка из N-n бит. Суть в том, что при выполнении Q компьютер будет выбирать только команды из P и не будет обращаться к А. Таким образом, А может быть выбрано любым из 2N-n способов, и из этого следует, что

1(Хт)>2"-". (43)

Мы получаем (37) из (43) и (40) и /( Х0) < 2N , что и требовалось

доказать.

Мы видим, что генерирующая функция F определяется достаточно просто. Однако при внимательном рассмотрении этого определения мы обнаруживаем, что на практике вычислить F невозможно. В действительности функция F невычислима принципиально. Можно показать, что, хотя L(X) есть точно определенная функция, не существует алгоритма определения L(X) для любого X. (Это рассмотрено в работе Chaitin, 1977). Таким образом, L(X) относится к классу так называемых неисчислимых (или нерекурсивных) функций. Поскольку F определяется из L, очевидно, что F также невычислима.

Возможность однозначного определения чисел и функций, которые теоретически невозможно вычислить — обстоятельство достаточно примечательное. Однако мы не будем рассматривать вытекающие отсюда следствия, поскольку можно легко видоизменить наши определения таким образом, чтобы F стала вычислимой. Например, мы можем установить очень большой конечный временной интервал выполнения программы на компьютере


Дополнительные сведения из теории информации

283

С. Если потребовать, чтобы любая программа, не укладывающаяся в этот интервал, немедленно печатала 0 и останавливалась, то обе функции L и F становятся формально вычислимыми, а наш анализ, приведенный в разделах 5.1, 5.2, 5.3, существенно не изменяется (мы лишь должны установить достаточно большой интервал времени, чтобы обеспечить возможность завершения программы вычисления М(Х).

Тем не менее, хотя при таком условии F становится теоретически вычислимой, время, необходимое для этого, столь велико, что рассчет становится практически невозможен. Поэтому можно спросить: в чем смысл рассмотрения F, если эта функция невычислима? Коротко можно ответить так: если удачно выбрать ограничения времени выполнения программы на С, можно написать достаточно простую программу для определения F (она не обязательно должна укладываться в наши временные ограничения). Эта программа содержит небольшое количество простых арифметических операций, повторяющихся циклически в соот- •ветствии с простым правилом. Теперь предположим, что подробное описание биологической формы имеет низкое информационное содержание. Тогда из теоремы 3 видно, что функция F может генерировать сменяющие друг друга разделы этого описания из последовательности строк w\,...,w„. Как уже говорилось в 5.2, таким образом могут быть созданы весьма сложные сегменты биологических описаний путем добавления незначительного количества информации в форме строк Wj.

Вопрос в следующем: может ли функция F, обладающая небольшим информационным содержанием, последовательно производить информацию, описывающую очень тонкое строение органов, -участвующих в сложных биологических процессах? Предположение, что F может сделать это, равнозначно предположению, что простым повторением простых арифметических операций, в течение достаточно долгого времени, можно воспроизвести любые сложные структуры, которые существуют в живых организмах. Более того, определенные строки битов wj} задающие направление процесса генерации, должны производить известные нам формы жизни, а не какие-либо иные. Это демонстрировало бы необыкновенное могущество элементарных арифметических операций. Хотя мы и не можем строго доказать, что F не обладает столь впечатляющими свойствами, мы все же


2 §4

Приложение 1

полагаем, что было бы весьма полезно рассмотреть следствия, вытекающие из допущения о том, что F их не имеет.


ПРИЛОЖЕНИЕ 2

Информационное содержание законов химии

Настоящее приложение посвящено обсуждению информационного содержания физических законов, обуславливающих как химические реакции, так и взаимодействие вещества с электромагнитным излучением. Особый интерес для нас представляют законы нерелятивистской квантовой механики, представленные на рис.1 в главе 5. Эти законы применяются к физической системе из M частиц с пространственными координатами Qi,..., QM. B качестве частиц рассматриваются электроны и различные виды атомных ядер. Мы будем считать, что частицы заключены в очень большом ящике, в котором присутствует излучение, характеризуемое параметрамиq„ (n = 1,2,3,...).

Выражение (а) на рис.1 представляет собой уравнение Шредингера, а символом Т обозначена волновая функция, определяющая состояние системы. Гамильтониан H в уравнении (б) записан в виде суммы членов, представляющих физические взаимодействия различных типов. Первый член описывает распространение электромагнитного излучения в пространстве. Второй член описывает кинетическую энергию частиц, два следующих — взаимодействие заряженных частиц с электромагнитным полем. Пятый член представляет взаимодействие электромагнитного поля и спина (магнитного момента) частицы. И наконец, шестой член уравнения описывает электростатическое и гравитационное взаимодействия частиц.

Для оценки информационного содержания физических законов мы разработали программу численного решения уравнения Шредингера с Гамильтонианом, представленным на рис.1. Разумеется, на реально существующих компьютерах эту программу выполнить невозможно, поскольку соответствующие вычисления даже для весьма малого числа частиц превышают возможности самых быстрых машин. Тем не менее было бы очень интересно посмотреть, как выглядят физические законы и их абстрактные определения в виде элементарных арифметических операций.

В приложении 1 мы определяли информационное содержание, пользуясь конкретным языком программирования, использующим 64-символьный алфавит, включающий в себя цифры 0,...,9,

286 Приложение 2

буквы A,...,Z, а также специальные символы, обозначающие операции

IF THEN GOTO FOR TO NEXT PRINT

Символы, их значения и синтаксические правила позаимствованы из языка программирования BASIC. Мы добавили еще несколько специальных символов — например INT, означающий операцию округления числа до меньшего целого. При помощи этих символов представляются элементарные операции языка, через которые определяются более сложные — например извлечение корня. (Полное описание применяемого нами языка приводится в книге Томпсона (Thompson, 1980).

Программа численного решения уравнения Шредингера записывается на этом языке при помощи 1738 символов, то есть занимает менее двух третей страницы. Помимо выполняемых операторов в программу придется включить таблицу физических констант — например, зарядов и масс различных атомных ядер. Если мы отведем для этих данных 1062 символа, то полная программа представления и решения квантово-механических уравнений увеличивается до размеров страницы и составляет 2800 символов.

При написании программы было сделано несколько предположений. Во-первых, мы подразумеваем, что ограничивающий физическую систему «ящик» удовлетворяет так называемым периодическим граничным условиям. Это дает возможность представлять электромагнитный векторный потенциал А в стандартной форме — в виде суммы членов А„, содержащих синусы и косинусы. Также предполагается, что ящик очень большой и частицы удерживаются силами гравитации в его центре (это можно обеспечить при помощи введения соответствующего гравитационного потенциала). Эти предположения в совокупности означают, что границы системы могут рассматриваться как бесконечный вакуум. Поскольку наша модель не предусматривает взаимодействия ядер, в нее должен быть введен источник тепла и света, то есть стационарный источник электромагнитного излучения.

Мы подразумеваем также, что спин электронов равен 1/2, а ядра лишены спина и, таким образом, рассматриваются в качестве точечных заряженных масс. Мы не вводим релятивистских поправок и ограничиваем действие закона Кулона 1/г расстоя-