Файл: Томпсон. Механистическая и немеханистическая наука. Исследование природы сознания и формы.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 29.06.2024
Просмотров: 512
Скачиваний: 0
140 |
Глава 5 |
скольку молекулярный вес ДНК бактерии Е. coll около 2,5 х 109, то генетический код данного организма составляют примерно 1,3 х 106 троек элементов. Поскольку каждая тройка может при-
нимать одно из двадцати одного значения (двадцать аминокислот плюс код окончания цепочки), то верхний предел содержания генетической информации в бактерии E. coli достигает
1,3 х 106 х log2 21, то есть около 5,5 х 106 бит. (Приводимые в
данном разделе вычисления производятся с учетом нескольких значащих цифр, а затем округляются).
При этом бактерия E. coli — очень простой организм. В клетках высших растений и животных обнаружено гораздо больше молекул ДНК. Результаты исследований показали, что клетки млекопитающих содержат примерно в 800 раз больше ДНК, что дает верхний предел содержания генетической информации по-
рядка 4,4 х 109 бит15. Чтобы представить себе, сколь велико это
число, оценим количество страниц, которое потребовалось бы для полной записи такого генетического кода. Страница обычной книги состоит из 40 строк по 70 символов в строке. Это дает
1,7 х 104 бит на страницу, если мы пользуемся алфавитом из 64 букв (поскольку log2 64 = 6, для записи одной буквы требуется 6
бит). При таких условиях для записи кода клетки E. coli нам потребовалось бы 330 страниц, а клетки млекопитающего — 264000 страниц.
Одной из аксиом биологии (так называемой основной аксиомой) является утверждение о том, что ДНК содержит всю необходимую для описания клетки информацию и что эта закодированная информация изменяется только путем случайных мутаций. Разумеется, ДНК не может сама по себе создать клетку из неорганизованных компонент, так что в клетках должна содержаться некая информация, не входящая в код ДНК. К тому же недавнее открытие обратной транскрипции свидетельствует о возможности передачи информации к ДНК от других молекул клетки16.
Тем не менее количество ДНК в клетках дает нам определенное представление о количестве информации, требуемой для их адекватного описания. В соответствии с основной аксиомой приведенные нами цифры определяют верхний предел информационного содержания клетки. Попробуем произвести разумную
Теория информации и самоорганизация материи |
J 41 |
оценку нижнего предела. Для этого нам придется рассмотреть разнообразие и сложность составляющих клетку структур. Поскольку некоторые гены хромосом млекопитающих представляют собой копии друг друга, становится ясно, что общее информационное содержание генов клеток таких организмов должно быть меньше, чем рассчитанное через полное содержание ДНК. Подобный же вывод можно сделать на основании мнения некоторых биологов о том, что хромосомы высших организмов содержат немало случайной, нефункциональной информации17.
Тем не менее, основываясь на сложности видимых под микроскопом структур клеток позвоночных, Уотсон делает вывод о том, что они содержат «по меньшей мере в 20-50 раз больше разновидностей белковых молекул, нежели клетка Е. со//»18. Если учесть 330страничное описание для бактерии, то для записи информации клетки позвоночного нам потребовалось бы от 6600
до 16 500 страниц. Это соответствует от 1,1 до 2,8 х 108 бит, то
есть от 84 000 до 210 000 белков, каждый из которых содержит в среднем 300 аминокислот.
Для оценки нижнего предела генетической информативности содержимого клеток попробуем определить, сколько информации может быть распределено среди белковых молекул типичной клетки млекопитающего. Исходя из упоминавшихся выше цифр нижний предел количества различных белков в такой клетке составляет 2000 х 20 = 40000. Состоящий из 300 аминокислот белок можно описать строкой из 1297 бит, или двоичных чисел «О» и «1». Поскольку размеры белков могут варьироваться, выделим для каждого из них строку в 10000 бит. Обозначим строки в виде Yi.....,YN, где N = 40000. Мы можем сцепить Yi,....,YN вместе, образовав тем самым длинную строку X, состоящую из
4 х 108 бит, а для каждого целого n - 1,К , N образовать строку Х„ промежуточной длины, сцепив Yi,....,Y„.
142 |
Глава 5 |
Fi |
K |
IS |
К |
К |
Рис.3. Структура строки битов Л', представляющей последовательности аминокислот белков типичной клетки млекопитающего.
Информационное содержание X может быть аппроксимировано сложением информативности блоков Y„, на которые разбита X. Эту операцию можно пояснить следующим образом. Пусть имеется специальная математическая функция F, называемая генератором. При помощи этой функции можно вычислить
Y\,....,Yfi по формуле |
|
Yn=F(wn,Xn_,), |
(11) |
где n пробегает значения 1.. JV, a w\,...,w„ — надлежащим образом выбранные битовые строки. (В данном случае мы полагаем
Х0=1, так что формула применима и при n = 1. Используемые
здесь математические термины и формулы разъясняются в приложении 1, а здесь мы даем лишь краткое описание).
Смысл формулы — вычислить Y\ через w\, затем — Y2 через W2 при Y\ = Xl. В общем, каждое Y„ вычисляется через w„ и опре-
деленные ранее Yk. Каждая строка w„ представляет информацию, необходимую для указания Y„ при условии, что все Y\.....,Yr\ известны.
Строки wn |
связаны с полным информационным содержанием |
|
ЦХ) через неравенство |
|
|
|
ОД * ECK)-1), |
(12) |
|
/1=1 |
|
где l(w„) — число битов в строке w„. Данное неравенство свидетельствует о том, что информационное содержание X не меньше, чем общее количество информации, вводимое при последовательном построении А" из Y\.....,YN.
Теория информации и самоорганизация материи |
j 43 |
Предположим, что ЦАО<6х105 бит. Неравенство (12) можно переписать в виде
1 + ^jp- > среднее /(WJ . |
(13) |
|
-Л/ |
п=1,К,ЛГ |
|
Подставив вместо L(X) значение 6 х 105, а вместо N — 4 х Ю4, мы находим, что среднее значение l(w„) не превышает 16 бит. Это означает, что типичный блок Y„ можно непосредственно вычислить из Х„-1, используя не более 16 бит информации.
Пусть Y„ представляет белковую молекулу, состоящую в среднем из 300 аминокислот, а для прямого описания аминокислотной последовательности в данном белке требуется 1297 бит. Разумеется, для описания некоторых аминокислотных последовательностей может потребоваться намного меньше информации. Например, если белок состоит из 10 аминокислот, повторенных 30 раз, то для описания белка хватит 43 бит. Однако аминокислотные последовательности реальных белков, по-видимому, не подчиняются простым правилам, поэтому вряд ли для их создания хватило бы столь незначительного количества информации.
Мы можем получить некоторое представление о структуре белков, рассмотрев их роль в метаболизме клеток. В настоящее время способ функционирования белков недостаточно ясен, но тем не менее известно, что они представляют собой крошечные устройства обработки информации. Вот пример, практически наугад взятый из работы Уотсона19: "В клетке E. coli осуществляется последовательность химических реакций преобразования треонина в изолеуцин, причем каждая из пяти ступеней данного процесса осуществляется в присутствии своего катализатора — энзима, или белковой макромолекулы. Первая ступень последовательности происходит только в присутствии энзима треонина деминазы. Как только достигается значительная концентрация конечного продукта, изолеуцина, он воздействует на треонин деминазы таким образом, что тот более не способствует ходу первой ступени реакции, тем самым препятствуя образованию изолеуцина в количествах, превышающих потребности клетки. Отметим, что всякий энзим обладает структурой, позволяющей ему выступать в качестве катализатора лишь нескольких конкретных реакций. Энзимы известны своей способностью ускорять в миллионы раз определенные химические реакции, совершенно не влияя на скорость других реакций. Отметим также, что
144 Глава 5
образование треонина деминазы останавливается по достижении определенной его концентрации именно изолеуцином, а не ка- ким-либо иным веществом, присутствующим в клетке (иначе система бы оказалась бы неработоспособной)".
Специалисты по молекулярной биологии считают, что многие аминокислоты энзимов образуют особые группы, распознающие определенные молекулы клетки, точно так же, как всякому замку соответствует свой ключ. Энзим устроен таким образом, что его свойства изменяются в ходе взаимодействия с молекулами, что позволяет ему выступать в роли логического элемента функционирования клетки. В соответствии с данной концепцией энзим можно сравнить с подпрограммой сложной компьютерной программы, а составляющие его аминокислоты — с элементарными операторами, образующими логическую цепь.
Если мы учтем, что 16 бит недостаточно даже для описания произвольной последовательности четырех аминокислот, мы придем к выводу, что большинство энзимов не могут быть определены таким малым количеством информации. Однако если один энзим очень похож на какой-либо другой, его структуру можно описать, указав незначительные модификации, приводящие к образованию его структуры из структуры второго энзима. Таким образом, мы можем вычислить Y„ одного энзима через ¥„• другого и небольшое количество дополнительной информации. Однако, исследуя структуру и деятельность клетки, мы обнаруживаем, что она содержит множество самых различных, непохожих друг на друга энзимов. Нет никаких оснований полагать, что их структуры можно получать друг из друга путем систематических трансформаций, для описания каждой из которых было бы достаточно 16 бит дополнительной информации.
Также нет никаких оснований считать, будто бы функция-ге- нератор F обладает уникальными свойствами, позволяющими ей порождать аминокислотные последовательности протеинов. В конце концов, F определяется простыми математическими выражениями, не имеющими никакого отношения к живым организмам (определение функции Сдается в приложении 1).
Таким образом, мы, по-видимому, были не правы, определив информационное содержание L(X) белков млекопитающих менее
чем в 6 х Ю5 бит. Итак, мы предлагаем в качестве нижнего предела взять именно это число: