БЕЛКОВЫЙ КОД          

 

Алгоритм распределения аминокислот в таблице генетического кода.

 

 

Последнее обновление 18 сентября 2008 г.

 


Оглавление                             Пожалуйста, Ваши отзывы!

  

*  Формирование L-олигопеп-

      тидов в грозовой туче.                                                                              

*  Кодон-аминокислотное

*  соответствие.

*  Правила отбора.

 Основной постулат.

*  Приложение.                 

                                                   

 

                                                                           «... необходимо класть в основу всего число.

                                                                                   Точно так же никто, не познав [числа],

                                                                                    никогда не сможет обрести истинного

                                                                                    мнения о справедливом, прекрасном,

                                                                                    благом и других подобных вещах и

                                                                                    расчислить это для себя и для того,

                                                                                    чтобы убедить другого».

                                                                                                                                       ПЛАТОН

 

А. В. Керимбеков

(г. Ставрополь)

 

 

     Аннотация.

   В  работе http://ak-codon.narod.ru предложены  правила отбора для генетического кода, основанные на свойствах символьной последовательности и стереохимических параметрах аминокислот и кодонов.  На основании новой формы записи таблицы кодон – аминокислотного соответствия установлен алгоритм кодирования аминокислот. Суть алгоритма в поочерёдном применении оптимальной симметричной стратегии заполнения кодовой таблицы объектами четырёх групп аминокислот, отличающихся числом (СН)2-групп в радикале. Постулируется соотношение между разностями массовых чисел ядер и радикалов аминокислот, отличающихся значением вырожденности.  Это соотношение есть проявление «ЗОЛОТОГО СЕЧЕНИЯ» в генетическом коде.

 

----------------------------------------------------------------------------------------------

Формирование L-олигопептидов .

 

    Вопрос о происхождении Жизни начинается, следуя биологической логике, с выбора простейших молекул аминокислот, способных сохраниться и взаимодействовать в L-форме. «Ключевая» молекула – СЕРИН – обоснована ранее на сайте: http://gypoteza.narod.ru  В последнее время  не подвергается сомнению образование в модифицированных экспериментах по схеме  Миллера простейших сахаров и азотистых циклов ( аденин и гуанин ), не говоря уже об аминокислотах.

  На этом же сайте показано, что внешний асимметричный физический фактор, возникает при разряде молнии и действует на движущиеся молекулы. В этих условиях  квазицикл   L-серина сохраняется, а квазицикл D-серина разрушается, что приводит к блокированию процесса рацемизации. Ранее В.А. Гусевым предложена и обоснована модель образования полимерных цепочек аминокислот (АК) в каплях грозового облака (1). Динамика синтезированных простейших молекул АК такова: «Молекулы, обладающие собственным дипольным моментом, будут втягиваться в центральную зону капли из-за неоднородности центрально-симметричного поля ленгмюровских протонов» - цитата из работы (1).  В поле  сгустка протонов молекулы выстроятся в цепочки. Энергии протонов, совершающих колебания в электромагнитном поле молнии, оказывается достаточной для активации гомогенных химических реакций, в частности, для активации СОО¯-групп АК. Происходит ковалентная сшивка молекул АК с образованием пептидных связей. В итоге за несколько микросекунд возможно образование олигомеров до нескольких десятков АК, ориентированных вдоль радиусов капли.

   Среди простейших АК  равновероятно образование  и  ключевой молекулы серина, который вступат в процесс сополимеризации в L-форме и инициирует именно  LL-сополимеризацию. В каплях при LL-сополимеризации  ковалентной сшивке АК способствует ориентация дипольных моментов.

   На капли, находящиеся на расстоянии, например, 1 метр от канала молнии, электромагнитное поле начинает действовать через 3*10^-9 секунды. Эти же капли придут в движение только через ~ 10^-3 секунды и уже будут содержать органические молекулы. Канал молнии формируется примерно тридцатью разрядами за время ~ 10^-4 с и на движущуюся каплю подействует магнитное поле второго и всех последующих из 30 разрядов одной  молнии. Тогда только следующий ЭМ-импульс, действуя на летящую каплю, переведёт  серин в L-форму и встроит его в цепочку.

 

 

Возврат в начало

Кодон-аминокислотное соответствие.  Преобразование в круговую таблицу.

(ГЕНЕТИЧЕСКИЙ КОД И «КРЕСТИКИ-НОЛИКИ»)

 

   Распределение квадруплетов в квадратной таблице Генетического кода (ГК) можно получить в игре «КРЕСТИКИ-НОЛИКИ» (Tic Tac Toe) на доске 4 х 4. Правила таковы: каждый игрок выбирает «осторожную» симметричную стратегию с целью пометить максимальное число клеток и выиграть на последнем или предпоследнем ходе.  Игра начинается с любой клетки, но желаемый результат получают, начиная с угла. Противник делает симметричный относительно центра таблицы ход, а партнёр отвечает ходом на соседнюю  клетку по часовой стрелке. (Если пронумеровать таблицу слева направо, то сумма номеров клеток двух последовательных ходов всегда равна 17). Какая-либо иная стратегия приводит или к преждевременному выигрышу, или к ничьей. Аналогично при начале из не угловых клеток.  Последовательность ходов расположим в концентрических кругах против часовой стрелки, начиная с квадруплета UG, как показано на рисунках 2, 3 и 4.

 

   Поиграйте, посмотрите:    http://www.be300.ru/soft/data/11173/Zxan_ToeTacTic_v105.zip

 (Пример партии «КРЕСТИКИ-НОЛИКИ» см. в приложении к этой работе).

 

Рис. 1.

 

    

Рис. 2 и 3.

 

Рис.4.

   Рассмотренный вариант игры применим к стандартной таблице квадруплетов совремённой версии ГК. На рисунках показана последовательность ходов при начале из квадруплета UG. В соответствии с распределением энергий квадруплетов (http://ak-codon.narod.ru) условимся, что первый игрок (начинающий из позиции UG) «метит» квадруплеты  средним значением энергии 66 – бирюзовым и зелёным, а его партнёр – средним значением 41 - жёлтым. Тогда энергии квадруплетов UU, UA, UG, CA, AU, AA, AG, GA (бирюзовые и зелёные) будут примерно в 1.6 раза больше, чем энергии UC, CU, CC, CG, AC, GU, GC, GG.

 

âââ          Таким образом, в игре с оптимальными симметричными стратегиями   происходит сортировка квадруплетов по свойствам, соответствующая совремённой версии ГК (Рис. 3).

 

 

      

Возврат в начало

 

Основной постулат в ряду протеиногенных аминокислот.

ПРАВИЛА ОТБОРА.

 

Обозначим суммарные молекулярные массы ( на рисунке  2  внешний круг закрашен бирюзовым и зелёным, внутренний – жёлтым):

радикалов АК внешнего круга через R(2),

ядер АК внешнего круга через Я(2),

радикалов АК внутреннего круга через R(1),

ядер АК внутреннего круга через Я(1).

 

ПОСТУЛАТ.

 

âââ   Отношение разности молекулярных масс радикалов АК с вырожденностью кода 2 и 4 к разности соответствующих молекулярных масс ядер (пептидных группировок) равно отношению чисел этих АК. Это формулировка постулата в общем виде.

 

  {R(2) – R(1)}/{Я(2) – Я(1)} = N(2)/N(1) = 3/2..

 

   Основанием для постулата  послужили следующие, скорее структурные, соответствия АК и азотистых оснований кодонов:

  1. «Управляющая» функция СН2-групп радикалов АК определяет разделение АК на два семейства.

Семейство компактных АК с вырожденностью кода 4 = 2 + 2 и 6 = 4 + 2. Это G, A, S, P, V, T, L и, стоящий особняком, R. Восемь АК.

Семейство с вырожденностью кода 2 (также 3 и 1): F, Y, C, W, H, Q, I, M, N, K, D, E. и в это же семейство включены, как имеющие дополнительную вырожденность  2, аминокислоты L, S, R. Пятнадцать АК.

  1. Построение кругового Генетического кода (новой формы) позволяет графически выделить семейства. Так, в центральном круге оказываются компактные АК с вырожденностью кода 4 и 6, во внешнем – с вырожденностью 2 (также 3 и 1).
  2. Компактные АК оказываются в квадруплетах с азотистыми основаниями, имеющими минимальное значение внутренней энергии.

  

Тогда на основании приведённых фактических данных можно предложить следующее:

 

âââ   отношение разности молекулярных масс радикалов АК с вырожденностью кода 2 и 4 к разности соответствующих молекулярных масс ядер (пептидных группировок) равно отношению чисел этих АК. Это формулировка постулата в общем виде.

 

  {R(2) – R(1)}/{Я(2) – Я(1)} = N(2)/N(1) = 3/2.

 

 Из этого соотношения получается система трёх уравнений, показанных  ниже.

   Последующие арифметические свойства групп  аминокислот (АК) в таблице Генкода (ГК) приобретают больший смысл и наглядность при использовании таблицы ГК в круговой форме, предложенной мной ранее  http://ak-codon.narod.ru/

Белки содержат компактные АК: G, A, S, P, T, V, L. Предварительно примем вырожденность всех 20-и АК равной двум. Тогда при такой однородной вырожденности каждая АК «займёт» два полуквадруплета.

   Образуем некоторый параметр m следующим образом: определим суммарную молекулярную массу семи компактных АК (G, A, S, P, T, L, V) в семи полуквадруплетах.

 С учётом половинной массы ядра значение параметра определим как m = 37*7 = 259.  Это приведённая суммарная молекулярная масса компактных АК.

 

 Из основного постулата следует:

 

R(2) – R(1) = 3m,

Я(2) – Я(1) = 2m,

Я(1) – R(1) = 1m.

 

    Последовательно получим соотношения:

Я(2) = R(2).

Так как Я(1) = 74*8 = 592, то для Я(2) получим значение 1110 и для R(1) так же 1110.

 

Для восьми АК внутреннего (жёлтого) круга Я(1) = 74*8 = 592 и с учётом значения m = 259 получим для R(1) из третьего уравнения системы

R(1) = 333.

Предлагаемый постулат позволяет вычислить наблюдаемые в таблице ГК молекулярные массы групп АК, используя только числовое значение молекулярной массы ядра (пептидной группировки m = 74) и число компактных АК  n = 7.  R(1) = 333, R(2) = 1110, Я(1) = 592 и Я(2) = 1110* соответствуют значениям совремённой версии Генкода.  Более того, молекулярная масса ядер АК внешнего круга определяет число кодирующих позиций (пар кодонов):  1110/74 = 15. Из 16 полуквадруплетов занятыми АК оказываются только 15, а одна позиция вакантна. Это некодирующая пара кодонов – известный «stop».

   Основной постулат можно условиться считать седьмым правилом отбора.

 

 

ПРАВИЛА ОТБОРА:

  

ПЕРВОЕ ПРАВИЛО ОТБОРА:

При триплетном кодировании  четырёхбуквенной символьной последовательностью таблица этих символов «выделяет» из множества максимум 24 объекта и сортирует их по размерам с различной вырожденностью кода в отношении один к двум (m/n = ½).

================================================================================= 

 

ВТОРОЕ ПРАВИЛО ОТБОРА:

Подчиняясь единому универсальному алгоритму кодирования ( старт запись стоп старт чтение стоп ), четырёхбуквенная последовательность азотистых оснований кодирует 20 протеиногенных аминокислот и распределяет их по квадруплетам с высокой и низкой энергией.

Квадруплетами с низкой внутренней энергией кодируются 8 «компактных» АК с радикалом, расположенным над ядром молекулы.

 =================================================================================

 

Третье правило отбора:

Положение аминокислоты в квадруплете определяется количеством СН2-групп в аминокислотном остатке (радикале) то есть, длиной цепочки, соединяющей функциональную часть радикала с основанием молекулы (ядром). Аминокислоты C,J,N,D,H,F,Y кодируются верхними парами кодонов типа XYU, XYC; аминокислоты Q,K,E,M,W – нижними, типа XYA, XYG.

=============================================================================== 

 

ЧЕТВЁРТОЕ ПРАВИЛО ОТБОРА.

Молекулы Серина (S), Лейцина (L) и Аргинина (R) принадлежат к группе АК с вырожденностью кода 4, но имеют цепочки из СН2-групп.Так как Серин содержит одну СН2-группу, то он может дополнительно кодироваться верхней парой кодонов. Аргинин содержит две СН2-группы и дополнительно может кодироваться нижней парой кодонов. Лейцин, в дполнение  к СН2-группе, имеет в цепочке ещё и группу СН и, поэтому, дополнительно кодируется нижней парой кодонов.

===================================================================

 

 

ШЕСТОЕ ПРАВИЛО ОТБОРА.

  

Расположим функциональные группы радикалов АК (аминокислотных остатков) в соответствующих аминокислотам позициях таблицы Генетического кода (Таблица 3). В таблице синими буквами обозначены нуклеотиды, красными – аминокислоты. Для АК Гистидина (Н), Триптофана (W), Аргинина (R) и Серина (S) показаны двойные и полуторные связи циклов, гетероциклов и квазицикла. Как показано выше, верхним парам кодонов соответствуют аминокислоты с одной группой СН2, нижним – с двумя и более группами СН2.

   Отметим предварительно, что Серин (S), Треонин (T) и Глютаминовая кислота (E)  имеют конформеры с внутримолекулярной водородной связью (прогр. HyperChem 5).

 

Таблица 3.

 

   Анализ таблицы приводит к следующим её особенностям:

 

1.                  Нуклеотиду U во втором положении кодонов XUZ (первый столбец квадруплетов)   соответствуют АК с двумя группами СН3 у функциональной части радикала,  Метионин (M) (-SCH3) и Фенилаланин (F).         Квадруплеты UU, CU, AU, GU.

 

2.                 Этому же нуклеотиду U в первом положении кодонов UYZ (первая строка квадруплетов) соответствуют АК с группами OH, -SH и АК с циклами, сдержащими систему сопряженных связей ( Фенилаланин, Тирозин, Триптофан, и квазицикл Серина ).      Квадруплеты UU, UC, UA, UG.

 

 

3.                 Кодоны квадруплета UU, находящегося на пересечении первых столбца и строки таблицы, соответствуют АК-м, отвечающим условиям строки и столбца – Фенилаланину и Лейцину.

 

4.                  Нуклеотиду С во втором положении кодонов XCZ ( часть второго столбца квадруплетов после Пролина) соответствуют АК  с группами –ОН , -СН3 и «копромисная» молекула Пролин. У конформера Треонина –ОН группа блокирована водородной связью; активна, следовательно, группа СН3. Он, как и Аланин расположен во втором столбце таблицы.        Квадруплеты  CC, AC, GC.

 

 

5.                Нуклеотиду С в первом положении кодонов CYZ (часть второй строки квадруплетов после Пролина) соответствуют АК со связями C=C-,  -C=N-.   «Копромисный» Пролин  - нечто среднее между алифатическими АК и аминокислотами, содержащими двойные и полуторные связи между углеродом и азотом. Расположена эта молекула, соответственно, на пересечении второго столбца и второй строки в квадруплете СС.         Квадруплеты  CC, CA, CG.

 

6.                 Нуклеотиду А, как в первом, так и во втором положении кодонов XYZ (AYZ, XAZ), соответствуют АК с двойными и полуторными связями между атомами углерода, азота и кислорода в функциональных окончаниях радикалов.           Квадруплеты GA, AA, AG.

 

 

7.                 Квадруплет GG, кодирующий Глицин, находится, как и остальные диагональные, в особом положении.         Квадруплеты UU, CC, AA, GG.

 

 Эти 7 частных детерминант и составляют вариант шестого правила.

=============================================================

СЕДЬМОЕ ПРАВИЛО ОТБОРА:

 разности суммарных массовых чисел радикалов и ядер АК с вырожденностью 2 и АК с вырожденностью 4 = 2 + 2 кратны приведённой суммарной молекулярной массе компактных аминокислот.

 

==============================================================================

    Автор признателен доктору В.А. Гусеву (Институт математики им. Соболева СО РАН, г. Новосибирск) за интерес к работе, полезные рекомендации и замечания.

 

Благодарю проф. А.В.  Маркова  за размещение ссылок на мои электронные публикации на  сайте http://macroevolution.narod.ru/

 

Возврат в начало

 

ПРИЛОЖЕНИЕ.

 

   В сообщении на форуме (http://molbiol.ru/forums/index.php?showtopic=153513) я предположил, что распределение АК по таблице Генетического Кода определяется ориентацией функциональной части радикала АК относительно второго нуклеотида:

   «L-аминокислоты встраиваются группой СОО`   между положительно заряженными гетероциклами соседних нуклеотидов так, что радикал ориентирован в сторону второго нуклеотида (Рис. 5). В случае D-аминокислот радикал ориентирован в сторону первого нуклеотида. Код для L-аминокислот и D-сахаров - LD-код, для D-АК L-сахарофосфатная цепь и, соответственно DL-код.
Эта гипотеза объясняет и роль
СН2-групп, и роль второго нуклеотида и, похоже, модель (таблицу 3)  в целом.»

  Ориентация радикала АК относительно второго нуклеотида уникальна для каждой пары АК – кодон. Обеспечивается это взаимодействием зарядов функциональных частей радикалов аминокислот и кодонов. Так в первом столбце таблицы ГК расположатся молекулы Лейцина, Изолейцина и Валина, так как их положительно заряженная «вилка» СН3-групп фиксируется парой отрицательно заряженных кислородов нуклеотида U. Электростатическое взаимодействие групп СН3 и ОН аминокислот второго столбца с группами С=О и NH2 нуклеотида С определяет положение Серина, Пролина, Треонина и Аланина. Это условие является дополнительным к основному, требующему соответствия малых (компактных) АК кодонам с малой энергией.

 

Пример партии «КРЕСТИКИ-НОЛИКИ».

 

 

 

А.А.Ляпунов:  Жизнь - «высокоустойчивое состояние вещества, использующее для выработки сохраняющих реакций информацию, кодируемую состояниями отдельных молекул».

(См. доклад А. А. Ляпунова «Об управляющих системах живой природы и общем понимании жизненных процессов» — М., 1962.)»

 

 

²²²

 

ЛИТЕРАТУРА.

 

1.   В.А. Гусев,  Доклады РАН, v. 385, №3, 2002

            В.А. Гусев, Биофизика, т. 46, вып. 5, 2001

      *   Значения 333, 592, 1110 получены ранее В.И. Щербаком, как частный случай постулата.

 

Возврат в начало

 


    © Copyright. Керимбеков А. В., 15 марта 2006 г. Ссылки обязательны.

 Последнее обновление: 18 сентября 2008 г.