Эволюция: образование современных форм геномов

FIG 9.Пример поведения K(N)/ K(n), где K(N)/ K(n) — ось ординат от размеров мультиплетов.
Ось абсцис — N — размер мультиплетов.

ЭВОЛЮЦИЯ
образование современных форм геномов

ВВЕДЕНИЕ
В этой работе проведен анализ последовательности процесса роста полимерных структур про-ДНК-РНК. В результате сделано заключение об ее первичной организации — как бинарной системы.

ОБЩАЯ ЧАСТЬ
На начальной стадии развития живой материи на Земле происходил рост полимерных структур из смеси мономеров пронуклеотидов. Естественно принять , что синтез последовательностей из нуклеиновых оснований на этой стадии описывался обычным кинетическим уравнением . Закон этого роста можно описать с помощью гипотетического уравнения (1) полимеризации :

(1) a*A + b*B + c*C = AaBbCc ...
Тогда скорость полимеризации представится следующим образом :

(2) V = K*[A]^a * [B]^b * [C]^c ...
Где : V – скорость роста полимерной цепи из мономеров видов — A, B, C.. ;
K – коэффициент ;
[A], [B], [C]...- соответствующие концентрации ;
a, b, c... — коэффициенты.
Ясно , что нас интересует разница в скоростях роста в естественных условиях , когда концентрации оснований произвольны. Для того чтобы исследовать поведение реакции полимеризации в этих случаях возможно принять следующие допущения :
[A] = [B] = [C] .. = [S] и 

a = b = c .. = i/N (здесь" N" — число пронуклеодитов)
тогда :
(3) V(N) = K*[S]^i ;
Где :
[S] = гипотетическая средняя концентрация мономеров ;
N = число видов нуклеиновых оснований ;
i = длинна про-ДНК-РНК полимера
Когда одна из концентраций будет существенно меньше других ( например , примем – 0.5 * S ) , тогда получим :
для : N(2)=2 и  N(4)=4 , когда [S] = 1 при длинне ДНК-РНК = 100 оснований .
Если одна концентрация будет : [C]=[0,5*S] , получим :
R2/4= V(2)/V(4)= K*[S]^100 / ( [S]^75 * [0,5*S]^25 } = (1 / 0,5)^25
Где :
R2/4- отношение скоростей полимеризации : для N(2)=2 и N(4)=4 .
Тогда :
R2/4 = (1 / 0,5)^25 ~ 3,3 * 10^7
Если данная концентрация будет меньше других ( например 50% [0.5*S] от других ) отношение скоростей полимеризации при прочих равных условиях будет ~ 3.3 * 10^7 как было бы , например , при вариантах ` `A`+` T ` и  `A`+` T ` + ` C `+` G ` или на семь порядков меньше .Таким образом , практичeски не были бы воспроизведены пары , как в нашем случае `C` +`G` . Принимая во внимание трудности связанные с естественным синтезом и стабильностью`C` , сделанное предположение является правдоподобным , в предположении естественного происхождения `C` . Таким образом ясно , что скорость полимеризации в случае первичной модели будет на 7 порядков больше , так что необходимо принять что первичные ( архаичные ) полимерные проДНК-РНК структуры — будут бинарными комплементарными системами . Здесь возникает одно ` НО ` — мера архаичности ? Автор не считает , что простейшие (микробы) обязательно архаичны , более того , большинство из них новейшие простейшие . Статистический анализ было бы логично делать не на основе отношений `A`+`T`/`C`+`G` , а по длинне мултиплетов (A..),(T..),(C..),(G..)(A/T..),(C/G..) — например :АААААА. — А(6) – мультиплет .

( можно принять более общий способ доказательства: Введём критерий «Н» = V(N)/ V(N+1) , учтём , что i= const, получим, что при уменьшении активности одного пронуклеотида [Sk] от общих [S] — мы будем иметь Н = 1/ ([Sk}^(i/N)). Ввиду того что [S] и [Sk]- всегда меньше 1 -(точнее — много меньше 1) — то скорость реакции будет наибольшей при минимальном «N» .)

p1

Так что , там где статистический смысл последовательностей начинает исчезать и возможно с высокой вероятностью считать их рудиментами . С другой стороны , в результате полиморфизма изофункциональных кластеров ДНК , структура также несет в себе ее историю происхождения и глубину эволюции кластеров , геномов . Ясно , что эволюционно , последующее появление еще одной пары : ` C`-`G` , позволило увеличить информационную емкость проДНК-РНК при той же термодинамической устойчивой длинне . С точки зрения последующей трансформации РНК , неоходимо признать , что эволюция нашла еще один способ `уплотнить ` ДНК информацию. B отдельных геномах до 2-4 размера мультиплетов , будет `чувствоваться` старая ДНК ( как `платформы` ) на которой шли активные мутационные процессы . Но это стало возможным с появлением ` собственного ` производства `- ` C` и `G `.

СРАВНЕНИЕ МУЛЬТИПЛЕТОВ ГЕНОМОВ

FIG.1 СОВРЕМЕННыЙ (геном) A- E.Coli genome 0157-H7 , B- Encephalitozoon cuniculi Chr 4 , C — Giardia lamblia Chr 1 .
FIG.2 НОВыЙ тип I – A- Condida Chr J , B- Saccharomyces cerevisiae Chr 2 , C-Yarrowia lipolica Chr f
FIG.3 НОВыЙ тип I , B- Trypanosoma brucei Chr 2 ,C- Plasmodium falciparum Chr 6 .
Везде: Ось ординат Ln(n) -число мультиплетов , Ось абсцис — N -размер мультиплетов


FIG.1 СОВРЕМЕННыЙ (геном) A- E.Coli genome 0157-H7 , B- Encephalitozoon cuniculi Chr 4 , C — Giardia lamblia Chr 1 .
FIG.2 НОВыЙ тип I – A- Condida Chr J , B- Saccharomyces cerevisiae Chr 2 , C-Yarrowia lipolica Chr f
FIG.3 НОВыЙ тип I , B- Trypanosoma brucei Chr 2 ,C- Plasmodium falciparum Chr 6 .
Везде: Ось ординат Ln(n) -число мультиплетов , Ось абсцис — N -размер мультиплетов


FIG.1 СОВРЕМЕННыЙ (геном) A- E.Coli genome 0157-H7 , B- Encephalitozoon cuniculi Chr 4 , C — Giardia lamblia Chr 1 .
FIG.2 НОВыЙ тип I – A- Condida Chr J , B- Saccharomyces cerevisiae Chr 2 , C-Yarrowia lipolica Chr f
FIG.3 НОВыЙ тип I , B- Trypanosoma brucei Chr 2 ,C- Plasmodium falciparum Chr 6 .
Везде: Ось ординат Ln(n) -число мультиплетов , Ось абсцис — N -размер мультиплетов


FIG 5 – Fugu cluster .
FIG.5 НОВыЙ тип I , B- Homo Sapiens Chr 7 , C- Mouse Chr 4 .
FIG.6 Drosophila melanogaster – Chr 2L, 2R , 3L , 3L , X , 4
FIG.7 –Примеры апрокимация для вычисления распадов мультиплетов (для таблицы1,2) .


FIG 5 – Fugu cluster .
FIG.5 НОВыЙ тип I , B- Homo Sapiens Chr 7 , C- Mouse Chr 4 .
FIG.6 Drosophila melanogaster – Chr 2L, 2R , 3L , 3L , X , 4
FIG.7 –Примеры апрокимация для вычисления распадов мультиплетов (для таблицы1,2) .


Таким образом, предлагается модель развития первичных живых матриц PAM ( Primary Alive Matrix ) где : `AT `-матрица была основной и древнейшей. Сохранены и биохимические: START -`AUU` и  STOP -`UAA` кодоны . Матрица `CG` — появляется позже , когда появляется биохимический синтез этих нуклеиновых оснований . Очевидно , что когда этот синтез появился, `C` и `G ` – начали замещать `A и T `- генетический материал. `CG` — матрица входила в древний геном сначала как несущественная ошибка .И наиболее древние копировали ее чисто механически. Но , когда источник – биохимические циклы синтеза `C` и `G` появились , их присутствие уже не лимитировало ( как другие ошибки ) развитие и самовоспроизводство. И новая пара нуклеиновых оснований нашла свое место в эволюции . Ясно , что мы находимся далеко от этой удивительной эпохи – БИНАРНОЙ ЖИЗНИ . С другой стороны , мы можем наблюдать сложные эволюционные процессы :
1. Распад `AT ` платформ ,
2. Замещение `AT ` платформ — `CG ` платформами .
3. Вырождение `AT ` — платформ .
4. Вырождение `CG ` — платформ .
Распад матриц мы можем определить из следующих соображений :
Примем : Скорость распада мультиплета размера (N) — зависит от его связанности с геномом :
(4) dN / dt = F(N)
Где: N – размер мультиплета .
F(N) — функция зависящая от `N` размера мультиплета и его `связанности` с геномом .
t — `нормализованное` время .
Скорость распада количества мультиплетов — (n) , пропорциональна их количеству :
(5) dn(N) / dt = Kn * n(N)
Где: n(N) – количество мультиплетов с `N` – размерами
Kn – коэффициент .
Используя уравнения (4) and (5) (избавляясь от неизвестного нам времени) получаем :
(6) dN = F(N) * dn/(( Kn )* n(N) )
Функция F(N) – зависит от степени участия мультиплетов в жизненно-важных кластерах : как `ключей ` , ` инициирующих последовательностей` и других знаков в `грамматике` генома . Можно ожидать три простейших случая :
(7) а) F(N) = KN* N — когда мультиплеты размера -`N` не связаны своим размером с функциями геномома ;
Где: KN – Коэффициент характеризующий связь мультиплетов `N` – размера с геномом ( связь слабая ) ;
б) F(N) = KN – когда мультиплеты `N` – размера связаны своими кодирующими свойствами с геномом ;
в) F(N) = KN / N — когда мультиплеты размера `N` сильно связаны своим размером с функциями геномома и их приемлимая для генома мутация пропорциональна их размеру ;
Соответственно получаем основные зависимости `N` от` n(N)` :
(8) для 7 а Ln ( Ni/Nk ) = K1 * Ln ( n(Ni) / n(Nk) )
(9) для 7 б Ni -Nk = K1 * Ln (n(Ni) / n(Nk) )
(10) для 7 в Ni^2 -Nk^2 = K1 * Ln (n(Ni) / n(Nk) )
Где : К1 = KN / Kn



FIG.8 – СОВРЕМЕННыЙ -S — Leishmania major (а) , Leishmania infanta (б) , Tularemia (c ) .
Table 1,2 – Расчитанные коэффициенты ’K1’ – для различнъх участков графиков геномов. Вычисления производились по формуле : Ni -Nk = K1 * Ln (n(Ni) / n(Nk) ) .

p2

Можно ожидать , что разные размеры и виды мультиплетов будут находиться в различной зависимости от генома и ,соответственно , описываться различными уравнениями . Эти зависимости позволяют измерять `дискретное` значение скорости мутаций в отдельных участках кластеров геномов . Ясно , что эти значения носят вероятностный характер и требуют дополнительных подтверждений. Обычно функция F(N) — имеет отрицательное значение , при ее положительном значении мы будем иметь рост размеров мультиплетов .
Таким образом , появляется идея о информационном совершенстве геномов . Так как мы по-сути, видим одну из сторон эволюции генома , которая определяет в нем основной вектор мутаций. Степень `информационного` совершенства : это приближение отношения CG/AT к `1`, для этого удобно сравнивать суммы логарифмов произведений размеров мультиплетов `CG и AT` на их количество `n`
.................N=1................... N=1
(11) Q1 = ∑ Ln(nCG*N) ) / ∑ Ln(nAT*N)
.................N=max ..............N=max
Где : Q1 – `Первый` уровень эволюции .
nAT ,nCG — количество мультиплетов размером `N` for : — (nAT) and — nCG .
Так как этот критерий содержит в себе и `рудиментарные ` признаки – большие платформы , которые в существенной степени определяют уровень эволюции генома .

СТАТИСТИКА
Проведен статистический анализ геномов из различных классов живых организмов на присутствие мультиплетов из `A` ,`T` ,`A`+`T`,`C`+`G`,`AT`, `CG`. Статистический анализ проводился подсчетом мультиплетов ( например : `А` – сумм ААА , `A`+`T` and `C`+`G` — простой суммой соответствующих размеров мультиплетов `A` и `T`, `C` и `G`- соответственно . `AT` и `CG` — заменой `T`на `A`, и `G` на `C` соответственно в исследуемом геноме .Таким образом был показан заместительный принцип роста содержания `C` + `G` во всех исследованных организмах .
FIG.1 СОВРЕМЕННыЙ (геном) A- E.Coli genome 0157-H7 , B- Encephalitozoon cuniculi Chr 4 , C — Giardia lamblia Chr 1 .
FIG.2 НОВыЙ тип I – A- Condida Chr J , B- Saccharomyces cerevisiae Chr 2 , C-Yarrowia lipolica Chr f
FIG.3 НОВыЙ тип I , B- Trypanosoma brucei Chr 2 ,C- Plasmodium falciparum Chr 6 .
FIG.4 НОВыЙ тип I , A- Caenorhabditis Elegans Chr IV,B- Drosophila melanogaster Chr 3L , C- Arabidopsis thaliana Chr 1 , FIG 5 – Fugu cluster .
FIG.5 НОВыЙ тип I , B- Homo Sapiens Chr 7 , C- Mouse Chr 4 .
FIG.6 Drosophila melanogaster – Chr 2L, 2R , 3L , 3L , X , 4
FIG.7 – Examples of approximation for decayed multiplets .
FIG.8 – СОВРЕМЕННыЙ -S — Leishmania major (а) , Leishmania infanta (б) , Tularemia (c ) .
Table 1,2 – Расчитанные коэффициенты ’K1’ – для различнъх участков графиков геномов. Вычисления производились по формуле : Ni -Nk = K1 * Ln (n(Ni) / n(Nk) ) .

Поведение AT и  CG матриц
В соответствии с результатами статистической проверки предложенной `AT`- модели , были обнаружены `AT`- матрици. Наблюдается тенденция `сжатия` пространства между `AT` и `CG` — матрицами . Проявляется также тенденция к расщеплению мультиплетов . Соответственно , мы можем наблюдать этот процесс в развитии для различных геномов .Отмеченный процес развития геномов дает векторы их развития , которые позволяют делать вывод об относительном эволюционном уровне генома . Модель позволяет сделать генетическое сравнение развития организмов из различных классов Царств Животных и Растений. Становится возможным установить их иерархию . Скорости распада и замещений отдельных групп дают возможность расчитать региональные скорости мутаций и их векторы . Хромосомные геномы показывают коллиниарное поведение хромосом . Мы наблюдаем `дирижируемое` поведение мутаций в хромосомах одного генома. На Фиг.8 показана хромосома Leishmania major (а) и  Leishmania infanta (б) . Это представители новейшего типа генома , который явно образовался путем `варки` в бульоне из разрушенных ядер из представителей современных ( modern) геномов — `вивисекцией ` существенных кластеров , и то `АТ ` — содержащих : например с помощью` тепловой ` обработки . Причем Leishmania явно показывает тотже принцип сжатия AT – CG пространства ,но уже с `другой` стороны -`CG`. В таблице 1,2 приведены коеффициенты -`К1` , для различных размеров -`N` , для различных геномов. Наблюдается существенно более высокая подвижность `C` , `G` и `CG` — мультиплетов по сравнению с аналогичными : `A` ,`T` и `AT`.


p3

Отличие мутационной подвижности в различных частях кластеров может достигать десяти порядков !!! Это косвенно указывает на общую нестабильность геномов и их высокую пластичность.
Вычислены значения `Q1` для различных геномов . В одних и тех же классах живых ор ганизмов наблюдается широкий разброс уровня информационного эволюционного развития геномов. Человеческий геном оказался чуть лучше Caenorhabditis Elegans , но существенно уступает геному Fugu . Дрожжи тоже показывают достаточно высокий уровень `Q1` . Естественно , что геномы : E. Coli , Giardia lamblia , Encephalitozoon cuniculi — показали высокие `Q1`.

Выводы

Эволюция геномов явно управляется общим довлеющим вектором – увеличение компактности информации в геноме . Это достигается в основном уравновешением соотношения A,T / C,G . А также оптимизацией размеров мультиплетов. Сам механизм `мягкого` воздействия этого фактора , лежит явно в кинетике процессов воспроизводства . Доказательствами справедливости такой модели служат прямые разложения секвенсов в координатах Ln(n) -N и коллиниарность разложения хромосом одного генома ( Fig 6) — такие же графики получаются и со всеми исследованными мультихромосомными геномами . Также нахождение теоретически предсказанных Констант: K(n) и  K(N) , которые на самом деле — достаточно постоянны.
Таким образом, развитие преследует набор многообразных целей. Часть от них связана с информационным совершенством генома :
1. Максимальное использование информационного размера генома .
2. Оптимизация размеров кодирования функций .
3. Оптимизация группы размеров (генов и кластеров).
Подтверждается общий вероятностный характер векторов развития генома .

REFERENCES
1.`The guanine and cytosine content of genomic DNA and bacterial evolution `AKIRA MUTO AND SYOZO OSAWA — Vol. 84, pp. 166-169, January 1987
2.`A simple model based on in codon and amino-acid usage and GC composition within and across genomes`
Robin D Knight, Stephen J Freeland and Laura F Landweber ,-Genome Biology 2001.
3.Origin of Life: Instability of Building Blocks — Jonathan Sarfati ,Vol. 13, No. 2 of the Creation Ex Nihilo Technical Journal

Сергей Асташкин 2004г.



FIG 9.Пример поведения K(N)/ K(n), где K(N)/ K(n) — ось ординат от размеров мультиплетов.
Ось абсцис — N — размер мультиплетов.

К данной работе я прилагал ещё графики: K(N)/K(n) — N (размер мультиплетов семейств нуклеотидов), для данного случая привожу данные из секвенса Prochlorococcus marinus. Видно, что поведение K(n) и K(N) действительно говорит о существовании предсказанной стабильности в них ,а также,что сдвиг на один шаг в мультиплете переводит их в «другую» плоскость управления, где его стабильность резко падает — но опять имеет постоянное значение ! . Также показывает наличие «сдвоенных» пар стабильностей.. Также вдруг находятся области с процессом роста в мультиплетах. Таким образом, предложенный «инструмент»-модель и понимание процессов микроэволюции находят вполне твёрдые математические измерения, позволяет «измерять» динамические параметрыв в статике , что вообще говоря, конечно, удивительно ..

Таким образом, теоретически найденные коэффициенты K(N)/K(n) — найдены. Они на самом деле зависят от размеров «ключевых» ядер АТ и CG.

club.foto.ru/gallery/photos/1303551/?&author_id=236525&sort=date

Это последние экспериментальные подтверждения модели. Модель оказалась полностью адекватной управлению в процессинге геномов. Все свойства заложеннные в модели — подтвердились.



  • Сергей Асташкин  22 декабря, 14:34
    -- Так выглядела работа в 2005 г  Добавка — это ещё одно доказательство математической адекватности процесса.
    ОтветитьНравится
  • Врэж Багратуни  23 декабря, 04:51
    Так то! Не каждый теперь посмеет хихикая возразить вам. :)
    ОтветитьНравится
  • Сергей Асташкин  23 декабря, 06:14
    -- Обсуждать дело нормальное, по существу, всё остальное дело воспитания.
    ОтветитьНравится
  • Николай Кляшторный  23 декабря, 12:27
    Вы метематик или биолог? Или вы занимаетесь биоинформатикой?
    ОтветитьНравится
  • Александр Иерархов  23 декабря, 13:27
    Тык синтезируется то она синтезируется... А чё кодирует? Или дело не об ДНК а ДНКподобном полимерчике? От так и нормаль, наклепал чего то на ДНК похожее и можно орать что понял как появилась жизнь... Хорошо то как а... Нобель...
    ОтветитьНравится
  • Сергей Асташкин  23 декабря, 14:38
    -- Я занимаюсь теориями.. математику придумываю для конкретных случаев .. Работал в Акад. Наук УНЦ ..
    ОтветитьНравится
  • Сергей Асташкин  23 декабря, 14:43
    --Вы вообще-то правы, эти работы имеют отношение к информатике, но к теоретической, они позволяют рассчитывать будущую инфляцию (трансформацию) во вставленных генах Генно Модифицированных Геномов.. Поэтому ,когдв я рассуждаю о ГМО — я знаю больше чем другие рассуждающие ..
    ОтветитьНравится
  • Сергей Асташкин  23 декабря, 14:44
    --При таком широком охвате «векторами», становится ясным , что кодирование пептидов — не есть основной способ сохранения и передачи информации организму геномом..
    ОтветитьНравится
  • Сергей Асташкин  15 августа, 13:38
    -- Жалко что не получилось подробного разбора статьи.. KN/Kn — коэффициент есть мера , как показывает график, качественного перехода векторов (микроРНК) на разные уровни устойчивости в зависимости от конфигурации «ядер» опознования . Это очень интересно, получается, что система как и в выч. технике резервирует определённые типы кодов за разными по устойчивости процессингами..
    ОтветитьНравится
  • Александр Вихров  15 августа, 14:33
    Гипотетическое уравнение полимеризации, конечно, сильно. Осталось как-то решить проблему действительности — нежелании аминокислот и НК полимеризироваться.
    ОтветитьНравится
  • Сергей Асташкин  16 августа, 10:59
    -- НК полимеризуются без проблем, аминокислоты тоже ,но они не нужны тут..
    ОтветитьНравится