Можно заметить, что ген человека и ген шимпанзе почти идентичны: всего 5 отличий на 660 нуклеотидов! В среднем у человека с шимпанзе последовательности ДНК совпадают на 98,76 %<sup>88</sup> (чуть ниже, чем получилось для приведенного сравнения), а вот геномы двух людей совпадают примерно на 99,9 %. Мы также видим, что ген гистона банана совпадает с геном человека лишь где-то на 50 %. Для сравнения, если мы возьмем две совершенно случайные последовательности ДНК, между ними будет около 25 % сходства. Шимпанзе ближе к человеку, чем к банану, не только по степени сходства генов, но и по набору генов в геноме. У банана будет много генов, которых нет у приматов (например, связанных с фотосинтезом), а у приматов будут гены, которых нет у растений (например, связанные с развитием нервной системы).
Полезно представлять, насколько маленьким может быть геном живого организма. Геном паразитической бактерии Mycoplasma genitalium составляет всего около 580 тысяч “букв” – это один из самых маленьких известных бактериальных геномов<sup>89</sup>. Еще меньше бывают геномы вирусов. Вирусы не принято называть “живыми”, ведь они не являются клетками и не могут самостоятельно размножаться. Вирусы – это паразитическая наследственная информация, использующая генетический аппарат клеток для синтеза своих белков, размножения и распространения.
Типичный геном вируса иммунодефицита человека (ВИЧ) составляет 9749 нуклеотидов<sup>90</sup>. Бывают и на удивление крупные вирусы с очень богатым генетическим материалом, например, геномы пандоравирусов могут достигать размера в 2,5 миллиона нуклеотидов<sup>91</sup>, а живут они в амебах – одноклеточных эукариотах. Также в амебах живет и другая группа крупных вирусов с милым названием мимивирусы, геномы которых достигают миллиона нуклеотидов, что для вирусов тоже очень много<sup>92</sup>.
ВИЧ – это ретровирус, но не подумайте, что это вирус шестидесятых (впервые вызываемый им синдром приобретенного иммунодефицита – СПИД – был диагностирован в 1981 году). Он называется ретровирусом потому, что его геном сделан не из ДНК, как у большинства вирусов и живых организмов, а из РНК. У ретровирусов есть белок “обратная транскриптаза”, который умеет делать транскрипцию наоборот, то есть синтезирует ДНК, комплементарную молекуле РНК. С помощью этого белка ВИЧ создает ДНК-версию своего генома и встраивает ее в геном человеческой клетки. Дальше инфицированная клетка начинает сама производить вирусный генетический материал и его белки. Синтезированные компоненты собираются в новые вирусные частицы и выходят из клетки.
Генетические последовательности можно записывать в виде текста и работать с ними как с последовательностью букв. Так их удобно анализировать: исследовать распространенность тех или иных мутаций в популяции, изучать закономерности эволюции, находить определенные гены и так далее. Ниже приведена последовательность гена, который кодирует обратную транскриптазу ВИЧ.
А вот аминокислотная последовательность обратной транскриптазы ВИЧ в стандартном однобуквенном коде.
Обратите внимание, что теперь мы должны использовать не 4 символа, а 20 – для обозначения аминокислот, а не нуклеотидов, и количество символов уменьшилось в три раза, ведь тройке нуклеотидов отвечает одна аминокислота. Мы досконально знаем, как устроен геном ВИЧ с точностью до нуклеотидов, а точнее, мы знаем последовательности геномов сотен разных его штаммов, причем все они выложены в свободный доступ. И вот странный факт: есть целое движение людей, отрицающих существование этого вируса!
Существуют методы, позволяющие установить последовательность нуклеотидов той или иной молекулы ДНК или РНК. В случае с молекулами РНК обычно сначала осуществляют обратную транскрипцию (с помощью обратной транскриптазы), чтобы получить молекулу ДНК, а уже саму молекулу ДНК “читают”. |