Audi-a3club - Автомобильный портал

Расшифрованная жизнь. Сравнительная и функциональная геномика растений

Чтобы два самых авторитетных в мире научных журнала – британский «Nature» и американский «Science» – одновременно посвятили значительную часть своих очередных выпусков одной и той же теме, – такое случается крайне редко. А уж если случается, то свидетельствует о чрезвычайной важности этой темы. Так что публикация сразу 12-ти статей, посвящённых расшифровке генома шимпанзе и его сравнению с геномом человека, – событие, конечно, незаурядное.

Для реализации проекта по картированию и сравнительному анализу генома шимпанзе был создан международный консорциум. В него вошли 67 учёных из 23-х научных учреждений 5-ти стран – США, Израиля, Испании, Италии и Германии. Координировали работу генетики Гарвардского университета и Массачусетского технологического института в Бостоне. А кровь для анализа ДНК дал молодой самец шимпанзе по имени Клинт (Clint), обитатель одной из вольер Национального центра по изучению приматов имени Йеркиса в Атланте, штат Джорджия. К сожалению, в январе нынешнего года донор умер от острой сердечной недостаточности в самом расцвете сил, в возрасте 24-х лет. Его скелет находится теперь в экспозиции музея Филда в Чикаго. Однако самая главная ценность, доставшаяся человечеству в наследство от Клинта, – это порция его крови, послужившая исходным материалом для расшифровки и анализа генома шимпанзе. Теперь приматы пополнили перечень организмов, наследственный материал которых полностью картирован. Этот перечень насчитывает сегодня уже сотни позиций: тут и плесневые грибы, и бактерии, в том числе возбудители опасных инфекционных заболеваний (сибирской язвы, туляремии, чумы, тифа), и растения (рис, кофейное дерево), и насекомые (малярийный комар), и птицы (например, курица), и млекопитающие (мышь, крыса, собака, свинья, корова). Однако человекоподобные обезьяны занимают в этом перечне, конечно же, совершенно особое место. По словам Роберта Уотерстона (Robert Waterston), возглавляющего отдел геномных исследований Высшей медицинской школы Вашингтонского университета в Сиэтле, «изучение шимпанзе как самого близкого из ныне живущих на Земле родственника человека может дать нам максимум информации о нас самих». Однако прежде чем перейти к обсуждению полученных учёными результатов, я позволю себе небольшое отступление – или, если хотите, напоминание, – чтобы было понятнее, о чём, собственно, речь.

Как известно, любой живой организм состоит из клеток, и в ядре каждой клетки имеется один и тот же свойственный данному биологическому виду набор генетической информации. Этот набор и именуется геномом. Носителем генетической информации являются хромосомы. Хромосома представляет собой молекулу дезоксирибонуклеиновой кислоты (сокращённо – ДНК) и состоит из двух длинных полинуклеотидных цепей, закрученных одна вокруг другой и соединённых друг с другом так называемыми водородными связями. Эта молекула именуется двойной спиралью, её можно несколько упрощённо представить себе в виде скрученной верёвочной лестницы. Разным видам животных присуще разное количество хромосом. Так, человеческий геном состоит из 23 пар хромосом – в каждой паре одна хромосома происходит от отца, другая – от матери. У плодовой мушки – дрозофилы – в ядрах клеток содержится по 4 пары хромосом, а, например, бактерии имеют всего одну непарную хромосому. На хромосомах в строго определённых участках расположены гены – своего рода единицы наследственности. В химическом отношении гены состоят из молекул 4-х азотистых соединений – аденина, цитозина, гуанина и тимина. Эти так называемые нуклеотидные основания повторяются в строго определённом порядке, образуя пары «аденин – тимин» и «гуанин – цитозин». Один ген может содержать от нескольких тысяч до более чем двух миллионов нуклеотидных оснований. Именно их последовательностью и определяются специфические функции каждого конкретного гена.

Образно геном можно представить себе так: ядро клетки – это библиотека, в которой хранятся инструкции по обеспечению жизни; хромосомы играют роль книжных полок; на полках стоят книги – молекулы ДНК; гены – это главы внутри книг, а нуклеотидные основания – аденин, тимин, гуанин и цитозин, которые принято обозначать начальными буквами их названий А, Т, G и С, – это тот самый алфавит, которым записан текст генома. Геном человека, например, – это цепочка из 3-х миллиардов 200-т миллионов букв.

Но того, что гены есть и что они работают, ещё недостаточно: они должны работать по-разному, обеспечивая те или иные специфические функции. Ведь клетки разных органов и тканей – скажем, кожи, печени, сердца и головного мозга, – разительно отличаются друг от друга. Между тем, ядро каждой из них содержит один и тот же набор генов. Всё дело – в активности генов: в одних клетках работают одни гены, в других – другие. Так что хромосомы являются носителями не только генов, но и тех белковых факторов, которые контролируют их функции. Этот набор генов вместе с регулирующими элементами и составляет ту структуру внутри клетки, которая обеспечивает все необходимые функции.

А теперь, вооружившись этими знаниями, давайте вернёмся к тем результатам, что были получены в ходе расшифровки генома шимпанзе. По вполне понятным причинам, наибольший интерес и у специалистов, и у широкой общественности вызывает каталог тех отличий в генетических кодах шимпанзе и человека, которые накопились за минувшие 6 с лишним миллионов лет, с тех пор, как эволюционные пути двух видов, имевших общего предка, разошлись. Сванте Пябо (Svante Pääbo), сотрудник Института эволюционной антропологии имени Макса Планка в Лейпциге и один из участников проекта, оценивает полученную базу данных так:

Она представляет собой чрезвычайно полезный инструмент, который поможет нам в поиске ответа на вопрос, какими генетическими мутациями объясняется разительное отличие человека как биологического вида от всех прочих видов животных. Одно из направлений этого поиска сводится к тому, чтобы попытаться выявить взаимосвязь между генетическими различиями и активностью тех или иных генов.

Прежде всего, следует отметить, что полученные данные удивили специалистов. Главная неожиданность заключается в том, что геном шимпанзе, как оказалось, совпадает с геномом человека на 98,8 процента. Грубо говоря, генетическое сходство между человеком и шимпанзе в 10 раз больше, чем между мышью и крысой. Дилетантов, скорее всего, поразит столь большое сходство, эта почти полная идентичность геномов, однако учёных удивило как раз обратное: то, что отличие оказалось всё же довольно значительным. Тем более, что эта цифра – совпадение на 98,8 процента – не в полной мере отражает положение дел. Она получается при сравнении отдельных букв генетического кода в кодирующей ДНК. Здесь учёные насчитали 35 миллионов расхождений, что и составило 1,2 процента от всего генома шимпанзе, который насчитывает около 3-х миллиардов 100 миллионов нуклеотидных пар. Но это далеко не всё: существенные различия были обнаружены и в распределении тех последовательностей нуклеотидных оснований, которые образуют некодирующую, «эгоистическую» ДНК. Эти несовпадения составили ещё 2,7 процента от всего генома, что дало в сумме уже почти 4 процента.

В общей сложности у шимпанзе не оказалось 53-х генов из тех, что имеются у человека. В частности, в геноме шимпанзе отсутствуют три гена, играющие ключевую роль в развитии воспалений, которые, как известно, являются причиной многих заболеваний человека. С другой стороны, человек, похоже, утратил в процессе эволюции ген, который предохраняет животных от болезни Альцгеймера.

Наиболее значительные отличия касаются генов, регулирующих иммунную систему. По мнению профессора Эвана Эйклера (Evan Eichler), сотрудника Высшей медицинской школы Вашингтонского университета в Сиэтле, это свидетельствует о том, что в процессе эволюционного развития шимпанзе и человеку пришлось противостоять разным патогенам и бороться с разными болезнями. Сванте Пябо (Svante Pääbo) поясняет:

Прежде всего, мы задались вопросом, какие сегменты ДНК могут внести ясность в историю происхождения ряда болезней. Мы знаем, что некоторые генетические структуры, вызывающие то или иное заболевание, встречаются и у шимпанзе, и у человека. Видимо, эти структуры унаследованы обоими видами от их общего предка. Однако есть болезни, генетическая предрасположенность к которым возникла в процессе эволюции только у человека. В этих случаях сравнительный анализ ДНК даст нам ценную информацию о генетической природе таких заболеваний и о восприимчивости к ним человека как биологического вида.

Анализируя собранные данные, учёные произвели своего рода компьютерное наложение карты генома шимпанзе на карту генома человека, что позволило им выделить три категории так называемых ДНК-дупликаций – тех, что имеются в геноме человека, но отсутствуют в геноме шимпанзе, тех, что имеются в геноме шимпанзе, но отсутствуют в геноме человека, и тех, что имеются в геноме обоих видов. ДНК-дупликация – это одна из форм мутации, при которой участок хромосомы удваивается. В данном случае учитывались сегменты ДНК длиной не менее 20-ти тысяч нуклеотидных пар. Оказалось, что примерно треть ДНК-дупликаций, обнаруженных у человека, отсутствуют у шимпанзе. По словам Эйклера, эта цифра изрядно удивила генетиков, поскольку она свидетельствует об очень высокой частоте мутаций за короткий – по эволюционным меркам – промежуток времени. В то же время анализ ДНК-дупликаций, присущих только геному шимпанзе, показал, что хотя количество мест, где они встречаются, относительно невелико, зато количество копий дуплицированных сегментов намного превышает этот показатель у человека. Да и в тех случаях, когда ДНК-дупликация имеет место и у шимпанзе, и у человека, у шимпанзе она обычно представлена большим количеством копий. В частности, учёные обнаружили сегмент, который в геноме человека встречается 4 раза, а в геноме шимпанзе – 400 раз. Интересно то, что этот участок расположен вблизи того региона, который у шимпанзе и других больших обезьян разделён на 2 хромосомы, а у человека слит в одну – хромосому №2.

Впрочем, разительные отличия между обезьяной и человеком объясняются не столько разночтениями генетического кода, сколько различной активностью генов, – подчёркивает Сванте Пябо. Руководимая им группа исследователей изучила и сравнила активность 21 тысячи генов в клетках сердца, печени, почек, яичек и головного мозга обоих приматов. Оказалось, что полного совпадения активности генов нет ни в одном из этих органов, но различия распределены крайне неравномерно. Как это ни удивительно, наименьшие отличия учёные зарегистрировали в клетках головного мозга – они составили всего несколько процентов. А наибольшие отличия были обнаружены в яичках: здесь каждый третий ген обладает другой активностью. Впрочем, это вполне объяснимо, если иметь в виду, что шимпанзе не образуют моногамных семей, а живут группами, своего рода коммунами, насчитывающими 25-30 особей обоего пола. То есть «беспорядочные половые связи» у шимпанзе распространены значительно шире, чем у людей. Чтобы повысить свои шансы на продолжение рода в условиях промискуитета, самцы шимпанзе должны производить огромное количество спермы. Не случайно яички у них в десять раз крупнее, чем у мужчин «гомо сапиенс». Но дело, конечно, не только в размерах, – говорит Сванте Пябо:

Полученные нами данные свидетельствуют об очень высокой активности тех генов на Y-хромосоме, которые непосредственно отвечают за производство спермы.

И тому факту, что человек физически гораздо слабее шимпанзе, учёные нашли генетическое объяснение: у обезьян мускулатура работает в 5-7 раз эффективнее потому, что у всех представителей рода человеческого ген MYH16, кодирующий «миозин» – белок мышечных волокон – представлен мутированной копией.

Однако если сконцентрироваться на вопросе, в чём всё-таки состоит главное генетическое отличие человека как биологического вида от обезьяны и чем объясняется столь успешная экспансия человека в ходе эволюции, то ответ, видимо, следует искать в выделенных учёными 6-ти участках генома. В геноме человека эти участки, содержащие в общей сложности несколько сотен генов, столь стабильны, что практически идентичны у всех людей; в геноме шимпанзе они, напротив, часто содержат мутации. Видимо, считают учёные, эти участки играли чрезвычайно важную роль в процессе нашей эволюции. Примечательно, что на одном из этих участков расположен ген FOXP2 – один из 4-х генов, ответственных за развитие речи. Как показали эксперименты, в лабораторных условиях обезьяны способны усвоить довольно значительный набор знаков и символов; шимпанзе, живущие на воле, используют для коммуникации весьма богатый ассортимент звуков; однако они физически не в состоянии совершать губами и языком те движения, которые необходимы для артикулированной речи. Возможно, именно мутация гена FOXP2 и стала одним из ключевых факторов, определивших столь разную эволюционную судьбу разных видов приматов.

Впрочем, не следует забывать, что человек выделился среди прочих видов животных не только развитой речью. Но вот какие генетические структуры предопределили прямохождение и быстрый рост объёма головного мозга, которые и повлекли за собой всё остальное, будь то создание орудий труда или использование огня, – на этот счёт учёные пока даже гипотезы высказывать не рискуют.

В научных кругах несколько лет назад ходила байка, что Господь, создавая человека, действовал как самый настоящий программист. Программа, как правило, занимает гораздо меньше объема, чем комментарии к ней. В геноме оказалось буквально то же самое: только спустя десятилетие после прочтения человеческой ДНК «по буквам» ученые начали разбираться в «комментариях» к ней. Они нашли в геноме миллионы регуляторов работы генов и даже, судя по полученным результатам, выяснили, как они действуют. Таким образом, удалось получить массу информации о генетических заболеваниях.

В начале сентября в научном мире случилась сенсация. Практически одновременно были опубликованы 30 с лишним статей с результатами одного из проектов под названием ENCODE. Из них шесть статей появились в Nature, две — в Science и 24 - в журналах Genome Re search и Genome Biology.

Подобного всплеска молекулярно-генетических публикаций не случалось уже давно. Cуть проекта ENCODE состоит в том, что ученые исследовали ту часть ДНК, которую часто называют «мусорной» (junk DNA). Почему «мусорной»? Дело в том, что она не содержит генов, а значит, не кодирует белков. И было совершенно непонятно, для чего она нужна.

Но «мусор» оказался поистине золотым. Теперь, как говорит доктор Юан Бирни (Ewan Birney) из Европейского института биоинформатики в Хьюстоне (Великобритания), координатор анализа данных по проекту, термин «мусорная ДНК» пора выбросить в мусорную корзину.

Строение ДНК

ДНК (дезоксирибонуклеиновая кислота) - длинная полимерная молекула, состоящая из повторяющихся блоков, нуклеотидов. Каждый нуклеотид состоит из азотистого основания, сахара (дезоксирибозы) и фосфатной группы. Сама молекула имеет форму спирали из двух цепей, ориентированных азотистыми основаниями друг к другу. В ДНК четыре вида азотистых оснований (аденин, гуанин, тимин и цитозин), они соединяются попарно друг с другом водородными связями по принципу комплементарности (аденин соединяется с тимином, гуанин с цитозином).

Прочитан не значит расшифрован

В 2000 году мир узнал о том, что ученые прочитали геном человека. Точнее, в тот момент они всего лишь получили «черновик», а о полном прочтении объявили в 2003 году. В СМИ для этой работы использовали фразу «расшифровка генома», хотя она не совсем корректно описывает результат многолетней работы международного консорциума.

То, что получили, представляет собой не расшифровку, а самую настоящую шифровку. Исследователи секвенировали человеческую ДНК, то есть распознали последовательность из 3 млрд букв (А, С, T, G), обозначающих составные «кирпичики» ДНК - нуклеотиды. Двойная спираль молекулы, в которой закодирована наследственная информация человека, превратилась в длиннейшую телетайпную ленту с буквами, и некоторые из них складывались в «слова» - гены.

Но «слов-то» оказалось относительно немного! Общее количество генов в геноме человека ученые оценивают всего в 20-25 тыс. Эта цифра совсем не поражает воображение, если сравнивать, например, с мухой дрозофилой, у которой 14 тыс. генов. А у крошечного пресноводного рачка дафнии насчитали более 30 тыс. генов - на сегодня он остается чемпионом в этой номинации. Но мы-то посложнее устроены, чем дафния, один мозг человеческий чего стоит. Стало ясно, что особенность генетического устройства человека кроется вовсе не в количестве, а в качестве. Собака зарыта, таким образом, не в самом наборе генов, а в тонкой и сложной регуляции их работы.

Доктор биологических наук, биоинформатик Михаил Гельфанд заметил как-то в нашем с ним разговоре, что секвенированный геном - лишь найденный папирус, на котором виден непонятный текст. Но мы не знаем, что на нем написано, не можем перевести на свой язык. То есть мы не понимаем, как работает геном: почему в одних клетках включаются одни гены, в других клетках - иные (и благодаря этому клетки нашего организма разные), почему одни гены работают только в эмбрионе, а по мере развития человека вместо них начинают работать другие и т. д. Сами гены, как оказалось, занимают всего 1–2% длины молекулы ДНК. Напомним, что в гене содержится информация о строении белка (или нескольких белков), то есть гены кодируют белки. Но 98–99% ДНК белков не кодирует. Конечно, ученые догадывались, что не всё так просто, природа не может быть настолько расточительна и «мусорная» ДНК для чего-то очень нужна. Но, чтобы это показать, нужно было проделать много кропотливой работы, которая под силу только большому международному консорциуму. Такой масштабный замысел и стал в итоге целью проекта ENCODE (Encyclopedia of DNA Elements), в котором участвуют более 400 исследователей, члены 32 научных групп.

ДНК-энциклопедия

Работа стартовала в 2003 году. Финансировал ее Национальный институт исследований генома человека (National Human Genome Research Institute). Проект обошелся ему в 185 млн долларов США. На первом этапе, когда шла отработка методик, ученые проанализировали лишь 1% некодирующей части ДНК. С 2007 года начался второй этап, результаты которого и опубликованы одновременно в Nature, Science и других научных журналах. Но насколько велика получившаяся энциклопедия? Как пишет редактор Nature Брендан Мэйер (Brendan Maher), если распечатать все геномные данные, собранные по проекту за пять лет, при плотности 1000 пар оснований на квадратный сантиметр вышла бы распечатка 30 км в длину и 16 м в высоту. В ней содержатся 15 трлн байт информации.

По словам Мэйера, в ходе программы «Геном человека» получен «рабочий чертеж» генома. Но к этому чертежу не прилагается «руководства пользователя», и поэтому мы не знаем, как его читать. Чтобы понять это (то есть получить такой мануал), участники ENCODE стали интенсивно изучать пустые пространства между генами, предполагая, что инструкция к геному может быть записана именно там.

За пять лет они смогли перелопатить около 80% этой пустыни и нанесли на карту найденные в «мусоре» различные регуляторные участки. И чем тщательнее они исследовали ДНК, тем сложнее она оказывалась устроена - с каждым шагом вперед горы становились выше.

Транскрипционные факторы
Белки, контролирующие процесс синтеза РНК на матрице ДНК (транскрипцию) путем связывания со специфичными участками ДНК. Таким образом, они обеспечивают усиление или ослабление работы гена.

Геномная «темная материя»

Как генетики изучали ДНК, которая не делает белков? Во-первых, они убедились в том, что с некодирующих участков генома тоже образуется РНК. Основную роль в этой работе сыграла группа лаборатории КолдСпринг-Харбор, которой руководит профессор Томас Джинджерас (Thomas Gingeras).

Именно эта команда ученых доказала, что три четверти человеческой ДНК образует РНК, хотя большая часть этой РНК и не несет информации для синтеза белков клетки. Д-ру Джинджерасу и его коллегам удалось описать тысячи неизвестных ранее РНК, которые обеспечивают генную регуляцию.

Во-вторых, они пометили ДНК особым ферментом (DNaseI), который прикрепляется к определенным местам молекулы. Это и оказались регуляторные участки, которые связываются с белками - транскрипционными факторами - и через них влияют на работу генов. Одни из них расположены непосредственно рядом с генами, другие - совсем далеко от них. Доктор биологических наук Юрий Лебедев, заведующий лабораторией сравнительной функциональной геномики Института биоорганической химии им. Шемякина и Овчинникова РАН, объясняет, что задачу проекта ENCODE можно представить как «разбиение непрерывного ряда букв последовательности нуклеотидов ДНК на отдельные слова и осмысленные предложения». Для ее решения исследователи использовали не «виртуальные» биоинформатические, а прямые экспериментальные методы, например разного рода биологические чипы. «Чип можно представить как своеобразную “щетку”, каждая “ворсинка” которой представляет собой короткий кусочек ДНК с точно известным положением в геноме», - поясняет ученый. Этим методом идентифицируют положение участков ДНК, которые связываются с транскрипционным фактором. При нанесении раствора-зонда на чип на некоторых ворсинках возникает флуоресцентный сигнал.

«Если для приготовления зонда взять ДНК из разных типов клеток, можно увидеть разницу в наборе флуоресцентных сигналов, - продолжает Лебедев. - Например, в ДНК из лейкоцитов данный белок будет связываться с одними участками, а в ДНК из клеток печени или мозга спектр этих участков будет другим. Подобным же образом определяют профили метилирования геномной ДНК - одного из вездесущих клеточных механизмов, регулирующих активность генов. Чтобы найти метилированные участки ДНК, используют группу специальных метил-связывающих белков. Так получается подробная функциональная карта генома для разных типов клеток».

Метилирование ДНК
Химическая модификация молекулы ДНК без изменения состава нуклеотидной последовательности. Выражается в присоединении метильной группы (СН3--) к цитозину. От степени метилирования зависит уровень экспрессии гена. Это один из механизмов регуляции работы генов.

Дирижеры генного оркестра

Итак, на 25 тыс. генов в ДНК обнаружилось около 4 млн регуляторных участков. Каждый ген взаимодействует со множеством регуляторов. «Большинство людей представляют геном линейно - 3 млрд нуклеотидов, вытянутых в линию, - говорит Марк Герштейн (Mark Gerstein), профессор биоинформатики на отделении молекулярной биофизики и биохимии Йельского университета (США). - Но геном - трехмерный объект». По его словам, «мы будто открыли коммутационный отсек и увидели спутанный клубок проводов. И теперь пытаемся распутать этот клубок и разобраться, куда ведут провода». В статье в Nature Марк Герштейн и его коллеги пишут про сложную пространственную сеть, в которую объединены транскрипционные факторы, которые регулируют работу генов на разных уровнях: среди них есть топ-регуляторы, регуляторы среднего и низшего звена.

Ученые имели дело с большим разнообразием клеток - всего они изучили 147 типов клеток, взятых из многих тканей на разных стадиях их развития. Оказалось, что команда регуляторов, которые дирижируют генным оркестром, меняется с типом клетки и со временем. Для разных клеток исследователи создали карты активных регуляторных участков. В этом ключ к пониманию того, что клетки развиваются и проходят дифференцировку от стволовых к специализированным, и нервные клетки в итоге не похожи на мышечные. «Полученные карты генома разных клеток можно сравнить с картами, которые нам дает Google Maps, - объясняет Эрик Лэндер (Eric Lander), президент Broad Institute (объединенный институт, в состав которого входят Массачусетский технологический институт, Гарвардский университет и институт Уайтхеда). - По сравнению с ними результаты предшествующего проекта “Геном человека” давали нам взгляд на Землю из космоса. По этим снимкам невозможно определить, где проходят трассы, каков на них трафик в данное время дня, они не укажут вам на лучшие рестораны в округе или на больницы в этом городе на берегу реки». Теперь же, продолжаем сравнение, по геному стало возможно «ездить с навигатором».

Дифференцировка
Процесс специализации клетки - развития от стадии стволовой клетки до специализированной клетки какой-либо ткани.
Однонуклеотидный полиморфизм (SNP)
Точечные мутации - замена одного нуклеотида на другой. Один из наиболее распространенных вариантов генетического разнообразия.

Болезни - чаще поломка не генов, а регуляторов

В последнее десятилетие ученые активно исследуют генетическую природу различных заболеваний. Этому помогает широкогеномное генотипирование - GWAS (genome wide association study). В группе больных и в группе здоровых людей сравнивают генетическую вариабельность, или однонуклеотидный полиморфизм (SNP), - точечные мутации, выражающиеся в замене одного нуклеотида другим. Таким образом выявляют ассоциации мутаций с болезнью. Иногда удается связать болезнь с определенными генами.

Трудность состоит в том, что только 15% этих вредных мутаций приходится на гены, и тогда можно понять, что именно ломается в организме. А 85% мутаций попадает вовсе не на гены, а на ту самую межгенную «темную материю», о которой ученые до недавнего времени практически ничего не знали. «Большинство изменений, которые связаны с болезнями, лежат не в самих генах, а в переключателях», - объясняет Майкл Снайдер (Michael Snyder), исследователь-микробиолог из Стэнфордского университета (США). Поэтому работы по расшифровке генома пока дают очень малый эффект для диагностики и лечения.

«Многие исследователи находили участки человеческого генома, мутации в которых вызывают определенные болезни, - объясняет Джоб Дэккер (Job Dekker), профессор отделения биохимии и молекулярной фармакологии Медицинской школы Массачусетского университета (США). - Во многих случаях, как удалось понять, эти участки совсем не содержат генов, и тогда объяснить причину патологии трудно. Данные ENCODE показывают, что многие из этих мутаций затрагивают регуляторные элементы генов, и в некоторых случаях мы можем найти, какие гены регулируются этими элементами. Таким образом, мы можем значительно лучше понять генетические основы болезни».

Разбираясь в том, какие регуляторы ломаются и работу каких генов они нарушают, генетикам удалось обнаружить неожиданные связи между, казалось бы, весьма далекими по природе заболеваниями, пишут авторы статьи в Nature. Например, одна мутация в регуляторном участке изменяет работу нескольких генов, что может в конечном итоге привести к рассеянному склерозу, волчанке, ревматоидному артриту, болезни Крона, глютеновой болезни.

«Самый главный выход проекта - в предоставлении громадного массива данных для сравнительного анализа функциональных карт, - считает Юрий Лебедев. - Проведение такого анализа крайне важно для развития медицины, поскольку его результаты могут ответить на вопрос, что изменится в геноме больных клеток по сравнению с геномом здоровых. Если мы возьмем, скажем, ДНК из клеток двух типов, например клеток раковой опухоли легкого и неповрежденных клеток легкого (поверхностный эпителий альвеол), у них можно сравнить профиль метилирования или связь с транскрипционными факторами, и профили будут разными. Если этот результат получен не на одном пациенте, а на многих, он может стать диагностическим признаком».

Таким образом уже удалось найти мутации, которые связаны с развитием рака, - подавляющее число мутаций в раковых клетках появляются опять-таки не в генах, а в зоне «темной материи». Об этом говорит д-р Марк Рубин (Mark Rubin), специалист по генетике рака простаты из Медицинского колледжа Вейл Корнелл в Нью-Йорке. Его группа обнаружила мутации в ключевых генах, связанные с раком простаты, которые, однако, было невозможно компенсировать лекарствами. Теперь ясно, какие участки «темной материи» нарушают работу этих генов, - появились новые мишени для лекарственной терапии.

Марк Герштейн считает, что результаты проекта ENCODE найдут когда-нибудь применение в области персональной геномики: «В будущем каждый человек будет располагать собственным секвенированным геномом и сможет использовать эту информацию для получения персональной медицинской помощи. Индивидуальные генетические карты будут применяться для оценки индивидуального риска развития тех или иных болезней и для разработки индивидуальной схемы лечения».

определена полностью. Поэтому работу по расшифровке генома нематоды следует признать весьма успешной.

Еще больший успех связан с расшифровкой генома дрозофилы, лишь в

2 раза уступающего по размеру ДНК человека и в 20 раз превосходящего ДНК нематоды. Несмотря на высокую степень генетической изученности дрозофилы, около 10% ее генов были до этого момента неизвестны. Но самым парадоксальным является тот факт, что у гораздо более высоко организованной по сравнению с нематодой дрозофилы количество генов оказалось меньше, чем у микроскопического круглого червя! С современных биологических позиций это трудно объяснить. Больше генов, чем у дрозофилы, присутствует и в расшифрованном геноме растения из семейства крестоцветных - арабидопсиса, широко используемого генетиками в качестве классического экспериментального объекта.

Разработка геномных проектов сопровождалась интенсивным развитием многих областей науки и техники. Так, мощный импульс для своего развития получила биоинформатика . Был создан новый математический аппарат для хранения и обработки огромных массивов информации; сконструированы системы суперкомпьютеров, обладающие невиданной мощностью; написаны тысячи программ, позволяющих в считанные минуты проводить сопоставительный анализ различных блоков информации, ежедневно вводить в компьютерные базы новые данные,

получаемые в различных лабораториях мира, и адаптировать новую информацию к той, которая была накоплена ранее. Одновременно были разработаны системы для эффективной изоляции различных элементов генома и автоматического секвенирования, то есть определения нуклеотидных последовательностей ДНК. На этой базе были сконструированы мощные роботы, значительно ускоряющие секвенирование и делающие его менее дорогостоящим.

Развитие геномики, в свою очередь, привило к открытию огромного количества новых фактов. Значение многих из них еще предстоит оценить в

будущем. Но и сейчас очевидно, что эти открытия приведут к переосмыслению многих теоретических положений, касающихся возникновения и эволюции различных форм жизни на Земле. Они будут способствовать лучшему пониманию молекулярных механизмов, лежащих в основе работы отдельных клеток и их взаимодействий; детальной расшифровке многих до сих пор неизвестных биохимических циклов;

анализу их связи с фундаментальными физиологическими процессами.

Таким образом, происходит переход от структурной геномики к

функциональной, которая в свою очередь создает предпосылки для

исследования молекулярных основ работы клетки и организма в целом.

Накопленная уже сейчас информация будет предметом анализа в течение

нескольких ближайших десятилетий. Но каждый следующий шаг в

направлении расшифровки структуры геномов разных видов, порождает новые технологии, облегчающие процесс получения информации. Так,

использование данных о структуре и функции генов более низко организованных видов живых существ может значительно ускорить поиск

вытесняют достаточно трудоемкие молекулярные методы поиска генов.

Наиболее важным следствием расшифровки структуры генома определенного вида является возможность идентификации всех его генов и,

соответственно, идентификации и определения молекулярной природы транскрибируемых молекул РНК и всех его белков. По аналогии с геномом родились понятия транскриптома , объединяющего пул образовавшихся в результате транскрипции молекул РНК, ипротеома , включающего множество кодируемых генами белков. Таким образом, геномика создает фундамент для интенсивного развития новых наук –протеомики итранскриптомики . Протеомика занимается изучением структуры и функции каждого белка; анализом белкового состава клетки; определением молекулярных основ функционирования отдельной клетки, являющегося

результатом координированной работы многих сотен белков, и

исследованием формирования фенотипического признака организма,

являющегося результатом координированной работы миллиардов клеток.

Очень важные биологические процессы происходят и на уровне РНК. Их анализ является предметом транскриптомики.

Наибольшие усилия ученых многих стран мира, работающих в области геномики, были направлены на решение международного проекта «Геном человека». Значительный прогресс в этой области связан с реализацией идеи,

предложенной Дж. С. Вентером, заняться поиском и анализом

экспрессирующихся последовательностей ДНК, которые в дальнейшем могут быть использованы в качестве своеобразных «ярлыков» или маркеров определенных участков генома. Другой независимый и не менее плодотворный подход, был использован в работе группы, возглавляемой Фр.

Коллинзом. Он основан на первоочередной идентификации генов наследственных болезней человека.

Расшифровка структуры генома человека привела к сенсационному открытию. Оказалось, что в геноме человека только 32 000 генов, что в несколько раз меньше количества белков. При этом белок-кодирующих генов только 24 000, продуктами остальных генов являются молекулы РНК.

Процент сходства по нуклеотидным последовательностям ДНК между разными индивидуумами, этническими группами и расами составляет 99,9%.

Это сходство и делает нас людьми – Homo sapiens! Вся наша изменчивость на нуклеотидном уровне укладывается в очень скромную цифру – 0,1%.

Таким образом, генетика не оставляет места для идей национального или расового превосходства.

Но, посмотрим друг на друга – мы все разные. Еще более заметны национальные, а тем более, расовые различия. Так какое же количество мутаций определяют изменчивость человека не в процентном, а в абсолютном выражении? Для того чтобы получить эту оценку, нужно вспомнить, каков размер генома. Длина молекулы ДНК человека составляет

3,2х109 пар оснований. 0,1% от этого – 3,2 миллиона нуклеотидов. Но вспомним, что кодирующая часть генома занимает менее 3% от общей длины молекулы ДНК, а мутации вне этой области, чаще всего, не оказывают никакого влияния на фенотипическую изменчивость. Таким образом, для получения интегральной оценки числа мутаций, оказывающих влияние на фенотип, нужно взять 3% от 3,2 миллионов нуклеотидов, что и даст нам цифру порядка 100 000. То есть, около 100 тысяч мутаций формируют нашу фенотипическую изменчивость. Если мы сопоставим эту цифру с общим числом генов, то получится, что в среднем на ген приходится 3-4 мутации.

Что это за мутации? Их подавляющее большинство (не менее 70%)

определяет нашу индивидуальную непатологическую изменчивость, то, что нас отличает, но не делает хуже по отношению друг к другу. Сюда входят такие признаки, как цвет глаз, волос, кожи, характер телосложения, рост, вес,

тип поведения, который тоже в значительной степени генетически детерминирован, и многое другое. Около 5% мутаций ассоциированы с моногенными заболевания. Около четверти оставшихся мутаций относятся к классу функциональных полиморфизмов. Они участвуют в формировании наследственной предрасположенности к широко распространенной мультифакториальной патологии. Конечно, эти оценки достаточно грубые,

но они позволяют судить о структуре наследственной изменчивости человека.

Глава 1.16. Молекулярно-генетические основы эволюции

Произошедшая на рубеже тысячелетий революция в области молекулярной биологии, завершившаяся расшифровкой структуры геномов многих сотен видов микроорганизмов, а также некоторых видов простейших,

дрожжей, растений, животных и человека, перевернула многие традиционные представления классической генетики и вплотную приблизила возможность исследования молекулярных механизмов эволюции и видообразования. Родилась новая наука - сравнительная геномика,

позволяющая регистрировать появление в различных филогенетических линиях эволюционно значимых событий, происходящих на уровне отдельных молекул. Оказалось, что в общем случае эволюционный прогресс ассоциируется не только, и не столько с увеличением числа, протяженности и даже сложности структурной организации генов, но в гораздо большей степени с изменением регуляции их работы, определяющей координацию и тканеспецифичность экспрессии десятков тысяч генов. Это, в конечном счете, и привело к появлению у высших организмов более сложных, высоко специфичных, многофункциональных комплексов взаимодействующих белков, способных выполнять принципиально новые задачи.

Рассмотрим характер изменений, происходящих в процессе эволюции на трех информационных уровнях: ДНК – РНК – белок или геном – транскриптом – протеом. В общем случае можно сказать, что по мере нарастания сложности организации жизни, происходит увеличение размера генома. Так, размер ДНК прокариот не превышает 8х106 п. о., он становится вдвое больше у дрожжей и простейших, в 10-15 раз больше у насекомых, а у млекопитающих увеличение достигает 3 порядков, то есть в тысячу раз (103 ).

Однако эта зависимость не носит линейный характер. Так в пределах млекопитающих мы уже не наблюдаем существенного увеличения размера генома. Кроме того, не всегда удается наблюдать зависимость между величиной генома и сложностью организации жизни. Так, у некоторых растений величина генома на порядок или даже на два порядка больше, чем у человека. Напомним, что увеличение размера генома эукариот по сравнению с прокариотами происходит, главным образом, за счет появления некодирующих последовательностей, то есть факультативных элементов. Мы уже говорили о том, что в геноме человека экзоны суммарно составляют не более 1-3%. А это значит, что количество генов у высших может быть лишь в несколько раз больше, чем у микроорганизмов.

Увеличение сложности организации эукариот частично объясняется возникновением дополнительной системы регуляции, необходимой для

обеспечения тканеспецифичности экспрессии генов. Одним из последствий возникшей у эукариот прерывистой организации генов явилось широкое распространение альтернативного сплайсинга и альтернативной транскрипции. Это привело к появлению нового свойства у огромного числа генов - способности кодировать множественные функционально различающиеся изоформы белков. Таким образом, общее количество белков,

то есть размер протеома, у высших может быть в несколько раз больше количества генов.

У прокариот допустима внутривидовая изменчивость по числу генов, и

подобные различия между разными штаммами многих микроорганизмов, в

том числе и патогенных, могут составлять десятки процентов. При этом сложность организации различных видов микроорганизмов прямо коррелирует с числом и протяженностью кодирующих последовательностей.

Таким образом, фенотипическая внутри- и межвидовая изменчивость находится в строгой ассоциации с очень близкими по своим значениям размерами транскриптома и протеома. У эукариот число генов является жестко детерминированным видовым признаком, и в основе увеличения эволюционной сложности лежит иной принцип – дифференциальное многоуровневое использование различных компонентов ограниченного и достаточно стабильного протеома.

Секвенирование геномов нематоды и дрозофилы показало, что размеры протеомов у этих столь разных видов очень близки и лишь вдвое больше, чем у дрожжей и некоторых видов бактерий. Эта закономерность – значительное нарастание сложности организации различных форм жизни при сохранении или относительно небольшом увеличении размеров протеома – характерна для всей последующей эволюции вплоть до человека. Так,

протеомы человека и мыши практически не различаются между собой и по своим размерам менее чем в 2 раза превосходят протеомы круглого микроскопического червя нематоды или плодовой мушки дрозофилы. Более того, идентичность нуклеотидных последовательностей ДНК человека и

больших африканских обезьян составляет 98,5%, а в кодирующих областях достигает 99%. Эти цифры мало отличаются от значения 99,9%,

определяющего внутривидовое сходство по нуклеотидным последовательностям ДНК между различными индивидуумами, народами и расами, населяющими нашу планету. Так какие же изменения, составляющие не более 1,5% от всего генома, являются ключевыми для формирования человека? Ответ на этот вопрос, по-видимому, следует искать не только на геномном и протеомном уровнях.

Действительно, наряду с относительной стабильностью протеома, в

процессе эволюции происходит резкое увеличение размеров и сложности организации транскриптома эукариот за счет появления в геноме огромного количества транскрибируемых и не кодирующих ДНК, а также значительного расширения класса РНК-кодирующих генов. РНК, не кодирующие белки, главным источником которых служат интроны,

составляют подавляющую часть транскриптома высших организмов,

достигая 97-98% всех транскрипционных единиц. В настоящее время интенсивно анализируются функции этих молекул.

Таким образом, ключевые эволюционные изменения происходят на фоне увеличения размера генома, достаточно стабильного протеома и резкого увеличения размера транскриптома – рис. 31.

Рисунок 31. Эволюционные изменения, происходящие на трех

информационных уровнях При этом переход от простых форм жизни к более сложным очевидно

коррелирует с возникновением и широким распространением в геноме двух фундаментальных и в некоторой степени взаимосвязанных эволюционных приобретений: некодирующих ДНК и повторяющихся элементов. Прямым следствием этих изменений, происходящих на геномном уровне, является появление в процессе эволюции огромного количества не кодирующих белки РНК.

Какова же структурная основа этих эволюционных преобразований?

Все крупные эволюционные переходы: от прокариот к эукариотам, от простейших к многоклеточным, от первых животных к билатеральным и от примитивных хордовых к позвоночным, сопровождались резким увеличением сложности генома. По-видимому, такие скачки в эволюции являются результатом редких случаев удачного слияния целых геномов различных видов, принадлежащих дивергировавшим на значительное расстояние друг от друга систематическим классам. Так, симбиоз Archaea и Bacteria положил начало переходу от прокариот к эукариотам. Очевидно, что митохондрии, хлоропласты и некоторые другие органеллы клеток также появились в результате эндосимбиоза. Фундаментальное свойство высших эукариот – диплоидия – возникла вследствие хорошо отрегулированной геномной дупликации, которая совершалась около 500 миллионов лет назад.

Геномные дупликации в пределах вида происходили достаточно часто, и

примерами тому служат многочисленные случаи полиплоидии у растений,

грибов и даже иногда у животных. Однако потенциальными механизмами,

ведущими к возникновению в процессе эволюции принципиально новых форм жизни, являются не аутополиплоидии, а гибридизация и горизонтальный перенос или слияние геномов. Примечательно, что наиболее значительные эволюционные преобразования, сопровождающиеся слиянием целых геномов, происходят в экстраординарных условиях, в периоды крупных геологических переходов, таких как изменение концентрации кислорода в атмосфере, оледенение Земли или Кембрийский взрыв.

В относительно спокойных геологических условиях более значимыми для эволюции оказываются дупликации отдельных генов или хромосомных сегментов с их последующей дивергенцией. Сравнение нуклеотидных последовательностей секвенированных геномов показывает, что частота дупликаций генов достаточно высока и, в среднем, составляет 0.01 на ген за миллион лет. Подавляющее большинство из них не проявляют себя на протяжении последующих нескольких миллионов лет, и лишь в редких

случаях дуплицированные гены могут приобрести новые адаптивные функции. Тем не менее, многочисленный класс «молчащих» дупликаций генов служит своеобразным резервным фондом для рождения новых генов и образования новых видов. В геноме человека присутствует от 10 до 20 тысяч копий процессированных генов, возникших путем ретропозиции мРНК.

Большинство из них относятся к классу псевдогенов, то есть они не экспрессируются либо из-за присутствия мутаций, либо из-за инсерции в транскрипционно неактивные районы генома. Однако часть таких генов активна, причем характер их экспрессии и даже функции могут быть иными,

чем у генов-основателей.

Особую роль в эволюции приматов и человека играют сегментные дупликации , относящиеся к классу низкокопийных повторов (LCR) и

возникшие менее 35 миллионов лет назад. Эти последовательности представляют собой высоко идентичные блоки ДНК, варьирующие по величине от одной до нескольких сотен килобаз. Чаще всего сегментные дупликации локализуются в перицентромерных или теломерных районах различных хромосом, и суммарно они занимают около 5% генома человека.

В других секвенированных геномах сегментные дупликации не обнаружены.

Минимальный модуль сегментной дупликации, получивший название дупликон, содержит фрагменты неродственных непроцессированных генов, и

это отличает его других известных типов повторяющихся последовательностей. При определенных условиях дупликоны могут служить источниками создания новых химерных транскрибируемых генов или семейств генов из различных комбинаций представленных в них кодирующих экзонов. По некоторым оценкам от 150 до 350 генов могут различать геномы шимпанзе и человека.

Не умаляя значения для видообразования фактов появления новых и исчезновения старых кодирующих последовательностей, следует подчеркнуть реальную возможность существования иных механизмов,

играющих определяющую роль в эволюции эукариот.

Одним из движущих механизмов эволюции являются мобильные элементы, найденные у всех исследованных в этом отношении видов.

Изменения генома, сопровождающие процесс видообразования, могут включать обширные реорганизации кариотипа, локальные хромосомные перестройки, дупликации семейств генов, модификации отдельных генов,

сопровождающиеся их рождением или утратой, а также различия в экспрессии генов, регулируемые как на уровне транскрипции, так и на уровнях сплайсинга или трансляции. Мобильные элементы имеют непосредственное отношение ко всем этим процессам.

В некоторых случаях мобильные элементы сами несут последовательности, кодирующие ферменты, присутствие которых необходимо для осуществления транспозиции ДНК или ретропозиции РНК.

Подобные последовательности присутствуют в геноме ретровирусов, LTR-

элементов и транспозонов. К числу ретротранспозонов относится и наиболее многочисленный класс мобильных элементов – Alu-повторы. Впервые Alu-

повторы появляются у приматов около 50-60 миллионов лет назад из небольшого РНК-кодирующего гена. В процессе дальнейшей эволюции происходит дивергенция и мощная амплификация этого семейства. Переход от приматов к человеку сопровождается взрывообразным нарастанием числа

Alu-повторов, количество копий которого по некоторым оценкам достигает

1,1 миллиона. Alu-повторы занимают около 10% генома человека, но их распределение неравномерно, так как они в большей степени ассоциированы с генами. Эти элементы редко присутствуют в кодирующих экзонах и достаточно часто обнаруживаются в интронах и в не кодирующих районах мРНК, оказывая влияние на стабильность этих молекул и/или эффективность трансляции. Присутствие Alu-последовательностей в интронных областях генов может сопровождаться изменением характера процессинга преРНК, так как эти последовательности содержат районы, гомологичныедонорным иакцепторным сайтам сплайсинга. При инсерции Alu-элементов в регуляторные районы гена может нарушаться транскрипция, следствием чего

Команда исследователей из Университетов Чикаго, Висконсина и Небраски-Линкольна опровергла одну из классических гипотез эволюционной адаптации на примере плодовой мухи дрозофилы обыкновенной (Drosophila melanogaster ). В 20 веке эти мушки стали одним из основных модельных организмов для биологии развития и с тех пор часто используются в генетических экспериментах.

Учёные синтезировали древнюю версию одного из генов этого вида и создали трансгенных насекомых (то есть с генами, которые не могут быть приобретены в результате естественного скрещивания). Эксперименты с ними показали, что приспособление мушек к меняющимся условиям среды в ходе развития вида происходило не так, как считалось ранее. (Конкретный пример с пояснением приведём чуть ниже.)

"Одна из главных целей современной эволюционной биологии - определить, какие гены позволили видам . Но это сложно сделать напрямую, потому что мы не можем провести тесты и оценить влияние древних генов на биологию животных, — рассказывает Мо Сиддик (Mo Siddiq) из Чикагского университета. - Мы поняли, что можем решить эту проблему с помощью двух недавно разработанных методик - статистической реконструкции древних нуклеотидных последовательностей и создания трансгенных организмов ".

Проще говоря, биологи решили сначала "открутить время назад", чтобы понять, какими были гены плодовых мушек ранее, затем синтезировать один из них и внедрить его в геном насекомого, чтобы посмотреть, как при этом изменится его жизнь.

Когда учёные изучают адаптацию на уровне молекул, анализ последовательностей нуклеотидов в ДНК помогает им выявить так называемые следы отбора, указывающие на быстрое изменение гена в прошлом. Однако такие прописанные в геноме доказательства можно считать лишь косвенными, ведь причин для эволюции генов может быть очень много, и они необязательно связаны с изменившимися условиями среды, к которой приспосабливался организм. Соответственно, первого метода, упомянутого Сиддиком выше, недостаточно.

В ходе нового исследования учёные попробовали напрямую оценить влияние эволюции генов на адаптацию, добавив к первому методу второй. Руководитель работы Джо Торнтон (Joe Thornton) в своих предыдущих исследованиях уже использовал метод статистического восстановления нуклеотидных последовательностей, опираясь на обширные базы данных о строении геномов современных организмов, синтезировал их и анализировал молекулярные свойства полученных генов в лабораторных условиях.

Он и предположил, что генная инженерия и реконструкция древних генов вместе смогут показать, как изменение генома могло повлиять на организм в целом.

"Эту методику создания древней версии животных можно применять при изучении разных аспектов эволюции, — отмечает Торнтон. - Для первого эксперимента мы выбрали классический пример адаптации - плодовую мушку, которая в процессе эволюции приобрела способность , содержащиеся в гниющих фруктах. Мы обнаружили, что широко распространённая гипотеза о механизмах эволюции плодовых мушек просто-напросто неверна".

Поясним, что в дикой природе D. melanogaster питается продуктами брожения плодов (мелкие насекомые часто появляются и быстро размножаются там, где лежит видавший виды фрукт). Они способны переносить более высокие концентрации спиртов, чем их ближайшие родственники, которые питаются другими продуктами.

Двадцать пять лет назад биологи Чикагского университета Мартин Крейтман (Martin Kreitman) и Джон Макдональд (John McDonald) разработали свой статистический метод выявления следов отбора, который и сегодня остаётся одним из наиболее широко используемых методов. Они продемонстрировали его состоятельность на примере гена алкогольдегидрогеназы (ADH). Этот ген кодирует фермент, который расщепляет этанол в клетках печени.

Крейтман и Макдональд обнаружили в нуклеотидной последовательности ADH следы отбора, а поскольку им было известно, что организм плодовой мушки расщепляет спирты быстрее сородичей, учёные предположили, что именно кодируемый ADH фермент помог мушке приспособиться к высоким концентрациям спирта. В итоге данная работа стала первым признанным научным сообществом случаем, когда специфический ген повлиял на адаптивную эволюцию вида.

Теперь же исследователи из США решили проверить гипотезу при помощи других технологий. Они смоделировали варианты нуклеотидных последовательностей гена до и после того, как плодовая мушка приобрела толерантность к этанолу (около 2-4 миллионов лет назад). Затем учёные синтезировали эти гены, инициировали их экспрессию и проверили способность полученных белков расщеплять спирты. В результате выяснилось, что изменения, которым геном плодовой мушки подвергся в процессе эволюции, не оказали особого влияния на работу фермента.

Тогда учёные встроили "древнюю" форму гена ADH в геном современных плодовых мушек и вывели тысячи модифицированных насекомых, чтобы проверить, как быстро они будут расщеплять этанол и сколько смогут прожить, если будут питаться гниющими плодами с высоким содержанием спиртов.

Эксперименты показали, что плодовые мушки с более древней формой гена ADH перерабатывали этанол не хуже, чем насекомые с "последней версией" гена. Более того, они точно так же взрослели и размножались, питаясь едой с высоким содержанием спиртов.

Таким образом, классическая гипотеза не подтвердилась, точнее, вид D. melanogaster действительно приспособился к богатой спиртами пище в процессе эволюции, однако изменения в ферменте алкогольдегидрогеназы с этим не связаны, делают вывод учёные.

Как поясняет Торнтон, гипотезу о влиянии гена ADH в своё время приняли, потому что экология, физиология и статистические следы селекции указывали в одном направлении.

"Но косвенные доказательства не означают, что предположение обязательно верно. Вот почему теперь, когда технологии дали нам такую возможность, мы хотели непосредственно проверить эту гипотезу", — добавляет он.

Команда исследователей из США надеется, что новая методика получения организмов с более древними версиями генов станет так называемым золотым стандартом в этой области и в будущем поможет точно определять, какие генетические изменения влияли на эволюционные особенности организмов.

Более подробно работа американских генетиков описана в научной статье , опубликованной в журнале Nature Ecology & Evolution.

Напомним, что ранее мы рассказывали о том, как глубоководные водоросли заставили учёных , а эволюционная адаптация . Кроме того, возможности ультрабыстрой эволюции недавно продемонстрировали и .

Ранее биологи изучали формы и функции организмов, переходя от изучения целого к изучению частей живого – органов и тканей. Современная биология изучает части – гены и молекулы, пытаясь воссоздать картину их функционирования в целом организме. Появилась новая наука – геномика . Объектом ее является совокупность всей генетической информации организма – геном. Работа генов определяет, какие белки синтезируются в клетке. Именно от разнообразия и активности белков зависят молекулярные процессы, обеспечивающие жизнь клетки и организма. Установление и характеристика полного набора белков данного организма относится к компетенции еще одного нового направления биологии – протеомики (от protein – белок).

В настоящее время число генов в геноме человека оценивается примерно в 30 тыс. Большинство генов в каждой клетке «молчит». К постоянно работающим во всех клетках относятся гены, кодирующие компоненты аппарата синтеза белка, РНК, ферменты, занимающиеся синтезом и починкой ДНК, ферменты системы обеспечения энергией и другие компоненты, необходимые для ведения «домашнего хозяйства» клетки. В геноме человека заведуют «домашним хозяйством» около одной пятой всех генов. Среди остальных есть гены, работающие только на определенных этапах развития организма, – например, те, которые кодируют эмбриональные белки или обеспечивают лактацию. Другие работают лишь в немногочисленных клетках. Так, способность воспринимать запахи связана с обонятельными рецепторами. Всего найдено около 1 тыс. генов, кодирующих рецептор, и в каждой клетке обонятельной луковицы работает только один ген. К удивлению исследователей, оказалось, что некоторые из этих генов работают и в сперматозоидах (предположительно, потому, что им надо как-то в темноте ориентироваться).

Можно сказать, что в каждой клетке «звучит» свой аккорд генов, определяя спектр синтезируемых на них видов РНК, кодируемых матричной РНК белков и, соответственно, свойства клетки. Набор активных генов различается в зависимости от типа ткани, периода развития организма, полученных внешних или внутренних сигналов.

В генетическом коде перед началом гена находятся промоторы – специальные регуляторные последовательности, которые включают и выключают гены в зависимости от полученных клеткой сигналов. Клетка прекрасно «понимает», когда и какой участок генетического текста надо считывать, реализуя записанную в нем информацию. Более 20 лет назад была расшифрована структура регуляторных участков в ДНК бактерий. С тех пор ученым удалось многое понять в работе генов.

Бурное развитие геномики связано, с одной стороны, с совершенствованием методов секвенирования ДНК, т.е. определения в ней последовательности (англ. sequence – последовательность) нуклеотидов. С другой стороны, лавинообразный рост объема накопленных данных вызвал развитие компьютерных технологий анализа информации, записанной в ДНК. Сейчас изучают уже не отдельные фрагменты ДНК, а целые геномы десятков бактерий, дрожжей, червя-нематоды, мухи дрозофилы.

Конечно же, наибольшие ожидания связаны с изучением генома человека, направленным на выявление нуклеотидных последовательностей всех генов человека, установление их функций и взаимодействий в норме и при нарушениях, приводящих к болезням.

Однако сам по себе нуклеотидный текст – только лишь исходный материал для дальнейшего анализа и выявления в нем генов. Необходимо понять, когда и какие фрагменты ДНК-текстов переписываются в набор молекул РНК, какие белки при этом синтезируются, как меняется при этом структура и функция клетки.

Кроме понимания фундаментальных законов жизни открытия геномики приносят заметную практическую пользу. Фармацевтические компании вкладывают огромные средства в геномные исследования. И не зря. Геномика уже многое дала медицине. А по предсказанию Френсиса Коллинза, возглавляющего американскую программу исследования генома человека, через 40 лет лечение самых различных недугов будет основано на использовании синтетических генных продуктов, которые будут изменять работу заболевших клеток и органов в нужном для выздоровления направлении.

Компьютерные эксперименты

В течение 100 лет изучение генов было основано на экспериментах in vivo (в живой клетке) и in vitro (в пробирке). Появившиеся в 1960-х гг. компьютеры были лишь вспомогательным средством для обработки и хранения данных. С конца 1980-х гг. началось создание баз данных, в которых хранится информация о миллионах последовательностей нуклеотидов в ДНК и РНК или аминокислот в белках. Компьютерный анализ превратился в самостоятельную область науки – биоинформатику . Исследования in silico , т.е. в компьютере, уже привели к расшифровке многих «слов» генетического текста – команд, записанных в ДНК и управляющих жизнью клетки.

Для такой расшифровки используют специально разработанные программы, например, для статистического анализа распределения нуклеотидов в ДНК. Напомним, что в генетическом алфавите всего четыре буквы – А (аденин), Т (тимин), Г (гуанин) и Ц (цитозин). Любители подсчета буковок выяснили, сколько может идти подряд букв А или как часто Г встречается после Ц в ДНК бактерий или человека.

В «осмысленных», т.е. кодирующих, участках ДНК эти сочетания подчиняются определенным правилам, тогда как в промежутках между генами, там, где ничего существенного в ДНК не записано, частота сочетаний нуклеотидов близка к случайной. Похоже на правила грамматики, которые мы учили в школе: «жи , ши пиши через и ». В словах русского языка буква «ы» после «ж» не встречается (разве что в тетрадях двоечников). Так же и в генетических текстах – в кодирующих участках некоторые сочетания нуклеотидов практически не встречаются, а распределение других сочетаний сильно отличается от случайного. Это видно при подсчете распределения триплетов, кодирующих аминокислоты, в генах излюбленного объекта генетиков – кишечной палочки (см. таблицу на с. 11). У кишечной палочки, так же как и у других организмов, всего имеется 64 триплета. Три из них – ТАА, ТАГ и ТГА – не кодируют аминокислоты, а являются сигналом окончания (терминации) синтеза белка.

Одна и та же последовательность ДНК может быть прочитана тремя способами со сдвигом на один нуклеотид. Способ чтения называется рамкой считывания . Понятно, что терминирующие триплеты не встречаются внутри гена в кодирующей рамке считывания (в других рамках они могут встречаться, но никому там не мешают – они не читаются, если молекулярная машина не собьется). Кодирующие триплеты распределены внутри гена по-разному. Триплет ЦТГ встречается примерно в 10 раз чаще, чем триплет ЦТА, хотя оба они кодируют одну и ту же аминокислоту – лейцин. В межгенных промежутках такие различия частот не наблюдаются.

Такие подсчеты, называемые статистическими методами анализа нуклеотидных последовательностей, позволяют распознать участки генома с определенными свойствами. Например, у бактерий большинство болезнетворных генов находится в так называемых островках патогенности, которые отличаются от остального генома по частоте встречаемости пар нуклеотидов А–Т и Г–Ц.

Где искать гены?

У бактерий выявить гены относительно легко. Во-первых, они занимают 80–90% бактериального генома, так что вероятность попасть в ген гораздо больше, чем промахнуться. Во-вторых, кодирующий участок бактериального гена – это непрерывная открытая рамка считывания, так что если ученому удалось найти в сплошной цепочке букв начало бактериального гена, то он будет читать его, как и клетка, триплетами до самого конца, пока не наткнется на стоп-кодон.

Гены высших организмов, в том числе и человека, искать намного труднее. У человека на участки, кодирующие белки, приходится только 5% генома. При этом кодирующие участки идут не сплошь, как у бактерий, а прерываются вставочными последовательностями – интронами, которые после синтеза матричной РНК из нее вырезаются. Ген может содержать до нескольких десятков кодирующих фрагментов – экзонов, чередующихся с интронами. К тому же в разных клетках могут использоваться разные сочетания экзонов одного и того же гена.

На основе статистического анализа можно с определенной долей вероятности установить, к какому участку генома относится исследуемый фрагмент. Подобно тому, как, включив телевизор и услышав слова «В отличие от обычного средства» или «Дешевле только даром», вы сразу поймете, что попали на рекламный ролик. Эти словосочетания в других передачах почти не встречаются. Так и определенные сочетания нуклеотидов указывают на принадлежность анализируемого куска генетического текста к интрону или экзону, кодирующему белок. Границы интронов и экзонов обозначены в ДНК специальным сочетанием нуклеотидов.

Без компьютерных биоинформационных технологий развитие геномных исследований было бы невозможным. Компьютерный поиск генов особенно важен для исследования генома человека, т.к. методы классической генетики имеют в этом случае ограниченное применение – ведь человек, в отличие от мух-дрозофил, не может быть объектом искусственного мутагенеза или иных генетических экспериментов.

Однако результаты экспериментов, поставленных на животных, могут быть применимы и к человеческому геному. Наиболее важные участки генома относительно мало изменяются в процессе эволюции, и их функции, установленные в экспериментах на мышах или мухах, оказываются такими же и у человека. Компьютерный анализ генетических текстов разных организмов позволяет выявить такие сходные участки.

Медленнее всего меняются участки, кодирующие белки. В наиболее важных белках отдельные участки сохранялись неизменными на протяжении миллиардов лет эволюции – от бактерий до человека. Это дает возможность находить гены при сравнении геномов отдаленно родственных видов. Таким анализом занимается сравнительная геномика. Ее методы используют для выявления родства отдельных генов, родства организмов, установления происхождения видов и более крупных таксонов.

Если сравнивать геномы человека и дрозофилы, то легко выявить гены, т.к. у неродственных организмов более заметна разница между значимыми (медленно меняющимися) и незначимыми участками. Но часть человеческих генов не похожа на мушиные, и выявить их при таком сравнении не удается. У нашей более близкой родственницы – мыши – почти такой же набор генов, как и у человека. Однако сохранение сходства в некодирующих областях создает трудности при выявлении генов сравнительными методами. т.е. выбирать организм для сравнения надо в зависимости от конкретной задачи.

А вот гены шимпанзе почти идентичны человеческим. Генетический текст шимпанзе отличается от нашего в среднем одним нуклеотидом из 300. Так что сравнение генома человека с обезьяньим нельзя использовать для выявления генов. Однако если гены уже известны, то существенные различия между человеком и шимпанзе скорее всего связаны именно с теми генами, которые делают нас людьми. Поэтому, как сообщил недавно журнал Science , в Германии начат проект «Геном шимпанзе».

Сравнительная геномика позволяет по известным функциям генов мухи или червя-нематоды предсказывать функции генов человека. А выявленные у человека гены, работа которых нарушена при тех или иных заболеваниях, могут быть изучены на других животных. Например, у человека найдены гены, мутации в которых приводят к болезни Альцгеймера – одной из форм старческого слабоумия. Оказалось, что изучать действие этих генов и искать способы лечения можно в экспериментах на мухах. Мутации в генах мухи приводят к изменениям в мушиных мозгах, очень сходным с молекулярными нарушениями, происходящими в мозге пациентов с болезнью Альцгеймера. У «слабоумных» мух нарушается способность к запоминанию. Ведется поиск генов мух, связанных с нарушениями памяти, и препаратов, способных замедлить развитие болезни, – сначала у мух, а потом, надо надеяться, и у людей. Важные для медицины и промышленности результаты дали исследования целых геномов бактерий. Уже полностью прочитаны геномы нескольких десятков бактерий. Среди них, кроме уже упоминавшейся кишечной палочки, возбудители социально значимых инфекций – туберкулеза, сифилиса, возбудители тифа, гастрита, некоторые промышленно важные бактерии. Практически все гены в изученных бактериальных геномах выявлены, для многих известны функции белкового продукта. По известным функциям белков проводят реконструкцию обмена веществ – метаболических путей бактерии. Реконструкция основных метаболических процессов организма по последовательности нуклеотидов его генома – одна из важнейших задач геномных исследований. Эту область исследований назвали труднопроизносимым словом метаболомика .

Анализ полной последовательности нуклеотидов генома микобактерии – возбудителя туберкулеза – показал, что у бактерии имеются жизненно важные для нее ферменты, отсутствующие у человека. Поиск лекарств, действующих именно на эти ферменты, обещает переворот в борьбе с инфекцией, уносящей миллионы человеческих жизней.

Перспективы биоинформатики

Экспериментальный поиск одного гена занимает недели и месяцы работы целой лаборатории. Компьютерные методы позволяют сделать это за считанные минуты, если просеквенирована ДНК организма и если есть хорошие алгоритмы поиска. Созданием таких алгоритмов и занимаются специалисты по биоинформатике. Различные программы используют для поиска генов, поиска регуляторных сигналов в ДНК, предсказания структуры и функций белка, его локализации в клетке, для реконструкции метаболизма. Реконструкция метаболических реакций, происходящих в разных клетках и тканях, будет одним из следствий расшифровки генетической информации человека.

Надо отметить, что российская биоинформатика не отстает, а зачастую и опережает мировую. Так, именно российские ученые предложили использовать одновременно несколько разных взаимоподдерживающих алгоритмов анализа последовательностей. Каждая из существующих программ по отдельности ошибается достаточно часто. Но если использовать несколько таких «слабых» программ одновременно, то там, где их предсказания совпадут, обнаружится истина. Например, человеческие гены удается неплохо предсказывать, если одновременно учитывать статистическое распределение нуклеотидов, сигналы сплайсинга и частоту использования кодонов.

Геномные исследования в России развиваются, несмотря на все трудности, с которыми сталкивается наука в нашей стране. И России они необходимы так же, как и другим странам.

Любая биологическая система стремится к поддержанию стабильности своего существования. Даже березовая роща контролирует внутренние условия – в ней и температура воздуха, и освещенность, и влажность воздуха отличаются от окружающих. Со всех видов естественный отбор собирает суровую дань, уничтожая носителей неблагоприятных мутаций, – это плата за приспособленность вида в целом.

К улучшению своей породы люди стремились во все времена. В древней Спарте сбрасывали «неудавшихся» младенцев со скалы. В 1930-х гг. в США с той же целью около 100 тыс. человек было подвергнуто принудительной стерилизации – с точки зрения генетики бессмысленной, т.к. подобные меры не снижают частоты проявления наследственных заболеваний в следующем поколении. В начале третьего тысячелетия человечество стремится взять под контроль собственные генетические процессы и вносить коррективы не ценой жизни носителя неблагоприятных мутаций, а подправляя их генетические тексты с учетом результатов исследований генома человека.

Таблица. Триплетный код (в скобках указана средняя частота встречаемости данного кодона на 1 тыс.) в геноме кишечной палочки

ТТТ (22) Фенилаланин
ТТЦ (16) Фенилаланин
ТТА (14) Лейцин
ТТГ (13) Лейцин
ТЦТ (10) Серин
ТЦЦ (9) Серин
ТЦА (8) Серин
ТЦГ (9) Серин
ТАТ (16) Тирозин
ТАЦ (12) Тирозин
ТАА (2) стоп
ТАГ (0,3) стоп
ТГТ (5) Цистеин
ТГЦ (6) Цистеин
ТГА (1) стоп
ТГГ (14) Триптофан
ЦТТ (11) Лейцин
ЦТЦ (11) Лейцин
ЦТА (4) Лейцин
ЦТГ (50) Лейцин
ЦЦТ (7) Пролин

ЦЦЦ (5) Пролин
ЦЦА (9) Пролин
ЦЦГ (22) Пролин
ЦАТ (13) Гистидин
ЦАЦ (10) Гистидин
ЦАА (15) Глутамин
ЦАГ (29) Глутамин
ЦГТ (21) Аргинин
ЦГЦ (21) Аргинин
ЦГА (4) Аргинин
ЦГГ (6) Аргинин
АТТ (30) Изолейцин
АТЦ (24) Изолейцин
АТА (6) Изолейцин
АТГ (27) Метионин
АЦТ (10) Треонин
АЦЦ (23) Треонин
АЦА (8) Треонин
АЦГ (14) Треонин
ААТ (19) Аспарагин
ААЦ (22) Аспарагин

ААА (35) Лизин
ААГ (12) Лизин
АГТ (9) Серин
АГЦ (16) Серин
АГА (3) Аргинин
АГГ (2) Аргинин
ГТТ (19) Валин
ГТЦ (15) Валин
ГТА (11) Валин
ГТГ (25) Валин
ГЦТ (16) Аланин
ГЦЦ (25) Аланин
ГЦА (21) Аланин
ГЦГ (32) Аланин
ГАТ (32) Аспарагиновая к-та
ГАЦ (19) Аспарагиновая к-та
ГАА (39) Глутаминовая к-та
ГАГ (18) Глутаминовая к-та
ГГТ (25) Глицин
ГГЦ (28) Глицин
ГГА (9) Глицин
ГГГ (11) Глицин