бесплатно рефераты
 

Продукты рекомбинации: характеристика и манипулирование

b>Компьютерный анализ нуклеотидных последовательностей ДНК

Простота разделения сегментов ДНК путем клонирования и их последующий анализ позволили определить нуклеотидную последовательность многих ДНК. Но хотя стремление биологов к получению точных в химическом отношении данных продолжало стимулировать эти исследования, информация оказывалась бесполезной, если не были выявлены какие-то особенности этих последовательностей. На первый взгляд длинные ряды оснований кажутся совершенно загадочными и не поддающимися расшифровке. К счастью, проблему расшифровки можно решить с помощью высокоэффективных компьютерных программ и для рутинного использования имеются программы на нескольких стандартных компьютерных языках. Возможности различных программ в значительной степени перекрываются. Их можно использовать при работе как на больших компьютерах, так и на мини - и микрокомпьютерах. Вообще говоря, эти программы пригодны для поиска как структурных, так и биологических особенностей последовательностей.

а. Хранение информации о первичной структуре

Для ввода и хранения данных о последовательностях и последующего поиска, проводимого исследователем вручную или с помощью специальной аналитической программы, используются стандартные процедуры редактирования. Большинство этих процедур предусматривают также возможность коррекции хранящейся информации. Ввод данных часто осуществляют путем типирования последовательности в компьютерном терминале после прочтения и регистрации данных секвенирующего геля. Однако имеются также программы для прямого ввода исходных данных. В принципе такие программы позволяют свести к минимуму ошибки, допускаемые при неправильном считывании гелей или неточной регистрации данных. Существует два подхода к такой автоматизации. В первом случае детектор автоматически сканирует радиоавтографы и передает данные непосредственно в компьютер. Во втором данные автоматически регистрируются от сенсора, управляемого вручную. При втором подходе исследователь является арбитром при любых затруднениях.

б. Структурный анализ

Первичная структура. Если имеются данные о нуклеотидной последовательности одной цепи, то большинство программ позволяют построить комплементарную цепь, вычислить нуклеотидный состав, выявить участки, богатые пуринами, пиримидинами или определенными сочетаниями оснований, и определить частоту встречаемости различных динуклеотидов. Могут быть выявлены специфические субпоследовательности в пределах определенного сегмента, что часто используется для нахождения сайтов для рестриктирующих эндонуклеаз. В программу введена информация о сайтах узнавания для известных ферментов, и по одной команде выдаются сведения о положении этих сайтов для каждого из ферментов, числе ожидаемых фрагментов, образующихся при расщеплении ими ДНК, размере каждого фрагмента в парах оснований и его процентном отношении к общей длине сегмента, а также о нуклеотидных остатках, соответствующих концам каждого фрагмента. Существуют также программы, которые могут предсказать, какие продукты будут получены при совместном действии двух или нескольких эндонуклеаз. При этом предсказания делаются как для линейных, так и для кольцевых молекул. Полученная информация может использоваться для подтверждения данных секвенирования путем сравнительного анализа ожидаемого и реального результатов действия эндонуклеаз.

Имеющиеся программы осуществляют также поиск характерных особенностей последовательностей, включая прямые и обратные повторы. Выявляются не только полностью совпадающие сегменты, но и сегменты с той или иной степенью несовпадения; для этого допускаются определенные отклонения параметров, заложенных в программу, от фиксированного значения. В примере перечислены все повторы длиной не менее шести пар оснований и гомологичные не менее чем на 75%. Предполагается, что максимальный размер образующихся петель равен двум основаниям.

Можно получить данные о гомологии или частичной гомологии различных последовательностей. Эти данные могут касаться структуры одного и того же гена у двух разных организмов или родственных генов одного организма. Такой сравнительный анализ широко используется при изучении эволюции на молекулярном уровне. Для сравнения двух последовательностей между собой или одной последовательности с группой других последовательностей разработаны специальные алгоритмы. Может использоваться описанный ранее вероятностный анализ. По результатам сравнения информации о последовательностях, полученной в разных лабораториях, был создан центральный банк данных, из которого всегда можно затребовать информацию о тех или иных последовательностях. К 1989 г. в банках имелась информация о последовательностях более 20 миллионов пар оснований, представляющая данные о многих генах и организмах.

Помимо этого общего применения, обнаружение сходства различных последовательностей является составной частью секвенирования очень длинных последовательностей с помощью дидезокси-метода, объединенного с клонированием в фаге М13. Используя компьютер для обнаружения перекрывающихся последовательностей, мы не только делаем работу менее утомительной, но и можем быстро решить, следует ли нам пытаться получить дополнительные данные.

Вторичная структура. Разработаны программы, позволяющие предсказать стабильную внутримолекулярную вторичную структуру одноцепочечных РНК или ДНК. Они позволяют, например, построить модель укладки цепи тРНК и рРНК, и многие из таких моделей получили экспериментальное подтверждение в опытах с использованием нуклеаз, специфичных к одноцепочечным участкам. Расчеты основаны на предположениях о вероятности образования определенных пар оснований, на термодинамических свойствах разных пар оснований и данных о стабильности спирали.

в. Биологическое значение

С помощью компьютерных программ можно перевести информацию с языка нуклеотидов на язык аминокислот в соответствии с правилами генетического кода. При этом указываются все три возможные рамки считывания и стоп-кодоны трансляции. В тех случаях, когда аминокислотная последовательность кодируемого полипептида известна, идентифицировать правильную рамку считывания не составляет труда. В противном случае правильную рамку можно выбрать, исходя из ее длины. Рамки, в которых часто встречаются стоп-кодоны, вряд ли могут считаться правильными. Показаны часть генома SV40, кодирующая участок вблизи г\ГИ2-конца малого и большого Т-антигенов, и полученные с помощью компьютера аминокислотные последовательности для всех трех рамок считывания. Правильной является третья рамка. Можно также рассчитать частоту, с которой встречается каждый кодон, и таким образом выявить предпочтительные кодоны для определенных аминокислот. Обращение этой процедуры позволяет воссоздать возможные нуклеотидные последовательности, исходя из известной аминокислотной последовательности полипептида, хотя эта задача не имеет однозначного решения вследствие вырожденности генетического кода. Центральный банк данных содержит информацию об аминокислотных последовательностях всех проанализированных полипептидов, что позволяет сравнивать последовательности изучаемого и известных белков.

С помощью компьютеров можно вести поиск специфических нуклеотидных последовательностей, например промоторов или участков связывания с рибосомами. Они позволяют также обнаружить последовательности со специфическими свойствами. Например, наличие сходных последовательностей в разных неродственных во всех других отношениях генах или вблизи них наводит на мысль об их возможной регуляторной роли. Точно так же присутствие гомологичных последовательностей в кодирующих областях различных генов может свидетельствовать об общности эволюционного происхождения этих генов. Данный вопрос детально рассмотрен в ч. III книги. Однако важно осознавать, что статистический анализ еще не является достаточным для того, чтобы делать вывод о биологической роли той или иной последовательности. Об этом можно говорить только после проведения независимого биологического исследования.

Определение положения клонированных сегментов в геномах

В идеале установление положения клонированного сегмента ДНК означает определение фланкирующих его последовательностей и того хромосомного сайта, по которому этот сегмент был включен в хромосому. Конечная цель такого картирования состоит в полном описании структуры хромосомы.

а. Молекулярная локализация

Характеристика клонированного сегмента. Прежде всего необходимо доказать, что клонированный сегмент действительно является репликой определенного геномного сегмента. Существует ли в геноме гомологичный сегмент с точно так же расположенными сайтами для рестриктирующих эндонуклеаз? Этот вопрос имеет важное значение, поскольку во время репликации в системе хозяин-вектор иногда происходит клонирование случайных последовательностей, образовавшихся в результате рекомбинаций, делеций или мутаций. Основной подход состоит в использовании клонированной ДНК в качестве зонда для анализа продуктов эндонуклеазного расщепления суммарной геномной ДНК, из которой произошел данный клонированный сегмент. Такой подход аналогичен описанному в разд.6.1. б с тем отличием, что зондом в данном случае является клонированная вставка, меченная 32Р. В эксперименте Б, клонированный зонд представлял собой субклонированный сегмент овальбуминового гена; материал, подвергнутый электрофорезу, - это coRI-гидролизат ДНК курицы. С зондом гибридизовался материал только одной полосы, представляющий собой фрагменты длиной 2,35 т.п. н. Этот эксперимент показывает, что 1) клонированная вставка в самом деле является фрагментом ДНК курицы;

2) в геноме гибридизующийся сегмент расположен между двумя EcoRI-сайтами, находящимися друг от друга на расстоянии 2,35 т.п. н.;

3) ни один из фрагментов любого другого размера не гибридизуется с зондом. Таким образом, клонированный фрагмент длиной 2,35 т.п. н., по-видимому, представляет собой истинную геномную последовательность и два аллеля в диплоиде являются идентичными, поскольку локализация этих EcoRI-сайтов совпадает.

Еще одна последовательность овальбуминового гена обнаружена в EcoRI-фрагменте длиной 1,8 т.п. н. После того как он был клонирован и использован в качестве зонда для анализа EcoRI-гидролизата ДНК курицы, были обнаружены три гибридизующихся фрагмента длиной 1,8; 1,3; 0,5 т.п. н. соответственно. Эти данные свидетельствуют о неидентичности двух аллельных овальбуминовых генов. Один из них содержит дополнительный EcoRI-сайт, разделяющий фрагмент длиной 1,8 т.п. н. на две части. Интересно, что столь простая процедура лежит в основе генетического анализа. Наследование двух или более аллелей легко прослеживается с помощью эндонуклеазного расщепления, электрофореза, ДНК-блоттинга и гибридизации между соответствующим зондом и ДНК, выделенной из разных источников. Единственным требованием является наличие полиморфных эндонуклеазных сайтов в аллелях любого гена или сегмента ДНК. Для проведения таких экспериментов достаточное количество ДНК можно получить из очень небольшого кусочка ткани или из нескольких миллилитров крови, поэтому метод может использоваться для анализа ДНК большинства видов, в том числе и человека.

Построение карты молекулы. Имея сравнительно короткие сегменты молекулы ДНК, такие, например, как ранее описанный субклонированный фрагмент длиной 2,35 т.п. н., можно построить детальную карту молекулы вплоть до установления ее нуклеотидной последовательности. Более длинные клонированные последовательности, подобные тем, которые присутствуют в Х-векторах или космидах, часто содержат несколько генов, а также другие сегменты ДНК, и могут использоваться для расширения карты. Так, субклонированный фрагмент овальбуминового гена длиной 2,35 т.п. н. служил зондом для поиска гомологичных последовательностей в космидной библиотеке, сконструированной из геномной ДНК курицы. Были отобраны две космиды с перекрывающимися последовательностями только в области зонда; вместе они составляли участок генома длиной 46 т.п. н., из которых 7,7 т.п. н. принадлежали самому гену овальбумина. Область, содержащая овальбуминовый ген, была идентифицирована благодаря образованию гетеродуплекса с овальбуминовой кДНК. Неожиданно обнаружилось, что два других участка сегмента длиной 46 т.п. н. также гибридизуются с овальбуминовой кДНК, хотя и в меньшей степени. При отжиге РНК из яйцевода курицы с космидами эти два участка гибридизовались также с двумя другими мРНК, отличными от овальбуминовой. Было высказано предположение, что в сегменте длиной 46 т.п. н. локализованы еще два гена, последовательность которых сходна с последовательностью гена овальбумина. Данное предположение получило подтверждение после проведения рестрикционного и гетеродуплексного анализа, а также после определения нуклеотидной последовательности. Эти два гена, обозначенные как X и Y, транскрибируются, как и овальбуминовый ген, в присутствии стероидных гормонов.

Методы, использующиеся при картировании овальбуминового гена и генов X и Y, лежат в основе широко распространенного подхода к построению детальных генетических карт, получившего название прогулки по хромосоме. Уникальный сегмент ДНК, примыкающий к одному из концов клонированного фрагмента, очищают и используют для зондирования библиотеки геномной ДНК. Одни гибридизующиеся клоны полностью перекрываются с исходным клонированным сегментом, другие же включают новые сегменты, в результате чего карта расширяется. При повторении этой процедуры совершается "прогулка" на большее расстояние. Данный метод не очень удобен для картирования тех геномов, которые содержат большое число рассеянных повторов, поскольку в этом случае трудно очистить уникальные последовательности, используемые в качестве зондов.

б. Хромосомная локализация

Классическое генетическое картирование основывается на получении определенных мутаций и анализе частот рекомбинаций. У Drosophila генетические карты удалось расширить и уточнить путем установления корреляций между генетическими данными и хромосомными аберрациями типа делеций, инверсий и транслокаций, которые визуально проявляются как изменения в характере исчерченности политенных хромосом. Однако подобные методы непригодны для анализа хромосом большинства растений и животных. Генетический анализ немногочисленных популяций с большим периодом генерации весьма затруднителен, поскольку политенность встречается редко, а хромосомы довольно многочисленны, имеют небольшие размеры и с трудом поддаются идентификации. Например, у млекопитающих установление корреляции между фенотипическими изменениями и делециями, транслокациями и инверсиями позволяет локализовать лишь ограниченное число генов в специфических хромосомах или отдельных их областях. С развитием методов получения клонированных сегментов ДНК были разработаны универсальные процедуры картирования, которые не зависят от фенотипического проявления мутаций. Удалось локализовать многие гены, в том числе и гены человека, в специфических областях хромосом.

Мы рассмотрим два наиболее распространенных метода. С помощью одного из них положение клонированного сегмента ДНК устанавливают по его способности гибридизоваться со специфическим участком в практически интактных хромосомах. Второй позволяет идентифицировать хромосому, которая несет определенную последовательность, путем гибридизации подходящего меченого зонда с гибридными клетками, содержащими различные наборы лишь из нескольких хромосом данного вида. В третьем методе, описанном во введении к ч. IV, используются клонированные фрагменты ДНК для выявления полиморфизма рестрикционных сайтов. Такой полиморфный маркер применяют затем в качестве генетического маркера для построения карт сцепления эукариотических хромосом - аналогично тому, как в классическом генетическом анализе используют фенотипические маркеры.

Картирование хромосом с помощью гибридизации. РНК-зонды или денатурированные ДНК-зонды могут гибридизоваться с соответствующими последовательностями денатурированной ДНК, входящими в состав хромосом с характерными морфологическими признаками. Положение радиоактивно меченного зонда определяют, нанеся на препарат, подготовленный для микроскопического исследования, чувствительную эмульсию; в том месте эмульсии, которое контактирует с гибридным участком, появляются темные зерна серебра. Проведя микроскопическое исследование всего препарата, можно локализовать зонд. Довольно точные данные удается получить в случае больших политенных хромосом Drosophila в основном благодаря тому, что положение темных областей можно соотнести с характером исчерченности хромосом.

Однако определение положения единичных генов в небольших и весьма многочисленных хромосомах растений и позвоночных путем гибридизации in situ затруднено по двум причинам. Во-первых, не всегда легко идентифицировать отдельные хромосомы.

Это зависит от их размера, положения центромеры и характерного рисунка из темных и светлых полос, образующегося после окрашивания фиксированных метафазных хромосом определенными красителями. Кроме того, сами полосы захватывают слишком большие отрезки ДНК. Например, 3"109 пар нулеотидов гаплоидного генома человека содержатся менее чем в 1000 различных полосах, а у растений это число даже меньше. В результате с помощью чувствительной эмульсии можно установить лишь, в какой области хромосомы находится интересующий нас сегмент. Более того, размер зерен серебра и его разброс уменьшают разрешающую способность примерно до 107 пар оснований.

Вторая проблема-чувствительность зондов. Масса одной копии фрагмента дуплексной ДНК длиной 1 т.п. н. составляет примерно 10-12 мкг. Радиоактивно меченные зонды, полученные с помощью ник-трансляции, редко имеют удельную радиоактивность, значительно превышающую 108 расп. /мин на 1 мкг. Гибридизация такого зонда с одним сопоставимым сегментом в хромосоме дает только 10-4 расп. /мин на 1 мкг, или примерно один распад в неделю. Чтобы достичь необходимой чувствительности, следует одновременно использовать несколько специальных приемов. Например, чтобы получить зонды с удельной радиоактивностью примерно 109 расп. /мин на 1 мкг, можно провести ник-трансляцию с использованием в качестве субстрата 1251-5-йодСТР. Гибридизацию следует проводить в присутствии декстрансульфата, что увеличивает скорость процесса примерно в 100 раз, в результате чего усиливается сигнал. Число зерен также может возрасти, если одноцепочечные последовательности векторной ДНК, которые сцеплены с гибридизуемой эукариотической последовательностью в клонированном зонде, будут в свою очередь гибридизоваться с избытком молекул зонда. Для увеличения числа зерен серебра можно увеличить время экспозиции до нескольких недель. Таким способом удается определить положение единичных копий генов в специфических, но весьма обширных областях хромосом млекопитающих.

Картирование хромосом, основанное на получении гибридных соматических клеток. Для локализации клонированного сегмента в определенной хромосоме используют межвидовые соматические гибриды. Обычно такие гибридные соматические клетки содержат полный набор хромосом одного вида и только одну или небольшое число хромосом второго вида. Чтобы судить о наличии данного гена в определенной донорной хромосоме, анализируют группу разных линий гибридных клеток и устанавливают корреляцию между присутствием тестируемого гена и наличием специфической хромосомы.

Гибридные соматические клетки образуются при 1) слиянии клеток двух разных видов;

2) слиянии клеток одного вида с мини-клетками другого, содержащими одну или несколько донорных хромосом;

3) трансфекции реципиентных клеток препаратом очищенных хромосом донора. Чтобы элиминировать неслившиеся донорные и реципиентные клетки, применяют соответствующие селективные условия. Например, донорные клетки могут проявлять чувствительность к определенным лекарственным веществам, а реципиентные клетки могут быть мутантами, растущими лишь в особых условиях. В присутствии таких препаратов и в среде HAT растут только гибридные клетки, несущие в донорной хромосоме функциональный ген тимидинкиназы.

Если отобранные гибридные клетки выращивать в неселективных условиях, то донорные хромосомы в конце концов утратятся в силу более или менее случайных причин. Но клоны гибридных клеток можно получить в любой момент и идентифицировать резидентные донорные хромосомы по характеру исчерченности, выявлению ранее картированных последовательностей ДНК или ферментативных маркеров либо с использованием всех трех методов. Таким способом можно получить банки различных линий гибридных клеток, каждая из которых содержит определенный набор донорных хромосом.

Альтернативный подход состоит в сохранении селективных условий. Поддерживая условия, благоприятные для данного гена, в течение многих клеточных генераций, можно получить линии клеток только с одной стабильной донорной хромосомой. Другой способ получения гибридных клеток с одной донорной хромосомой состоит в трансфекции препаратом, обогащенным этой хромосомой.

При конструировании гибридов возникает вопрос, какой из видов будет служить донором, а какой - реципиентом. Ответ на него обычно можно найти лишь экспериментальным путем. Как правило, гибридные клетки "человек-мышь" утрачивают хромосомы человека.

После идентификации чужеродных хромосом в соматических клетках гибридов используют три подхода, для того чтобы установить, присутствует ли тестируемый ген в определенной хромосоме. Первый основан на выявлении корреляции между наличием этой хромосомы и экспрессией тестируемого гена с образованием определенного продукта. Для этого измеряют ферментативную активность или выявляют взаимодействие со специфическими антителами; при этом необходимо, чтобы используемые методы позволяли различать продукты генов донорных и реципиентных клеток. Например, два белка-продукта генов могут иметь разную электрофоретическую подвижность, как, например, в случае галактокиназ грызунов и приматов. При втором подходе используют гибридизацию между клонированным зондом и набором хромосом гибрида in situ; этот подход имеет уже описанные ограничения. Третий и наиболее общий подход связан с идентификацией искомого гена путем отжига соответствующего ДНК - или РНК-зонда с ДНК, выделенной из гибридных клеток и перенесенной на нитроцеллюлозный фильтр. Отжиг с эндонуклеазными фрагментами часто позволяет выявить донорный ген во фрагментах, имеющих размеры, типичные для донорного генома, даже в тех случаях, если гены донора и реципиента являются перекрестно гибридизующимися. Поскольку трудно получить гибриды с одной донорной хромосомой, обычно исследуют целый набор гибридных клеток, которые содержат разные донорные хромосомы. Если этот набор достаточно обширен, то присутствие последовательности зонда обычно можно связать с присутствием определенной хромосомы.

Страницы: 1, 2, 3, 4


ИНТЕРЕСНОЕ



© 2009 Все права защищены.