Одним из важнейших процессов, который обеспечивает многообразие функциональных возможностей живых организмов, является транскрипционная регуляция. Большое количество отсеквенированных и аннотированных в последние годы геномов позволяет эффективно использовать методы компьютерной биологии для предсказания новых и детального изучения уже известных регуляторных систем.
Ключевым моментом транскрипционной регуляции является связывание одного или нескольких транскрипционных факторов со специфическими участками (ДНК-сайтами) в регуляторных областях гена. Как правило, участки связывания одного и того же транскрипционного фактора имеют схожую структуру, при этом несколько различаясь от одного регулируемого гена к другому. Наряду с тем фактом, что в ходе эволюции близкородственные организмы сохранили многие гены и регуляторные механизмы в малоизмененном виде, это дает возможность предсказывать потенциальные регуляторные сайты в новых геномах, а также исследовать механизмы транскрипционной регуляции в уже известных геномах.
Анализ регуляции экспрессии генов является важным разделом компьютерной генетики и системной биологии. Это связано с тем, что, с одной стороны, в настоящее время сравнительно легко осуществляется секвенирование геномов и эксперименты по анализу экспрессии на микрочипах, а с другой — использование этой информации для описания возможного фенотипа встречает трудности, обусловленные отставанием экспериментальной науки от темпов секвенирования.
Несмотря на значительный накопленный материал, многие детали регуляции не ясны до сих пор. В свете того, что экспериментальная проверка гипотез сложна и требует значительного количества времени и ресурсов, представляется целесообразным разработка и использование методов, которые позволяют перенести часть исследований в область комьютерной биологии. Подобные исследования дают возможность определять наиболее перспективные направления для дальнейшей экспериментальной проверки, а в некоторых случаях делать утверждения, практически равносильные результатам биологического эксперимента.
Изучение регуляции ответа на стресс тем более важно, что позволит координировать микробиологические исследования в области поиска новых антибактериальных агентов и техник дезинфекции. Изменчивость и лабильность бактериального генома позволяет патогенным организмам быстро приспосабливаться к уже разработанным антибиотикам и техникам дезинфекции, и исследования в этой области сохраняют актуальность в течение всего периода развития микробиологии и медицины. В частности, рассмотренные в данной работе регуляторные каскады общего стресса в группе Bacillus показывают связь нескольких бактериальных стрессовых регулонов с множественной лекарственной устойчивостью.
Быстрое развитие методов индустриальной биоинженерии также требует всестороннего изучения изменения клеточных процессов в необычных для клетки условиях биотехнологического процесса. Новое направление в микробиологии ставит своей задачей разработать методики восстановления окружающей среды от загрязнений ионами тяжелых металлов и других биологически опасных веществ. Изучение микроорганизмов, способных осаждать соли тяжелых металлов из раствора, является одной из ключевых задач в этой области.
ОБЗОР ЛИТЕРАТУРЫ.
МЕТОДЫ СРАВНИТЕЛЬНОЙ ГЕНОМИКИ ДЛЯ ИЗУЧЕНИЯ РЕГУЛЯЦИИ ТРАНСКРИПЦИИ.
Одним из основных компьютерных методов, применяемых для изучения транскрипционной регуляции в полных бактериальных геномах, является поиск операторных участков (сайтов) связывания транскрипционных факторов с ДНК. Этот метод является важным компонентом аннотации полных бактериальных геномов, который позволяет уточнить предсказания функций генов, сделанные методами анализа белковых последовательностей. Существует много способов анализа участков связывания факторов транскрипции, однако традиционно задача поиска регуляторных сигналов решается следующим образом (Mironov и др., 2000). На первом этапе необходимо получить список сайтов (обучающую выборку), отвечающих исследуемому регуляторному белку. Для этого сначала составляется список совместно регулируемых генов, который можно получить путем анализа литературы, поиска по базе данных или в экспериментах по экспрессии генов. После этого 5'-некодирую щие области полученных генов выравниваются с целью обнаружить в нуклеотидных последовательностях консервативные области.
Альтернативным способом является использование экспериментальных данных (мутагенез или футпринтинг), которые позволяют сузить область поиска.
На втором этапе на основе полученного списка строится распознающее правило. В наиболее простом варианте это может быть консенсусная последовательность. Более сложная процедура построения распознающего правила включает в себя вычисление позиционной матрицы весов нуклеотидов, которая обычно является более чувствительной, чем просто консенсусная последовательность. Для поиска новых операторных участков 5'-некодирующие области всех генов в исследуемом геноме сканируются с помощью построенного распознающего правила.
Практика использования самых разнообразных методов предсказания регуляторных сигналов показывает, что построить надежное распознающее правило практически никогда не удается, так как вместе с правильно предсказанными операторными областями обычно находятся много лишних. Кроме того, для подавляющего большинства геномов и регуляторных систем отсутствуют какие бы то ни было экспериментальные данные для создания обучающей выборки.
Доступность полных или почти полных геномов дает возможность существенно увеличить надежность предсказаний. При этом используется основная идея сравнительной геномики, заключающаяся в том, что группа генов, составляющих регулон (группу совместно регулируемых фактором генов) в одном геноме, будет составлять регулон и в родственном геноме. Тем самым, пара генов, по одному из каждого генома, включается в потенциальный регулон при выполнении двух условий: они являются ортологами, и поэтому, скорее всего, выполняют в клетке одну и ту же роль, и оба они имеют в регуляторной области потенциальный сайт рассматриваемого вида. Такой подход позволяет существенно уменьшить вероятность случайного предсказания неправильного операторного участка, особенно при анализе большого числа геномов, когда можно учесть возможность потери гена или регуляторного сайта (Mironov et al., 1999; Rodionov et al., 2000; Ravcheev и др. 2002).
Сравнительный подход позволяет не только переносить существующую информацию о регуляции из хорошо изученного генома на другие, менее изученные, геномы, но и предсказать новых членов изучаемого регулона, что особенно полезно для поиска недостающих генов в метаболических путях (Gelfand et al., 2000). Данная процедура была применена в нашей группе для анализа ряда бактериальных регулонов: регулонов биосинтеза пуринов и аргинина (Mironov et al., 1999) и ароматических аминокислот в гамма-протеобактериях (Panina et al., 2001), транспорт и метаболизм железа (Panina et al., 2001), и утилизацию различных Сахаров (Laikova et al., 2001; Rodionov et al., 2001 and 2000). В частности, с помощью сравнительного анализа пуринового регулона удалось обнаружить новое семейство пуриновых транспортеров в протеобактериях (Mironov et al., 1999), а также описать de novo регуляцию теплового шока, утилизации азота, и биосинтеза триптофана и пуринов у архебактерий (Gelfand et al., 2000).
SOS-OTBET У БАКТЕРИЙ.
Механизмы репарации ДНК.
SOS-ответ является реакцией бактериальной клетки на UV-излучение и ДНК-повреждающие вещества. Он может быть описан как быстрая мобилизация систем репарации ДНК. В SOS-ответе участвуют белки рекомбинационной и экзиционной репарации (продукты оперонов ruvAB и uwABC), гипермутирующая полимераза UmuDC, белки, регулирующие клеточное деление (SulA).
Механизмы коррекции неспаренных оснований и гомологичной рекомбинации описаны для Е. coli достаточно подробно.
Коррекция неспаренных оснований (КНО) в ДНК:
Неспаренные основания в ДНК могут возникать в результате трех событий:
1) прямого повреждения оснований ДНК или их предшественников продуктами клеточного метаболизма;
2) ошибочной подстановки некомплементарного основания ДНК-полимеразой в ходе репликации.
3) рекомбинационной интеграции однонитевого участка ДНК в неабсолютно идентичную ДНК, партнера по рекомбинации.
Все события приведут к образованию гетеродуплексной ДНК, которая и становится субстратом для ферментов, корректирующих неправильные пары оснований. Процесс репарации ДНК при обнаружении ферментами неканонической пары в дуплексе ДНК проходит через ряд реакций. Обычно такая цепь реакций начинается с обнаружения и удаления одного из нуклеиновых оснований неканонической пары в ДНК, катализируемого соответствующим ферментом группы АР-эндонуклеаз типа II (апуриновых/апиримидиновых эндонуклеаз) (Kornberg и др., 1982, Краевский и др., 1986).
Затем происходит гидролитическое расщепление З'-фосфоэфирной связи, причем фосфат остается в 5'-положении уходящей цепи ДНК. Далее с З'-концом в месте расщепления цепи связывается ДНК-полимераза бета, приводящая к образованию основания Шиффа между ферментом и З'-цепью ДНК, катализирующая гидролитическое удаление дезоксирибозилфосфатного остатка, таким образом освобождая З'-конец для включения соответствующего канонической паре нуклеотида.
Химический механизм реакции гидролитического удаления включает образование основания Шиффа между остатком Lys72 и альдегидной группой З'-гликозидного остатка. Далее, после включения в освободившееся положение соответствующего нуклеотидного остатка, ДНК-лигаза воссоединяет непрерывную цепь ДНК.
Наряду с описанным вариантом репарации известны и репарационные процессы, восстанавливающие повреждения одной из цепей ДНК, возникающие в результате мутагенного, лучевого и других воздействий. При этом, по-видимому, во всех случаях заключительные стадии заполнения малых брешей катализируются ДНК-полимеразой бета.
Рентгеноструктурный анализ комплексов (дДНК + ДНК-полимераза) и (дДНК + ДНК-полимераза+dNTP) показывает, что конформация ДНК-полимеразы бета в них сильно различается (Beard и др., 1998). При этом стадией, лимитирующей скорость процесса элонгации, является конформационное изменение, превращающее непродуктивный комплекс в продуктивный. Более того, такое превращение эффективно проходит лишь при образовании канонической комплементарной пары, вызывающей конформационное изменение за счет аллостерического влияния. Именно этот механизм главным образом обеспечивает точность синтеза, катализируемого ДНК-полимеразой бета.
Принято различать 2 системы КНО: с длинным ресинтезируемым трактом (ДКНО, LPMR, long patch mismatch repair) и очень коротким трактом (ОККНО, VSPMR, very short patch mismatch repair).
Гомологичная рекомбинация.
Быстро делящиеся бактериальные клетки, содержащие несколько репликонов, образованных недореплицированными хромосомами, более устойчивы к действию ионизирующей радиации, которая индуцирует двухцепочечные разрывы ДНК, чем клетки с небольшим числом репликонов, находящиеся в стационарной фазе. Гаплоидные клетки дрожжей в фазе G1 перед началом синтеза ДНК чрезвычайно чувствительны к действию ионизирующей радиации, тогда как те же клетки в фазе G2 перед митозом так же устойчивы к ионизирующему излучению, как и диплоидные клетки.
Эти факты указывают на то, что для эффективного исправления повреждений, вызываемых ионизирующей радиацией, необходимо одновременное присутствие в клетке двух гомологичных молекул ДНК.
Процесс репарации разделяют на три этапа. В первой, пресинаптической, фазе репарации происходит внесение двухцепочечного разрыва в ДНК или, при его наличии, сразу осуществляется нуклеазное расщепление концов разрыва. В создании одноцепочечных З'-ОН-выступающих концов ДНК в месте разрыва принимает участие белок RecBCD, который обладает как хеликазной, так и экзонуклеазной активностями. RecBCD расплетает двухцепочечную молекулу ДНК в месте разрыва и гидролизует одну из цепей в направлении 5−3', оставляя выступающий одноцепочечный участок. Во второй фазе наблюдается синапсис гомологичных участков двух молекул ДНК с вхождением комплементарного одноцепочечного участка в ДНК-дуплекс и последующим репаративным синтезом ДНК. Поиск гомологичных участков и обмен цепями, необходимые для рекомбинации, происходят с участием белка RecA. В третьей, постсинаптической, фазе репарации образовавшиеся структуры Холлидея разделяются с помощью белков RuvA, -В иС, RecG, а также белков SOS-системы репарации (RecN, UvrD, RecF и RecJ). Похожие механизмы используются клетками для рекомбинационной репарации одноцепочечных брешей, остающихся в молекулах ДНК из-за блокировки репликативного синтеза ДНК модифицированными нуклеотидами.
Многие продукты генов Е. coli и дрожжей, участвующие в рекомбинационной репарации повреждений ДНК, имеют гомологи у животных и человека. Отличительной особенностью эукариотической рекомбинации и репарации является вхождение соответствующих белков в многочисленные белковые комплексы, в частности транскриптосомы и реплисомы, что указывает на их важную роль в матричном биосинтезе нуклеиновых кислот эукариотических клеток.
Роль полимераз в SOS-omeeme.
В ответ на повреждение ДНК в клетке повышается концентрация разных типов полимераз, в том числе LexA-зависимым способом. В регулон LexA входят polB (ДНК полимераза II, отвечает за реактивацию реплисомы и старт репликации после остановки и стабилизацию репликационной вилки), dinP/dinB (ДНК полимераза IV, вовлечена в мутагенез). Одним из ключевых белковых комплексов, задействованных в SOS-ответе, является гипермутирующая полимераза V, кодируемая опероном umuDC (тисАВ), отвечающая за синтез ДНК de novo в местах значительных повреждений.
UmuC и DinB являются членами нового семейства полимераз, довольно широко распространенных среди различных таксономических групп.
Friedberg и Gerlach, 1999, Woodgate, 1999). Функция генов dinB и итиС была показана относительно недавно (Wagner и др., 1999, Reuven и др., 1999, Tang и др., 1999). Первым членом этого семейства, для которого была показана полимеразная активность, был ген REV1 из Saccharomyces cerevisiae.
DinB обладает способностью к элонгации не полностью комплементарных праймер-матричных структур таким образом, что продукт синтеза становится на один нуклеотид короче по сравнению с тем, каким он мог быть в нормальных условиях. Это согласуется с тем, что in vivo наблюдались DinB-зависимые сдвиги рамки считывания. Полимераза DinB также характерна тем, что у нее отсутствует 3−5' экзонуклеазная активность.
Полимераза Pol V существует в виде комплекса UmuD^C (субъединица UmuD' получается в результате RecA-зависимого разрезания UmuD, Tang и др., 1999) и было показано (Truska и др., 1998), что в отсутствие PolB этот комплекс способен заполнять разрывы ДНК при повышенной температуре. В присутствии RecA, бета и гамма комплексов полимеразы III и белка SSB продукт полимеразной активности D2C содержал чрезвычайно много ошибок независимо от того, была ли повреждена ДНК-матрица.
Геномы гамма-протеобактерий содержат одну копию оперона umuDC на хромосоме в дополнение к нескольким плазмидным копиям оперона. Для большинства этих оперонов LexA-зависимая регуляция показана либо экспериментально, либо простым наблюдением потенциального SOS-бокса в 5-некодирующей области гена. С-концевой домен белка UmuD гомологичен С-концевому домену белка LexA, в то время как N-концевой домен UmuC гомологичен N-концевому домену другого белка Е. coli, DinP, представляющего собой DNA-полимеразу IV.
Генетика и механизмы регуляции SOS-ответау Е. coli.
Е. coli чувствует повреждения ДНК благодаря тому, что белок RecA связывается с одноцепочечной ДНК, образуя нуклеопротеиновые филаменты.
Walker, 1996). В результате взаимодействия LexA с нуклеопротеиновыми филаментами активизируется способность LexA к автопротеолизу, и этим # снимается репрессия генов SOS-ответа.
Сигнал связывания LexA SOS-бокс (SOS-box) представляет собой палиндром с последовательностью TACTGTATATATATACAGTA с сильно консервативными плечами и АТ-богатым спейсером (Lewin и др., 1994). К моменту начала исследования были экспериментально установлены регуляторные участки перед многими генами Е. coli и перед семью генами В. subtilis.
О SOS-ответе в Грам-положительных бактериях известно несколько меньше. Репрессорный белок DinR гомологичен LexA, но сходство ДНК-ф связывающих НТН (helix-turn-helix — спираль-поворот-спираль) доменов чрезвычайно мала. Соответственно, сигнал связывания, Чео-бокс (Cheo box), обладает совсем другой последовательностью, нежели SOS-бокс, однако сохраняет палиндромную структуру с АТ-богатым спейсером CGAACATATGTTCG (Cheo и др., 1991). К моменту начала исследования 4 никаких функциональных аналогов полимераз IV и V в геномах Грамположительных бактерий не было известно.
В предварительной работе нами были идентифицированы гены, кодирующие белки из семейства UmuC в геноме Bacillus subtilis (Gelfand and Mironov, 1999). Целью настоящего исследования было проанализировать детально распространение генов, кодирующих полимеразу V в Грам-положительных бактериях и протеобактериях.
ТЕПЛОВОЙ ШОК.
Белки, регулируемые тепловым стрессом, в большинстве своем являются шаперонами и протеазами. Основное негативное последствие повышения температуры выше физиологического уровня — нарушение нормальной третичной структуры белка. Для устранения неправильно и свернутых белков в клетке активируется транскрипция белков, способных восстановить правильный фолдинг или распознать белок с ненормальный структурой и подвергнуть его лизису.
Регуляция генов теплового шока у Е. coli.
Главный регулятор теплового шока в Е. coli, кодируемый геном гроН, был первым из открытых регуляторных сигма факторов Е. coli (Grossman и др., 1984). При исследовании 5'- некодирующей области гена гроН, был обнаружен еще один тип альтернативных промоторов, активируемый, как выяснилось, другим сигма фактором RpoE (а24), который работает в условиях экстремально высокой температуры (Erickson и др., 1989; Wang и др., 1989). Поскольку основные HSP (heat shock proteins — белки теплового шока) очень хорошо сохраняются между достаточно далекими в эволюционном смысле геномами, такими, как бактерии и эукариоты (Bardwell и др., 1984; Bardwell и др., 1987), их роль, скорее всего, критична для клетки, хотя и ясна еще не для всех HSP.
RpoH представлен в большом количестве геномов протеобактерий. Белок регулятор с32 является альтернативным сигма фактором, узнающим промотор (CTTGAAA-(12)-CCCCAT). Регул он RpoH включает в себя основные белки теплового стресса — шапероны (GrpE, GroESL, DnaKJ, HtpG) и протеазы (Clp, Lon).
Регуляция генов теплового шока у В. subtilis.
Исторически в геноме В. subtilis гены теплового шока делились на три типа: первый (I) — регулон НгсА, второй (II) — регулон SigB, общий стресс, и третий (III) — регулон CtsR.
НгсА характерен тем, что связывается с элементом, обладающим палиндромной структурой (консенсус TTAGCACTC-(9)-GAGTGCTAA), который называется CIRCE. Впервые этот регуляторный элемент был описан в микобактериях (Baird и др. 1989). В общем случае в геноме находится один-два элемента CIRCE. В большинстве случаев, сайт связывания НгсА находится перед опероном groESL, кодирующим один из главных шаперонов, задействованных в тепловом стрессе, и, иногда, перед геном hrcA и опероном dnaKJ. В В. subtilis HrcA регулирует оперон hrcA-grpE-dnaKJ (Narberhaus and Bahl, 1992; Narberhaus и др- 1992). Система HrcA/CIRCE чрезвычайно консервативна и широко распространена среди различных таксономических групп, включая Грам-положительные бактерии, протеобактерии, цианобактерии, хламидии и спирохеты (Segal and Ron, 1996), однако ее представители практически отсутствуют в группе гамма-протеобактерий. Под регуляцией CtsR находятся некоторые высоко консервативные белки системы С1р, которые играют роль протеаз при теплового шоке и крайне важны для вирулентности и выживания некоторых патогенов (Derre и др, 1999) — Ортологи гена ctsR встречены в группе Грам-положительных бактерий вплоть до группы Clostridia. Сигнал представляет собой тандемный повтор с шагом 7 нуклеотидов (GTCAAAA.GTCAAAA).
ОБЩИЙ СТРЕСС.
Регуляторный белок SigB является первым альтернативным сигма фактором, описанным у бактерий (Haldenwang и Losick, 1979, Haldenwang и Losick, 1980) распознающим промотор с консенсусной последовательностью AGTTTAC-(14)-GGGTAT, впервые описанный у гена spoVG той же группой. В дальнейшем исследования регулона SigB были продолжены группой Хекера (Hecker и др., 1988, Volker и др., 1992). Бойлан (Boylan и др. 1993) впервые обобщил опыт предыдущих исследований, предположив, что SigB является регулятором именно общего стресса, и индуцируется в момент, когда клетка попадает в различные неблагоприятные условия. По степени сложности регуляции общий стресс напоминает систему споруляции, и клетка, испытывающая условия, ограничивающие рост, неоднократно проходит точки выбора между репарацией и споруляцией (Price, 2000). Регулон SigB в В. subtilis достаточно обширен (по разным оценкам, от 75 до 200 геновPrice, 2000) и отвечает за устойчивость к повышению температуры, понижению и повышению рН, воздействию этанола и осмотический шок и оксидативный стресс. В регулон SigB входят протеазы теплового шока (С1р), которые, кроме того, входят у В. subtilis в регулон CtsR. В литературе была описана регуляция самого гена ctsR при помощи SigB (Kruger и др., 1996) Кроме того, в общем стрессе принимают участие белки-осмопротекторы (ОриЕ), каталазы (KatX, KatB), возможно участие белков множественной лекарственной устойчивости (Bmr) (Petersohn и др., 1999).
Регуляторпый каскад SigB в В. subtilis.
Для регуляции общего стресса в В. subtilis существует сложный каскад сигма и антисигма факторов. SigB расположен в опероне rsbVW-sigB-rsbX, расположенном в 3'- области оперона rsbRSTU. Белки RsbV и RsbW являются основными регуляторами активности SigB. RsbW негативно регулирует активность SigB, являясь анти-сигма фактором, a RsbV репрессирует RsbW, действуя как анти-анти-сигма фактор. При благоприятных условиях, фосфорилирование RsbV по консервативному сериновому остатку предотвращает взаимодействие с RsbW, и, таким образом, RsbW может репрессировать SigB, предотвращая его взаимодействие с РНК-полимеразой (Alper и др., 1996, Benson and Haldenwang, 1993, Dufour and Haldenwang, 1994 Voelker и др., 1995). По всей видимости, на данный момент идентифицированы не все элементы, контролирующие степень фосфорилирование RsbV, однако известно, что фосфатаза RsbP, реагирующая на недостаток макроэргических веществ в клетке (Vijay и др., 2000), способна дефосфорилировать RsbV, и такой же способностью обладает RsbU, реагирующая на внешние стрессы (Voelker и др., 1995, Yang и др., 1996).
Рисунок 1. Схема регуляции SigB в В. subtilis.
Кроме ctc, в регулон SigB входят гены, кодирующие АТФ-зависимую протеазу (clpP, Gerth и др. 1998), фактор контроля споруляции (bofC, Gomez and Cutting, 1997), факторы устойчивости к UV-излучению и метилметасульфонату (sms и comY, Kruger и др., 1997), регулятор генов теплового шока класса III (ctsR, Kruger и др., 1996), фактор устойчивости к оксидативному стрессу (dps, Antelmann и др., 1997), каталазы katB, katX, НАД-синтетазу (nadE, Antelmann и др., 1997), осмозависимый транспортер пролина (ориЕ, von Blohn и др., 1997), оперон, кодирующий гены множественной лекарственной устойчивости (bmr, Neyfakh и др. 1991), а так же ряд генов с неясной функцией: yacH, yacl, gsiB, gspA, csbC, csbD, csbX, ydaP, ydaG, yflA, yvyD и некоторые другие (Akbar и др., 1999, Antelmann и др., 1997, Kruger и др., 1996, Maul и др., 1995, Petersohn и др., 1999, Petersohn и др., 1999, Drzewiecki и др., 1998).
ТЯЖЕЛЫЕ МЕТАЛЛЫ.
Ионы металлов различаются по характеру воздействия, оказываемого на живые организмы. Некоторые металлы, такие как железо, медь и марганец, являются важными компонентами ферментов, используются в процессах окисления-восстановления и регуляции осмотического давления. Другие металлы не имеют роли в метаболических процессах. Даже те металлы, которые необходимы клетке, могут быть токсичны при повышении концентрации. К отрицательным последствиям повышенной концентрации тяжелых металлов относятся повреждение ДНК и мембраны, дисфункция ферментов. Бактериальные клетки выработали ряд механизмов защиты от опасных концентраций тяжелых металлов, включающие изменение проницаемости мембраны, внутриклеточную и внешнюю секвестрация, транспортеры, белки, изменяющие степень окисления металла на менее опасную (Nies, 1999).
Бактериальные системы устойчивости к ионам тяжелых металлов регулируются транскрипционными факторами из семейств MerR (COG0789), ArsR/SmtB (Wu и Rosen, 1993), двухкомпонентных систем, таких как CusRS, SilRS и PcoRS, описанных в (San Francisco и др., 1990) и (Brown и др., 1995; Rouch and Brown, 1997; Silver, 2003), соответственно. В данной работе было рассмотрено семейство MerR (COG0789).
Семейство MerR состоит из регуляторов транскрипции, содержащих ДНК-связывающий домен вида спираль-поворот-спираль, способных как к репрессии, так и к активации (Nies, 1999). Кроме металл-связывающих регуляторов, в семейство входят регулятор ответа на окислительный стресс SoxR (Wu и др., 1991, Nies, 1999) и регуляторы множественной лекарственной устойчивости (например, TipA and BmrR). Металл-чувствительные регуляторы выделяются внутри семейства наличием консервативных цистеинов в фиксированных позициях (Brown, 2003).
Системы, регулируемые белками семейства MerR, включают в себя устойчивость к ионам ртути (собственно MerR), устойчивость к ионам цинка, никеля и кадмия (ZntR), меди (CueR and HmrR), кадмия и свинца (CadR) и ряду других токсических металлов. (Brown и др., 2003). Характерной особенностью семейства MerR является способ активации транскрипции регулируемых генов. Промотор регулируемого гена обладает спейсером длины 19 (MerR протеобактерий, CueR, HmrR, PbrR) или 20 (MerR Грам-положительных бактерий, ZntR), и, следовательно, субоптимален (Changela и др., 2003). Такие промоторы в нормальных условиях достаточно слабы (Brown, 2003). Механизм регуляции состоит в том, что белок-регулятор обладает способностью изгибать ДНК и, таким образом, изменять расстояние между боксами промотора, увеличивая его силу (Summers, 1992). В эксперименте с вставкой или делецией одного нуклеотида из промоторного спейсера было показано, что система потеряла регуляторную эффективность (Brown, 2003). MerR, белок, давший название семейству и описанный первым, регулирует свою собственную транскрипцию с промотора (Рг) перед геном merR, а также транскрипцию оперона тег, кодирующего белки, необходимые для освобождения клетки от ионов ртути (промотор Pt) (Kulkarni и др., 1999). В Е. coli, эти два промотора расположены дивергентно в непосредственной близости друг от друга таким образом, что регулятор может взаимодействовать одновременно с ними двумя. MerR садится таким образом, что контактирует с этими двумя промоторами одновременно. Изгиб ДНК и активация транскрипции происходят в присутствие ионов ртути, которые связываются с регулятором и меняют его конформацию. В отсутствие ионов ртути, транскрипция с промотора Pt репрессируется. Переключение с активации на репрессию не подразумевает диссоциацию регуляторного белка.
Регулоны семейства MerR/COG0789 чаще всего состоят из двух геновтранспортера ионов тяжелых металлов и собственно регулятора. Исключение составляют системы устойчивости к ионам ртути Hg (II) и свинца Pb (II), которые включают также ряд генов, отвечающих за изменение степени окисления иона (Hobman и др., 2005). Гены могут как располагаться в одном локусе — опероне или дивергоне, так и находиться в разных частях генома. Консенсусы палиндромных сайтов связывания специфичны для разных членов подсемейства (Brown, 2003, Hobman и др., 2003).
Регулятор семейства MerR/CC)G0789, ответственный за устойчивость к ионам меди, золота и серебра в гамма-протеобактериальных геномах Е. coli, S typhi, S. typhimurium, Y. pestis и Vibrio spp.), называется CueR, впервые он описан в (Stoyanov, 2001), тогда как регуляторы медной устойчивости в бета-и альфа-протеобактериях традиционно называются HmrR. Регуляция и CueR, и HmrR требует наличия промотора со спейсером в 19 пар нуклеотидов. Сигнал связывания CueR обладает консенсусом АССТТССС-(5)-TGGAAGGT (Brown, 2003), сигнал связывания HmrR описан как АССТТССAG-(3)-CTGGAAGG (Reeve и др., 2003).
Регуляторный сигнал MerR в протеобактериях состоит из промотора со спейсером в 19 нуклеотидных пар и палиндрома со структурой 7−4-7 и консенсусом TCCGTAC-(4)-GTACGGA. В Грам-положительных бактериях сигнал MerR обладает структурой типа 9−4-9 и консенсусом ACCGTGTAC-(4)-GTACAGGGT внутри 20-нуклеотидного спейсера.
CadR является кадмий-зависимым (и, частично, цинк-зависимым, Silver, 2003) регулятором промотора гена транспортера cadA. Локус pbrR, описанный в плазмиде рМОЬЗО из Cupriavidus metallidurans (Borremans и др., 2001, Chen и др., 2005), состоит из шести генов, кодирующих белки транспорта ионов Pb (II) PbrT, и PbrA, гены с предсказанной функцией pbrB, предсказанную сигнальную пептидазу pbrC и РЬ (П)-связывающий белок PbrD.
Сайт связывания ZntR представляет собой палиндром длины 22 с консенсусом ACTCTGGAGTCGACTCCAGAGT внутри 20-нуклеотидного промоторного.
Впервые регуляторная роль ZntR была показана в (Brocklehurst и др., 1999). Позднее было показано, что ZntR индуцируется ионами кадмия и свинца (Binet и др., 2000), а единственный регулируемый ZntR белок транспортер ZntA — способен к переносу этих ионов (Rensing и др., 1998, Rensing и др., 1997).
МАТЕРИАЛЫ И МЕТОДЫ.
Базы данных бактериальных геномов.
Полные бактериальные геномы были взяты из банка данных Genbank (http://www.ncbi.nlm.nih.gov/GenBank/- Benson и др., 2003). Предварительные нуклеотидные последовательности незаконченных геномов были также получены со следующих WEB-сайтов: the Institute for Genomic Research (http://www.tigr.org), the University of Oklahoma’s Advanced Center for Genome Technology (http://www.genome.ou.edu/), the Wellcome Trust Sanger Institute (http://www.sanger.ac.uk/), the DOE Joint Genome Institute (http://igi.doe.gov). В работе используются индентификаторы генов из базы данных Genbank.
Компьютерные программы и методы для анализа геномов, а также отдельных нуклеотидных и белковых последовательностей.
Комплекс программ Genome Explorer (Миронов и соавт., 2000) был использован для поиска ортологов в бактериальных геномах. Ортологичные белки были определены по критерию наибольшего сходства при двухстороннем поиске в двух геномах (Tatusov и др., 2000). Слабые гомологии между белками были обнаружены с помощью программы локального выравнивания PSI-BLAST (http.V/www.ncbi.nlm.nih.gov/BLAST/- Altschul и др., 1997). Для выравнивания нуклеотидных и аминокислотных последовательностей использовали программу ClustalX (Thompson и др., 1997). Филогенетические деревья были построены по методу максимального правдоподобия с использованием пакета программ PHYLIP (Felsenstein, 1981) и графически обработаны с использованием программы GenMaster Миронов А.А.).
Известные структурные и функциональные мотивы в белках были обнаружены с помощью поисковой системы, реализованной в банке данных InterPro (Mulder и др., 2000; http://www.ebi.ac.uk/interproA). Prosite () и системой NCBI Conserved Domain Database, ассоциированной с программой BLAST (http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml).
Для конструирования распознающего правила для палиндромных и тандемных сайтов связывания регулятора применялась программа SignalX (Миронов и соавт., 2000), которая находит все возможные палиндромы в каждой нуклеотидной последовательности изучаемой выборки, а затем итеративно отбирает наиболее весомые палиндромы, общие для заданного количества последовательностей. В качестве распознающего правила для поиска потенциальных операторных участков ДНК использовалась матрица весов нуклеотидов. Данная матрица строится на основе выборки операторных участков, каждый из которых, в общем случае, имеет длину L. Вес w (a, i) нуклеотида «а» в позиции «/» рассчитывался по формуле: w (a, i) = log (N (a, i) + 0.5) 0.25 I,=A>CATlog (N (b, i) + 0.5), где N (a, i) — количество нуклеотидов «a» из нашей выборки, которые находятся в позиции /. Таким образом, используя данную матрицу, любому участку нуклеотидной последовательности длиной L можно поставить в соответствие вес S: s = l"=-.l w (ah0, где я, — нуклеотид в позиции /. Далее, можно ввести некоторое пороговое значение Sp, при котором, если вес S больше или равен этому значению, то данная последовательность признается потенциальным операторным участком, а в противном случае — нет. Используя такой подход, можно проанализировать области, находящиеся непосредственно перед началами генов для всего генома, и определить потенциальные операторные участки. Для поиска регуляторных ДНК-сигналов, удовлетворяющих данной матрице с заданным порогом распознавания, использовался комплекс программ Genome Explorer (Миронов и соавт., 2000).
Сравнительный анализ.
Для сортировки первичных данных, полученных с помощью матриц позиционных весов (рабочей выборки), и разделения их на перепредсказанные и потенциальные сайты, был использован метод сравнительной геномики (филогенетического футпринтинга). Рабочие выборки из нескольких родственных геномов сравнивались друг с другом с целью найти группу ортологичных генов с консервативным потенциальным сайтом в 5'-некодирующей области (Рис. 1). Если потенциальные сайты встречались в трех или более случаях, ген определялся как предсказанный участник регулона. При анализе также учитывалась известная или предполагаемая функция гена, положение потенциального сайта и степень консервативности некодирующей области.
Базовым геномом становился, как правило, тот, из которого были взяты сайты для построения матрицы позиционных весов (МПВ), т. е. наиболее экспериментально изученный. Естественным ограничением такого метода является неучет случаев, когда ген утерял регуляцию именно в базовом геноме. Для компенсации этого применялся метод попарных сравнений. В этом случае сравнивались рабочие выборки всех возможных пар геномов в изучаемой группе. Этим методом определялась таксон-специфическая регуляция.
Рисунок 1. Схема сравнительно-геномного анализа.
Стрелками обозначены гены, пунктирной линией — ортологичность, овалами обозначены потенциальные сайты. Плюсы стоят напротив генов, которые признаются потенциальными членами регулона, минус означает, что ген не попадает в потенциальные повые члены регулона обучающая выборка мпв 1.
Геном 1 о.
Геном 2.
Геном N +?
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ.
выводы.
1. Описана структура и состав регулонов SOS-ответа, теплового шока, общего стресса и устойчивости к тяжелым металлам в геномах рассмотренных групп.
2. Предсказана регуляция нескольких генов (ybbNрегул он RpoH, VV2052, VPA1012 и VCA0766 — регулон CueR).
3. Предсказана специфичность нескольких регуляторов и транспортеров, относящихся к системе устойчивости к ионам тяжелых металлов. Из 503 членов суперсемейства COG0789 для 109 предположена регуляция устойчивости к тяжелым металлам, из них 14 отнесено к подсемейству MerR Грам-положительного типа, 30 — к подсемейству MerR протеобактериального типа, 14 — к подсемейству CueR/HmrR, 6 — к подсемейству CadR/PbrR и 6 — к подсемейству ZntR. Во всех случаях определения конкретного подсемейства определены остальные потенциальные участники регулона.
4. Проведено сравнение результатов сравнительно-геномного анализа и метода микрочипов. Для регулона SigB В. subtilis определена наиболее вероятная геном-специфическая и консервативная части регулона на основе анализа трех экспериментальных работ пр экспрессии на мирочипах и сравнительного анализа шести родствнных В. subtilis геномов.
5. Описаны регуляторные каскады и схемы пересечения регулнов, отвечающих ща тепловой стресс: регляция гена hrcA сигма-фактором RpoH у Achromobacter xylosoxidans, Ralstonia eutropha, R. solanocearum, Bordetella pertussis, B. parapertussis, Burkholderia pseudomallei, и репрессором CtsR у Lactococcus lactis, Listeria innocua, Listeria monocytogenes, Enterococcus fecalis, регуляция гена rpoH репрессором HrcA у Bordetella pertussis, Bortetella parapertussis и Methylobacillus flagellatus, двойная регуляция генов dnaKJ регуляторами SigB и CtsR, у Streptococcus pyogenes и Staphylococcus aureus.
БЛАГОДАРНОСТИ.
Я благодарю Михаила Сергеевича Гельфанда за руководство, помощь в работе и терпение, Андрея Александровича Миронова за предоставленные программы, своих соавторов и коллег Ольгу Калинину и Алексея Казакова за хорошее сотрудничество и их часть работы в описании устойчивости к тяжелым металлам, Ладу Сычеву, описавшую таксон-специфическую регуляцию SOS-ответа, и Всеволода Юрьевича Макеева за поддержку и создание творческой атмосферы в лаборатории.