Несмотря на то, что алгоритмы поиска промоторов, учитывающие характер доминирования нуклеотидных пар в консервативных элементах, уже много лет используются для предсказания потенциальных промоторов перед известными генами, они не пригодны для картирования транскрибируемых участков в геноме. В данной работе предпринята попытка учесть особенности генетического окружения консенсусных элементов… Читать ещё >


  • Список сокращений
  • Список используемых терминов

1. Особенности структурной организации промоторов и способы ее учета в компьютерных алгоритмах поиска промоторов (обзор литературы).

1.1. Общая характеристика РНК-полимеразы R coli.

1.2. Стадии транскрипционного цикла.

1.3. Особенности нуклеотидной последовательности промоторов.

1.4. Консервативные элементы — главные детерминанты промоторной области.

1.5. Длина участка между консервативными элементами существенна для эффективного взаимодействия с РНК-полимеразой.

1.6. Неконсервативные участки промоторов.

1.6.1. Последовательности нуклеотидов вокруг стартовой точки транскрипции.

1.6.2. Функциональное значение динуклеотида TG, расположенного перед консервативным элементом -10.

1.6.3. Особенности структурной организации «upstream» области промоторов.

1.6.4. Взаимодействие «upstream» области промотора с а-субьединицами РНК-полимеразы.

1.6.5. Дополнительные структурные факторы, влияющие на матричную активность промоторов.

1.7. Методы алгоритмизации структурных особенностей промоторов для построения компьютерного алгоритма поиска промоторов.

Разработка компьютерного алгоритма поиска вегетативных промоторов в геноме Escherichia coli (реферат, курсовая, диплом, контрольная)

Расшифровка полной нуклеотидной последовательности ряда геномов и наличие данных о зависимости генной экспрессии от целого ряда физико-химических факторов позволяют приступить к модельной реконструкции функциональных взаимоотношений в живой клетке. Необходимым условием для этого является полная аннотация всех регуляторных элементов генома (промоторов, регуляторных белков и РНК). Однако даже идентификация их является сложной биохимической задачей. Так, например, промоторные участки за более чем 30 лет установлены только для 10−15% генов. Использование информационных подходов, предсказывающих расположение регуляторных участков в геноме, способно значительно облегчить и ускорить этот процесс. Однако точность компьютерного предсказания промоторных участков до сих пор была очень низкой. Это обусловлено вырожденностью контекста консервативных элементов промоторов, специфически распознаваемых о-субъединицами РНК-полимеразы. Так, в бактериальной ДНК число мест, имеющих типичную для промоторов степень гомологии с их консервативными элементами, на несколько порядков превышает число генов. Абсолютное большинство этих мест не используется транскрипционным аппаратом клетки и, следовательно, текстуальное соответствие консенсусу не является достаточным для обозначения регуляторных участков.

Несмотря на то, что алгоритмы поиска промоторов, учитывающие характер доминирования нуклеотидных пар в консервативных элементах, уже много лет используются для предсказания потенциальных промоторов перед известными генами, они не пригодны для картирования транскрибируемых участков в геноме. В данной работе предпринята попытка учесть особенности генетического окружения консенсусных элементов. К этим особенностям, в первую очередь, относятся элементы нуклеотидной последовательности, способные взаимодействовать с а-субъединицами РНК-полимеразы. Кроме этого, учтены последовательности, формирующие анизотропные изгибы оси двойной спирали ДНКгибкие динуклеотиды, обеспечивающие способность промоторов подвергаться адаптивным конформационным превращениямА/Т-треки, предположительно принимающие участие в поступательном движении РНК-полимеразы вдоль матрицыи повторяющиеся мотивы нуклеотидной последовательности, являющиеся потенциальными мишенями для взаимодействия с регуляторными белками. Формализация этих параметров позволила создать эффективный компьютерный алгоритм, пригодный для полного сканирования бактериального генома.

В процессе сканирования было обнаружено 3936 потенциальных промоторных участков, часть из которых могут контролировать экспрессию неизвестных пока генов. Значительная часть промотор-подобных участков была обнаружена в кодирующих участках генов и в промежутках между генами, не предполагающими наличие промоторов. Эти места могут кодировать синтез нетранслируемых РНК, обнаружение которых другими методами является исключительно сложной задачей. Предоставляя интегральную картину о распределении транскрибируемых участков в геноме, полученные данные создают основу для моделирования экспрессии генных ансамблей и могут послужить отправной точкой для сравнительного эволюционного анализа.


1. Впервые выявлена неслучайность в распределении А/Т и G/C-nap в диапазоне (-210/-70). Соответствующее расширение промоторной области объединяет в общую платформу участки связывания РНК-полимеразы и большинства регуляторов транскрипции.

2. Разработан компьютерный алгоритм, способный с достоверностью 99,6% идентифицировать ~91% вегетативных промоторов в геноме и обеспечивающий высокую точность позиционирования стартовой точки транскрипции.

3. Впервые проведено полное сканирование генома Kcoli, обнаружившее 3936 неперекрывающихся участков, способных с вероятностью 99,994% инициировать транскрипцию. Более 27% предсказанных промоторов расположено внутри кодирующих последовательностей, а более 15% находятся в участках, не предполагающих наличие промотора для известных генов. Выявленные промоторы могут контролировать экспрессию новых генов, в том числе генов нетранслируемых РНК, обнаружение которых другими методами является сложной задачей.


От всей души благодарю Ольгу Николаевну Озолинь, моего Научного Руководителя, за неоценимую помощь, выражавшуюся как в постоянных консультациях и обсуждении работы, так и в чутком человеческом отношении. А также за неизмеримое терпение!!! Работая с Ольгой Николаевной и наблюдая ее самоотверженный труд, глубочайшее понимание существа любого (!) вопроса, широчайшую эрудицию и, что, может быть, стоило бы поставить на первое место — личные душевные качества, я постоянно поражался этой Женщине! Для меня Ольга Николаевна — эталон Ученого и Человека!

Выражаю глубокую благодарность Александру Александровичу Дееву (ИТЭБ РАН) за предоставленный набор программ, с помощью которых была произведена вся предварительная оценка (а это немалая доля от общего времени, затраченного на работу) и часть заключительной работы, за его помощь и консультации и готовность в любой момент выделить в напряженном графике время и силы, чтобы разъяснить, показать, поправить. Огромное Вам спасибо, Александр Александрович!!!

Хочу поблагодарить всех сотрудников нашей группы за дружескую поддержку и атмосферу, располагающую к работе, не смотря на «высокую плотность населения» нашей лаборатории!

Искренне благодарен оппонентам и рецензентам — Игорю Петровичу Белецкому и Владиславу Михайловичу Комарову — за отмеченные недостатки и ошибки, за внимание, оказанное моей работе и время, потраченное на ее внимательное изучение, а также Виктору Ивановичу Попову за каверзные вопросы с целью научить на них отвечать.

Отдельное спасибо хочется сказать Татьяне Ивановне Смолихиной за организацию процесса подготовки к защите, благодаря ее усилиям с моих плеч было убрано множество организационных моментов, и высвобождено время на доработку и исправление ошибок и недочетов в работе.

Прошу прощения у своих близких — Мамы и Веры, за то, что так мало оказывал им внимания всё это время, и благодарю их за все, чем они могли мне помочь!!! Отдельная благодарность Вере за внимательное прочтение макета диссертации и поиск ошибок!



Для масштабного моделирования клеточного метаболизма в условиях нормального роста и различных стрессов необходима идентификация всех регуляторных элементов генома (промоторов, регуляторных белков и РНК). Предварительное картирование промоторов с помощью информационных подходов существенно облегчает эту задачу и позволяет получать интегральную характеристику экспрессируемых в различных условиях генов. Необходимым условием является высокая селективность компьютерных алгоритмов, обеспечивающая эффективный поиск регуляторных участков на фоне кодирующей ДНК. Построение такого алгоритма и являлось главной целью данной работы. В отличие от ранее предложенных подходов, помимо консервативных элементов, распознаваемых о70-субъединицей РНК-полимеразы, были учтены элементы, контактирующие с а-субъединицей ферментапоследовательности, формирующие устойчивые изгибы оси двойной спирали ДНКдинуклеотиды, обеспечивающие адаптивную изомеризацию ДНКрегулярно распределенные А/Т-треки, предположительно принимающие участие в поступательном движении РНК-полимеразы вдоль матрицы, и повторяющиеся мотивы нуклеотидных последовательностей, находящиеся в участках взаимодействия с большинством регуляторных белков. Высокие предсказательные возможности алгоритма позволили использовать его для тотального картирования вегетативных промоторов в геноме Kcoli, что предоставило интегральную информацию о распределении потенциальных регуляторных участков.

В результате полного сканирования бактериальной хромосомы было обнаружено ~91% известных промоторов, большинство которых входят в состав более или менее компактных кластеров промотор-подобных точек. При этом в ~83% случаях известные промоторы оказались локализованными в максимумах соответствующих кластеров. Это значит, что около 80% промотор-подобных сайтов, предсказанных по положению максимумов в распределении промотор-подобных сайтов, могут быть настоящими промоторами. Ни один из существующих алгоритмов не обладает таким предсказательным потенциалом.

Потенциальные промоторы были обнаружены перед 1981 неизученными пока генами. Все оцениваемые параметры этих предсказанных регуляторных участков оказались похожими на настоящие промоторы. Их предварительная локализация может облегчить идентификацию промоторов экспериментальными методами. Высокая достоверность полученной информации уже сейчас позволяет использовать ее для решения некоторых задач, например, для целенаправленного поиска генов, контролируемых определенными регуляторными белками, или для поиска корреляций с распределением в геноме некоторых структурных особенностей.

Около 16% промотор-подобных сайтов было обнаружено в участках между конвергентными генами или между генами, транскрибируемыми в обратном промотору направлении. Копирование таких генов осуществляется с промоторов, расположенных совсем в других участках хромосомы, или на другой нити ДНК. Наличие явно выраженных промотор-подобных сигналов указывает на возможность существования в этих местах новых генов, обнаружение которых может стать задачей специального исследования.

По крайней мере, некоторые из промоторов, обнаруженных в кодирующих участках генома, могут контролировать синтез антисмысловых РЖ. Другие могут быть местами альтернативного копирования новых белковых продуктов. Для дальнейшего анализа каждого из таких участков необходим поиск потенциальных мест терминации транскрипции, возможных открытых рамок считывания и гомологичных последовательностей в банках данных. Необходимо экспериментальное тестирование транскрипционной активности in vivo и in vitro и полная характеристика РНК-продукта, если таковой будет обнаружен.

Важным результатом проведенного исследования является весомость регулярно распределенных элементов в спецификации промоторных участков. Даже если какие-то из этих элементов (динуклеотиды ТА, А-, Тили W-треки) непосредственно контактируют с РНК-полимеразой, очевидно, что большинство не специфически влияет на комплексообразование. Указывая на значительность неспецифических взаимодействий при формировании транскрипционного комплекса, это свидетельствует о целесообразности использования регулярно распределенных свойств для идентификации промоторов, распознаваемых другими а-факторами.

