Компьютерный анализ конформационных и физико-химических особенностей функциональных сайтов геномной ДНК эукариот

Разработанная система SITECON обеспечивает возможность выявления значимых консервативных контекстно-зависимых конформационных и физико-химических особенностей ДНК функциональных сайтов на основе анализа выборок последовательностей этих сайтов. Используемый системой метод выявления особенностей ДНК может использоваться для анализа разнообразных сайтов в геномах эукариот. Выявленные характеристики… Читать ещё >


  • Актуальность проблемы
  • Цели и задачи исследования
  • Научная новизна
  • Научная и практическая ценность
  • Публикации
  • Структура работы
  • Благодарности
  • Вклад автора
  • Принятые сокращения
    • 1. 1. Особенности структурно-функциональной организации геномной ДНК
      • 1. 1. 1. Общие сведения о структуре двойной спирали ДНК
      • 1. 1. 2. Конформационные и физико-химические контекстно-зависимые свойства ДНК
      • 1. 1. 3. Контекстно-зависимые конформационные и физико-химические свойства ДНК как особый тип кода, значимого для функционирования геномов
    • 1. 2. Регуляция транскрипции генов эукариот. Транскрипционные факторы и топоизомераза
      • 1. 2. 1. Структурно-функциональная организация 5'-регуляторных районов, контролирующих транскрипцию генов эукариот
      • 1. 2. 2. Классификация транскрипционных факторов
      • 1. 2. 3. Основные типы ДНК-связывающих доменов транскрипционных факторов
        • 1. 2. 3. 1. ДНК-связывающий домен типа спираль-поворот — спираль
        • 1. 2. 3. 2. ДНК-связывающий домен, координированный ионами цинка
        • 1. 2. 3. 3. ДНК-связывающий домен, обогащенный положительно заряженными аминокислотными остатками
        • 1. 2. 3. 4. Домен типа ß--скэффолд
      • 1. 2. 4. Конформация ДНК в комплексах с транскрипционными факторами
      • 1. 2. 5. ДНК топоизомераза
    • 1. 3. Компьютерные методы распознавания функциональных последовательностей ДНК
      • 1. 3. 1. Метод консенсуса
      • 1. 3. 2. Метод весовых матриц
      • 1. 3. 3. Метод скрытых Марковских цепей и байесовские сети
      • 1. 3. 4. Метод дискриминантного анализа
      • 1. 3. 5. Метод конформационных параметров: система B-DNA Video
      • 1. 3. 6. Метод статистического потенциала
      • 1. 3. 7. Статистические характеристики, используемые для сравнения точности методов распознавания
      • 1. 3. 8. Метод филогенетического футпринтинга

Компьютерный анализ конформационных и физико-химических особенностей функциональных сайтов геномной ДНК эукариот (реферат, курсовая, диплом, контрольная)


Регуляция транскрипции играет ключевую роль в механизмах регуляции экспрессии генов. У эукариот этот процесс контролируется огромным количеством разнообразных белковых молекул, которые в процессе сложнейших ДНК-белковых и белок-белковых взаимодействий обеспечивают выполнение функций транскрипционного аппарата. Одним из основных механизмов регуляции экспрессии генов на уровне транскрипции является процесс взаимодействия белков — факторов транскрипции с сайтами их связывания в регуляторных районах генов. В процесс транскрипции вовлечена также топоизомераза. Связываясь с ДНК, она обеспечивает сохранение топологии спирали ДНК в процессах транскрипции и репликации. Исследование особенностей связывания белковых факторов с последовательностями ДНК является одним из ключевых моментов для понимания основ регуляции транскрипции.

Приблизительная оценка числа сайтов связывания транскрипционных факторов (ССТФ) в геноме дает числа более сотен тысяч (Ко1сЬапоу et а1, 2007). Экспериментальное выявление такого количества сайтов является чрезвычайно сложной и дорогостоящей задачей. Один из путей решения этой проблемы основан на создании эффективных методов планирования экспериментов по выявлению сайтов связывания транскрипционных факторов. В связи с этим важнейшее значение приобретает создание точных методов предсказания ССТФ, обеспечивающих минимальное число ложных предсказаний, что, в свою очередь, дает возможность рационального планирования эксперимента по выявлению ССТФ (Ко1сЬапоу е^ а1, 2007; Меркулова и др., 2007).

Как правило, каждый транскрипционный фактор обладает способностью связываться с набором сайтов, сходных по нуклеотидной последовательности. В настоящее время существует большое число методов распознавания потенциальных сайтов связывания, основанных на анализе контекстного сходства. Однако эти методы, как правило, не учитывают, или недостаточно эффективно используют данные о контекстно-зависимых конформационных и физико-химических особенностях ДНК сайтов связывания.

Многочисленные экспериментальные данные, полученные за последние 20 лет, однозначно свидетельствуют о том, что геномная ДНК неоднородна как по конформации, так и по своим физико-химическим свойствам (Suzuki et al., 1997). Накоплен большой объем экспериментальных данных по пространственному строению двойной спирали ДНК, ДНК-белковых комплексов, а также о зависимостях локальных конформационных и физико-химических свойств двойной спирали ДНК от нуклеотидной последовательности. В то же время, как экспериментальные данные, так и компьютерный анализ и теоретическое обобщение этих данных показывают, что способность регуляторных белков взаимодействовать с двойной спиралью ДНК в сильной степени зависит от ее локальных конформационных и физико-химических свойств (Starr et al., 1995; Meierhans etal., 1997; Ponomarenko et al., 1997).

Однако количество научных публикаций по распознаванию ССТФ на основе анализа контекстно-зависимых конформационных и физико-химйческих свойств ДНК весьма ограничено (Kolchanov et al., 2007; Меркулова и др., 2007). В связи с этим актуальной задачей является разработка компьютерных подходов к анализу контекстно-зависимых конформационных и физико-химических свойств сайтов связывания транскрипционных факторов и построения на этой основе точных методов их распознавания в геномной ДНК эукариот. Использование данных о контекстно-зависимых конформационных и физико-химических свойствах при анализе сайтов связывания транскрипционных факторов может привести не только к повышению качества их распознавания, но и позволит получить полезную информацию об особенностях ДНК-белковых взаимодействий.


Целью работы являлось выявление особенностей контекстно-зависимых конформационных и физико-химических свойств ДНК функциональных сайтов в геномах эукариот с помощью компьютерного анализа и создание на этой основе подхода для планирования экспериментов по выявлению сайтов связывания регуляторных белков.

В работе были поставлены следующие задачи:

1. Разработка компьютерного метода выявления контекстно-зависимых конформационных и физико-химических особенностей ДНК функциональных сайтов.

2. Проведение компьютерного анализа конформационных и физико-химических свойств ДНК сайтов связывания различных транскрипционных факторов и сайтов расщепления ДНК топоизомеразой 1 человека.

3. Разработка методов распознавания потенциальных сайтов связывания различных транскрипционных факторов, в частности, 8Р-1, БЯЕВР и гетеродимера Е2Р/ОР на основе выявленных значимых конформационных и физико-химических свойств этих сайтов.

4. Создание Интернет-доступной компьютерной системы для анализа и распознавания сайтов связывания транскрипционных факторов, создание информационного ресурса по особенностям конформационных и физико-химических свойств для доступных выборок сайтов связывания транскрипционных факторов и методам их распознавания.

5. Проведение планирования экспериментов по локализации сайтов связывания транскрипционных факторов 8Р-1 и 8ЯЕВР в промоторных районах генов млекопитающих.


Впервые показано наличие значимых консервативных контекстно-зависимых конформационных и физико-химических свойств ДНК в выборках различных классов последовательностей функциональных сайтов — сайтов связывания транскрипционных факторов и сайтов расщепления ДНК топоизомеразой I человека. Впервые разработана система 81ТЕС (Ж, представляющая собой реализованный в виде компьютерной программы комплекс методов для выявления консервативных конформационных и физико-химических свойств сайтов связывания транскрипционных факторов (ССТФ) и распознавания с использованием этих данных потенциальных ССТФ. С помощью этой системы исследованы конформационные и физико-химические особенности сайтов связывания четырех типов транскрипционных факторов (8Р-1, ЯЯР, МСМ1 и Е2Р/ОР). Показано, что сайты каждого типа характеризуются уникальным набором конформационных и физико-химических особенностей двойной спирали ДНК, отличающих их от случайных последовательностей нуклеотидов. Анализ показал, что выявляемые консервативные конформационные и физико-химические свойства ДНК изученных функциональных сайтов отражают специфику ДНК-белковых взаимодействий. Впервые проведено планирование эксперимента по проверке потенциальных сайтов связывания SF1 и SREBP. Независимо проведенная экспериментальная проверка выявленных сайтов показала высокую эффективность применяемого комплекса методов.


Разработанная система SITECON обеспечивает возможность выявления значимых консервативных контекстно-зависимых конформационных и физико-химических особенностей ДНК функциональных сайтов на основе анализа выборок последовательностей этих сайтов. Используемый системой метод выявления особенностей ДНК может использоваться для анализа разнообразных сайтов в геномах эукариот. Выявленные характеристики ДНК функциональных сайтов являются основой для создания методов их распознавания в геномной ДНК. Система SITECON обладает высокой производительностью и может применяться для массового анализа сайтов связывания транскрипционных факторов, информация о значимых конформационных и физико-химических особенностях которых накапливается в соответствующей базе знаний. В настоящее время эта база знаний содержит результаты анализа 220 выборок последовательностей сайтов связывания различных транскрипционных факторов и методы их распознавания. Проведенные исследования показали высокую точность распознавания сайтов связывания транскрипционных факторов системой SITECON, что критически значимо для эффективного планирования экспериментов по выявлению таких сайтов в геномах эукариот. Система SITECON доступна по сети Интернет (http://vywwrngs.bionet.nsc.ru/mgs/proa-ams/sitecon/) и может применяться в учебном процессе как в курсах биоинформатики (информационной биологии), так и в курсах экспериментальной молекулярной биологии.

Представленный в диссертации комплекс методов SITECON был успешно применен для распознавания сайтов связывания транскрипционных факторов SF-1, SREBP, FOXA, E2F/DP, IRF, ISGF3, STAT, NF-kB, COUP-TF, PPAR, HSF, AhRa также использован при планировании эксперимента по распознаванию сайтов SF-1 и SREBP в промоторах генов млекопитающих. Получено авторское свидетельство № 2 006 610 270 «Программа для определения консервативных свойств в сайтах связывания транскрипционных факторов и их распознавания (САЙТКОН) / The tool for detecting conservative properties in transcription factor binding sites and for site recognition (SITECON)», автор: Ощепков Д. Ю., зарегистрировано 10.01.2006.


По теме диссертационной работы опубликовано 33 работы, из них 9 статей в рецензируемых и ведущих журналах, 5 из которых входят в список ВАК, и 6 публикаций в монографиях. Результаты работы представлены на 10 российских и 2 зарубежных конференциях в виде устных докладов и стендовых сообщений, среди которых первая, вторая, третья, четвертая, пятая и шестая международные конференции по биоинформатике, структуре и регуляции генома (г. Новосибирск, август 1998 г., июль 2000 г., июль 2002 г., август 2004 г., июль 2006 г., июнь 2008 г.) — международная конференция по компьютерной молекулярной биологии, (Москва, июнь 2003 г.) — 27th International Symposium on Halogenated Persistent Organic Pollutants «Dioxin 2007», 2−7 September, 2007; Conference on modeling and simulation in biology, medicine and biomedical engineering. Linkoping, Sweden, May 26−27, 2005.

Структура работы.

Диссертационная работа состоит из введения и обзора литературы (глава I), трёх разделов, содержащих основные результаты (главы IIIV), выводов, списка цитированной литературы (267 ссылок). Работа изложена на 177 страницах, содержит 41 рисунок и 28 таблиц. Нумерация рисунков, таблиц и формул производится отдельно для каждой главы.


1. Создана Интернет-доступная компьютерная система SITECON для выявления консервативных контекстно-зависимых конформационных и физико-химических свойств различных функциональных сайтов в геномной ДНК, на основе которой разработаны методы распознавания сайтов связывания транскрипционных факторов.

2. Анализ последовательностей сайтов расщепления ДНК топоизомеразой I человека выявил набор значимых консервативных контекстно-зависимых конформационных и физико-химических свойств ДНК для этих сайтов: угол наклона основанийсдвиг пары основанийугол поворота спиралишаг спиралиразмер малой бороздки ДНКтемпература плавления ДНК.

3. В результате анализа выборок нуклеотидных последовательностей 220 типов сайтов связывания транскрипционных факторов показано, что каждый из типов сайтов характеризуется набором статистически значимых консервативных контекстно-зависимых конформационных и физико-химических свойств ДНК, информация о которых, а также созданные на их основе методы распознавания сайтов доступны по адресу http://vwAvmgs.bionet.nsc.ru/mgs/prog.rams/sitecon/.

4. Анализ сайтов связывания транскрипционного фактора E2F/DP, участвующего в регуляции генов клеточного цикла млекопитающих показал, что наиболее значимыми характеристиками являются увеличенная ширина большой и малой бороздок ДНК, что согласуется с данными рентгеноструктурного анализа. Разработанный на основе набора выявленных значимых характеристик ДНК этих сайтов метод распознавания характеризуется низким значением ошибок первого и второго рода. С использованием аналогичного подхода разработаны методы распознавания сайтов связывания транскрипционных факторов SF-1 и SREBP.

5. Проведено планирование эксперимента по выявлению новых потенциальных сайтов связывания транскрипционных факторов SF-1 и SREBP в промоторных районах генов стероидогенеза и липидного метаболизма, соответственно. Определены параметры методов, при которых экспериментальная проверка методом задержки в геле подтвердила связывание всех выявляемых сайтов (18 и 15) с факторами SREBP и SF-1, соответственно.



Настоящая диссертационная работа посвящена исследованию особенностей контекстно-зависимых конформационных и физико-химических свойств ДНК функциональных сайтов в геномах эукариот с помощью компьютерного анализа и созданию на этой основе подхода для планирования экспериментов по выявлению сайтов связывания регуляторных белков. Известно, что процесс взаимодействия транскрипционных факторов с ДНК является одним из механизмов регуляции транскрипции и одновременно решающим образом зависит от локальных свойств двойной спирали ДНК. В то же время имеющиеся методы анализа и распознавания сайтов связывания транскрипционных факторов либо не учитывают этих свойств ДНК, либо обладают рядом недостатков, не позволяющих использовать их для анализа протяженных геномных последовательностей.

Для решения этой проблемы был проведен компьютерный анализ контекстно-зависимыхконформационных и физико-химических свойств нуклеотидных последовательностей сайтов связывания различных транскрипционных факторов. Показано, что выборки функциональных сайтов ДНК характеризуются наличием консервативных конформационных и физико-химических свойств и эти данные можно использовать для их распознавания. В рамках диссертационной работы был создан комплекс методов для выявления консервативных свойств двойной спирали ДНК, характерных для выборок сайтов связывания транскрипционных факторов, на основе которых может быть осуществлено распознавание потенциальных сайтов. Комплекс методов был реализован в виде компьютерных программ и объединен в Интернет-доступной компьютерной системе 81ТЕС (Ж http://vvwwmgs.bionet.nsc.rii/mgs/programs/sitecon/).

С использованием системы 8ГГЕС (Ж было показано, во-первых, что для каждой из проанализированных в диссертации выброк сайтов связывания транскрипционных факторов (8Е-1, 8КБ, МСМ1 и Е2Е/ОР) существует уникальный набор консервативных конформационных и физико-химических свойств двойной спирали ДНК, и, во-вторых, что эти особенности отражают молекулярные механизмы ДНК-белковых взаимодействий. В частности, для факторов 8Е-1, ЗЯБ и МСМ1 было показано, что определенное распределение значений некоторых свойств двойной спирали ДНК вдоль последовательности сайта (например, изгибной жесткости в сторону большой и малой бороздок (8Щ?, МСМ1) или персистентной длины (8Р-1)) может способствовать изгибам оси ДНК в результате взаимодействия с транскрипционным фактором. Способность изгибать ДНК при взаимодействии, в свою очередь, является одним из свойств ТФ, напрямую связанных с возможным механизмом их воздействия на транскрипцию, таким, как создание оптимальной конформации ДНК и/или изменение структуры хроматина. По-видимому, выявляемые особенности двойной спирали ДНК в районе сайтов связывания транскрипционных факторов могут иметь прямое отношение к механизму регуляции транскрипции.

Применение комплекса методов системы 81ТЕС (Ж не ограничено анализом сайтов связывания транскрипционных факторов и позволяет проводить также анализ других важных с биологической точки зрения сайтов в составе геномной ДНК. Проведен компьютерный анализ последовательностей сайтов расщепления ДНК топоизомеразой I человека. Показано наличие ряда консервативных контекстно-зависимых конформационных и физико-химических свойств ДНК, потенциально обеспечивающих оптимальное взаимодействие этих участков ДНК с ферментом.

Система 81ТЕССЖ эффективно использует только контекстно-зависимые конформационные и физико-химические свойства ДНК для распознавания сайтов связывания транскрипционных факторов. Сравнение качества распознавания разработанного метода с существующим аналогом — методом весовых матрицпоказало, что использование данных о консервативных конформационных и физико-химических свойствах двойной спирали ДНК позволяет достигать качества распознавания как минимум не хуже, а в ряде случаев — лучше существующего аналога. Не в последнюю очередь эффективность данного подхода обусловлена учетом информации, которая теряется при распознавании ССТФ с использованием метода весовых матриц, основанном на допущении о том, что нуклеотиды взаимодействуют с белком независимо друг от друга. Комплекс методов системы 81ТЕС (Ж позволяет избежать использования этого допущения, что улучшает качество распознавания.

Разработанный комплекс методов был успешно применен в ряде экспериментальных исследований. Так, с использованием системы 81ТЕС (Ж проведено планирование эксперимента по выявлению новых потенциальных ССТФ SF-1 в промоторных районах генов стероидогенеза и SRJEBP в промоторных районах генов липидного метаболизма. Определены параметры методов, при которых экспериментальная проверка методом задержки в геле подтвердила связывание всех выявляемых сайтов (18 и 15) с факторами SREBP и SF-1, соответственно (Игнатьева и др., 2007; 2009).

Система SITECON также была использована в экспериментально-теоретических исследованиях. Комплекс методов SITECON был успешно применен для распознавания сайтов связывания транскрипционных факторов IRF, ISGF3, STAT, NF-кВ (Ananko et al, 2002, 2006), COUP-TF, PPAR (Proscura et al., 2002), HSF (Furman et al., 2002), E2F/DP (Oshchepkov et al, 20 046- Turnaev et al, 2004), AhR (Nedosekina et al, 2007), FOXA (Брызгалов и др., 2008).

Получено авторское свидетельство № 2 006 610 270 «Программа для определения консервативных свойств в сайтах связывания транскрипционных факторов и их распознавания (САЙТКОН) / The tool for detecting conservative properties in transcription factor binding sites and for site recognition (SITECON)», автор: Ощепков Д. Ю., зарегистрировано 10.01.2006.

Показать весь текст

