Системная биология предполагает переход от исследования отдельных генов и белков к анализу структуры и динамики целостных систем, образуемых при взаимодействии различных биомолекул,. Белки редко выполняют свои функции изолированно. Большинство клеточных процессов являются результатом совместного действия множества белков и других молекул, физически ассоциированных в комплексы или задействованных… Читать ещё >


  • Список сокращений
  • 1. Обзор литературы
    • 1. 1. Постгеномные технологии
    • 1. 2. Системная биология
    • 1. 3. Базы данных и стандарты описания биологических взаимодействий
    • 1. 4. Функциональный анализ постгеномных данных
  • 2. Материалы и методы
    • 2. 1. Массивы данных
    • 2. 2. Анализ дифференциальной экспрессии
    • 2. 3. Множества генов для классификации
    • 2. 4. Функциональный анализ
    • 2. 5. Анализ сетей
    • 2. 6. Анализ интерактома
    • 2. 6. Интеграция и согласованность списков
  • 3. Результаты и обсуждение
    • 3. 1. Изменения экспрессии генов при псориазе и болезни Крона
    • 3. 2. Функциональное сравнение предикторов для различных фенотипов опухолей грудной железы
    • 3. 3. Сравнение изменений транскриптома и протеома при псориазе
  • 4. Обсуждение
    • 4. 1. Сравнение различных массивов микрочиповых данных
    • 4. 2. Интеграция данных разных постгеномных технологий
    • 4. 3. Алгоритм интегративного анализа
  • Выводы

Интегрированный анализ различных типов данных постгеномных исследований для идентификации ключевых путей мультигенных заболеваний (реферат, курсовая, диплом, контрольная)

В последнее десятилетие успехи молекулярной биологии и генетики сделали возможным широкомасштабное изучение строительных блоков жизни — генов и белков [1]. После этого перед исследователями встала проблема: как использовать полученный каталог молекулярных элементов клетки для решения проблем биологии и медицины. Эта необходимость вызвала развитие новой отрасли вычислительной биологии — системной биологии [2].

Системная биология предполагает переход от исследования отдельных генов и белков к анализу структуры и динамики целостных систем, образуемых при взаимодействии различных биомолекул [3], [4]. Белки редко выполняют свои функции изолированно. Большинство клеточных процессов являются результатом совместного действия множества белков и других молекул, физически ассоциированных в комплексы или задействованных в специфичных регуляторных путях [5]. Разнообразные взаимодействия между молекулами — белок-белковые связи, регуляторные связи факторов транскрипции с промоторами генов, метаболические превращения молекул — составляют сложную глобальную систему. Зная структуру этой системы, можно исследовать ее динамические характеристики при различных условиях. Например, изменения активности или концентрации белков при некотором воздействии на клетку можно использовать для идентификации конкретных молекулярных механизмов, задействованных в реакции системы на это воздействие.

Технологические достижения последних десятилетий в молекулярной биологии дали исследователям возможность проводить широкомасштабные исследования динамики биологических систем. Возник целый ряд так называемых постгеномных методов, позволяющих одномоментно получить информацию практически обо всех компонентах системы на том или ином уровне. В частности, существуют методы высокопроизводительного измерения экспрессии генов [6], концентрации белков или метаболитов [7], генотипирования полиморфизмов и обнаружения мутаций в геноме [8]. Особенно большую популярность приобрел полногеномный анализ экспрессии генов при помощи микрочипов, в силу своей доступности и относительной технической простоты [9]. Объем данных такого рода, полученных для различных организмов и фенотипов, растет огромными темпами [10]. В настоящее время перед исследователями стоит проблема эффективного использования всех этих массивов информации. Трудности состоят как в технологических особенностях применяемых методов (многие из них генерируют данные с большим уровнем шума), так и в их обширности [11]. К примеру, из оценок экспрессии для десятков тысяч генов необходимо извлечь биологически осмысленную информацию, дающую новое знание об исследуемом явлении. Еще одна проблема состоит в трудности сопоставления и интеграции различных типов молекулярных данных.

Анализ постгеномных данных особенно необходим для прояснения молекулярных механизмов мультифакторных заболеваний [12], [13]. Самыми известными примерами таких недугов являются различные злокачественные опухоли, нейродегенеративные заболевания — болезни Альцгеймера и Паркинсона [14], [15], диабет 1 типа. Еще один широкий класс синдромов, относящихся к мультифакторным заболеваниям — аутоиммунные болезни [16]. Эти синдромы связаны с повреждениями органов и тканей собственной иммунной системой человека при отсутствии видимых причин активации иммунных клеток. К ним относятся такие болезни, как ревматоидный артрит, псориаз [17], болезнь Крона, волчанка [18] и десятки других менее распространенных синдромов. Мультифакторные заболевания широко распространены в человеческой популяции и являются одной из главных причин смертности во всем мире. Предполагается, что эти болезни развиваются на основе многочисленных факторов предрасположенности, как генетического характера, так и обусловленных внешней средой. Генетические основы и механизмы мультифакторных заболеваний, несмотря на активные исследования в этой области, изучены пока недостаточно [12]. Предполагается, что комбинированное воздействие многих генетических полиморфизмов с малым эффектом и изменений условий окружающей среды порождает стабильные изменения в нормальном функционировании регуляторных систем клеток [19].

Постгеномные технологии используются для исследования молекулярных механизмов заболеваний, поиска мишеней для терапевтического вмешательства, классификации подтипов заболеваний, которые по-разному реагируют на терапию, поиска биологических маркеров заболеваний [20], [21]. Тем не менее, в изучении и терапии мультифакторных заболеваний остается немало нерешенных вопросов и проблем. Несмотря на значительный прогресс в изучении молекулярной механики этих патологий (в первую очередь — неопластических заболеваний), причины и механизмы нарушений регуляции для большинства из них остаются неизвестными.

Системная биология предлагает необходимые принципы для продуктивного анализа механизмов мультифакторных заболеваний. Любые постгеномные данные (микрочиповые, протеомные данные, данные о геномных перестройках) можно анализировать в контексте глобальной биологической сети, выявляя пути и биологические процессы, задействованные в исследуемых явлениях [22]. Системный подход эффективен для идентификации механизмов тех или иных явлений, поиска причинных факторов, приводящих к наблюдаемому явлению.

В то же время, необходимы как усилия по созданию как можно более полных сетей биологических взаимодействий, так и новые алгоритмы системного анализа постгеномных данных в этих сетей. Особенно важным представляется создание подходов, способных легко интегрировать различные типы постгеномных данных в одной аналитической инфраструктуре, выявляя их сходства и различия на системном уровне.

Настоящая работа посвящена разработке и применению методов идентификации ключевых регуляторных путей, задействованных в мультифакторных заболеваниях, при помощи биологических сетей.

Цель работы:

Разработка и применение подходов для эффективного совместного анализа различных типов постгеномных данных с помощью методов системной биологии. Оценка применимости используемых подходов на различных массивах данных, полученных для разнообразных мультигенных заболеваний.


1. Найти общие и уникальные биологические пути, характерные для псориаза и болезни Крона с помощью анализа данных экспрессии генов;

2. Определить метод, дающий наилучшие результаты для классификации различных подтипов рака грудной железы на основании экспрессионных данных;

3. Реконструировать ключевые пути сигнальной трансдукции, характеризующие патологию псориаза на основании экспрессионных и протеомных данных;

4. Проанализировать набор существующих подходов для интегрированного анализа постгеномных данных.



1. В результате сравнительного анализа изменений экспрессии генов при псориазе и болезни Крона, найдены гены со значимо измененной экспрессией в обоих исследованных массивов данныхвыделены модули биологических сетей, связывающих эти гены. Найдены общие и уникальные сигнальные пути, участвующие в этих патологиях.

2. Проведено функциональное сравнение множеств информативных генов, отобранных пятью отдельными методами для трех отдельных задач классификации профилей экспрессии в раке грудной железы: классификация статуса эстрогенового рецептора в опухоли (ЕЯ), классификация повышенной чувствительности к химиотерапии (рСЯ) и классификация повышенной чувствительности к химиотерапии в ЕЯ-отрицательных опухолях. Определен метод, дающий наилучшие результаты при классификации различных подтипов рака молочной железы на основании экспрессионных данных. На уровне генов множества объектов для классификации: а) схожи между собой для разных методов отбора в пределах одного классифицируемого фенотипаб) различаются для одного и того же метода отбора при разных фенотипах. На функциональном уровне повторены выводы для уровня генов, а также выявлено, что множества информативных генов для фенотипов ЕЯ и рСЯ функционально схожи и входят в единую подсеть с главным регулятором — рецептором эстрогена.

5. Обнаружен ряд путей сигнальной трансдукции, характеризующих патологию псориаза на основе экспрессионных и протеомных данных. Определен список мембранных рецепторов, которые инициируют важные сигнальные пути (в том числе более 20 рецепторов, ранее не исследовавшихся с связи с псориазом). Выявлено, что число путей, потенциально значимых для активации псориаз-специфического экспрессионного ответа, достаточно велико, что может указывать на причины малой эффективности лекарственной терапии этой болезни.

4. Проведен анализ существующих подходов для интегрированного анализа постгеномных данных. Предложен подход интегративного анализа различных типов постгеномных данных при помощи поиска топологически значимых регуляторов в биологической сети.

Показать весь текст

