Помощь в учёбе, очень быстро...
Работаем вместе до победы

Биологические базы данных

РефератПомощь в написанииУзнать стоимостьмоей работы

На первичные БД, хранящие результаты молекулярно-биологических исследований. Как правило, это последовательности и структуры биологических полимеров (Genbank, EMBL, DDBJ, SWISS-PROT, TREMBL, PIR, PDB); На архивные базы данных, фактически являются хранилищем файлов определенного формата, предоставляемых учеными. Как правило, это первичные базы данных наподобие PDB; Курируемые базы данных… Читать ещё >

Биологические базы данных (реферат, курсовая, диплом, контрольная)

Основы структур баз данных

Одной из базовых задач биоинформатики является хранение и организация доступа к накопленным массивам биологической информации. Реализуют данную задачу с применением технологий баз данных (БД). Базы данных представляют собой информационные модели, содержащие данные об объектах и их свойствах. Они хранят информацию о группах объектов с одинаковыми наборами свойств. Простыми бытовыми примерами БД можно считать любые справочники, энциклопедии, записные книжки и каталоги. Информация в базах данных хранится в упорядоченном виде, что позволяет обеспечить удобный доступ к нужным фрагментам хранимой информации.

Технически БД можно представить как набор таблиц, каждая их которых предназначена для хранения информации об объектах одного типа. Каждая строка таблицы содержит данные одного объекта и называется записью. При этом столбцы, формирующие строку, называются полями, и каждое поле описывают какую-либо характеристику объекта. Поскольку для каждой записи в БД должна существовать возможность уникальной идентификации, часто выделяют отдельный тип записи для хранения подобной информации, а данное иоле называют ключевым. Также следует отметить, что возможно существование полей, содержащих в качестве значения ссылку на объект того же или другого типа, позволяя, таким образом, хранить информацию об иерархических и сетевых связях объектов содержащихся в БД.

По характеру хранимых данных биологические БД можно разделить:

  • • на первичные БД, хранящие результаты молекулярно-биологических исследований. Как правило, это последовательности и структуры биологических полимеров (Genbank, EMBL, DDBJ, SWISS-PROT, TREMBL, PIR, PDB);
  • • вторичные, данные в которых являются результатом обработки первичной биологической информации. Типичными примерами являются БД, хранящие информацию о паттернах, обнаруживаемых в последовательностях, разного рода классификации последовательностей и структур (PROSITE, Pfam, BLOCKS, PRINTS, DSSP, SCOP);
  • • составные (композитные) БД. Данный тип БД агрегирует информацию из первых двух видов, предоставляя расширенные по сравнению с отдельными БД возможности по поиску и навигации в данных (NRDB, OWL, GO).

По механизму наполнения базы данных можно разделить:

  • • на архивные базы данных, фактически являются хранилищем файлов определенного формата, предоставляемых учеными. Как правило, это первичные базы данных наподобие PDB;
  • • автоматические базы данных, представляющие результат работы какого-либо метода. Часто по предыдущей классификации их можно отнести ко вторичным (DSSP);
  • • курируемые базы данных, наполнение которых контролируется группой/лабораторией/исследовательским центром, их поддерживающим. Типичный пример — SWISS-PROT.

Поскольку биоинформатика ориентирована на автоматическую обработку данных, основу большинства первичных и вторичных биологических баз данных составляют файлы определенного формата. В каждом подобном файле хранится информация об одном основном объекте данной БД, например данные о пространственной структуре одного комплекса в случае БД PDB (см. параграф 4.2). Обычно пользователь редко работает с самим файлом, поскольку веб-интерфейс сайта БД предоставляет более удобное для человека представление информации об объектах в виде различного рода сводных таблиц, последовательностей символов, рисунков и ссылок на другие сайты, содержащие дополнительную связанную информацию. Однако всегда следует помнить, что, как правило, данные файлы доступны для скачивания (при необходимости).

Показать весь текст
Заполнить форму текущей работой