БИОИНФОРМАТИКА: ОТ ЭКСПЕРИМЕНТА К КОМПЬЮТЕРНОМУ АНАЛИЗУ И СНОВА К ЭКСПЕРИМЕНТУ

 


Примерно в середине 50-летия, отделяющего нас от открытия структуры двойной спирали ДНК, в молекулярной биологии произошел мощный технологический прорыв: Ф. Сэнгер, Ф. Максам и В. Гильберт предложили методики быстрого секвенирования ДНК, то есть установления последовательности нуклеотидов в геноме. Уже в 1978 г. было опубликовано 200 статей, описывавших секвенированные нуклеотидные последовательности, затем объем этих данных стал расти в геометрической пропорции. Были сделаны наблюдения, изменившие устоявшиеся представления о линейной последовательности генов в ДНК: перекрывающиеся гены, сплайсинг и альтернативный сплайсинг (механизм порождения множественных РНК, соответствующих одному и тому же гену), рекомбинация генов иммуноглобулинов.
Существенную роль в развитии геномных подходов сыграли банки нуклеотидных последовательностей. Довольно быстро стало понятно, что невозможно сопоставлять последовательности, сравнивая вручную длинные ряды букв, приводимых на рисунках к статьям. Уже в 1979 г. было начато обсуждение того, как хранить последовательности ДНК и РНК и как обеспечивать доступ к ним. Первые выпуски банков данных GenBank (США) и EMBL (Европа) появились в 1982 г., и уже в следующем году они сыграли существенную роль в биологической работе: сходство последовательностей онкогена v-sis из вируса саркомы обезьян и фактора роста тромбоцитов, обнаруженное при сравнении новосеквенированного гена со всеми опубликованными, послужило основой для гипотезы о сходстве воздействия онкогенов и нормальных клеточных белков, экспрессирующихся на определенных стадиях жизни клетки. С тех пор сравнение новой последовательности с последовательностями из банка данных стало рутинным элементом работы с любым геном, а помещение каждой новой последовательности в банк - необходимым условием журнальной публикации.
Подробности в ноябрьском номере журнала Вестник РАН.

SPIN