Современные компьютерные программы и базы данных в области молекулярной генетики моделирование данных

1.

Современные компьютерные
программы и базы данных в
области молекулярной генетики
Моделирование данных
Выполнила студентка 1 курса 142 группы
Направления подготовки магистратуры
06.04.01 Биология
Биологического факультета
Сергеева Раиса Витальевна

2.

ВВЕДЕНИЕ
Решение большинства генетических задач немыслимо без
достижений биоинформатики с использованием современных
баз данных по метаболическим и генным сетям в процессах
тканевой и клеточной дифференцировки различных животных.
Весьма эффективным при этом может оказаться разработка и
эксплуатация методов математического моделирования
процессов развития, а также использование информационных и
компьютерных технологий для реконструкции и визуализации в
трехмерном пространстве процессов морфогенеза органов и
тканей.
2

3.

ГЕНЕТИЧЕСКОЕ
МОДЕЛИРОВАНИЕ
Генетическое моделирование использует признаки
теории Дарвина для построения интеллектуальных
систем (методы группового учёта, генетические
алгоритмы). Является частью более обширной
области искусственного интеллекта —
вычислительного интеллекта.
3

4.

Эволюционное моделирование — это уже достаточно
сложившаяся область, в которой можно выделить:
• модели возникновения молекулярно-генетических информационных систем;
• моделирование общих закономерностей эволюции (Эволюционные
алгоритмы). Это системы, которые используют только эволюционные
принципы. Они успешно использовались для задач типа функциональной
оптимизации и могут легко быть описаны на математическом языке. К ним
относятся эволюционные алгоритмы, такие как Эволюционное
программирование, Генетические алгоритмы, Эволюционные стратегии,
Генетическое программирование;
• эволюционные модели. Это системы, которые являются биологически более
реалистичными, чем эволюционные алгоритмы, но которые не оказались
полезными в прикладном смысле. Они больше похожи на биологические
системы и менее направлены на решение технических задач. Они обладают
сложным и интересным поведением, и, видимо, вскоре получат
практическое применение. К этим системам относят так называемую
искусственную жизнь;
• прикладное эволюционное моделирование;
4

5.

1
Программы обработки двоичных матриц
PopGene;
Past;
Arlequin;
Structure;
NewHybrids;
5

6.

PopGene - это программа, позволяющая изучать популяционную генетику.
Она состоит из восьми модулей, каждый из которых посвящен одному
признаку популяционной генетики.
Past - программное обеспечение для анализа научных данных, функции для
манипулирования данными, построение графика, одномерная и
многомерная статистика, экологический анализ, временные ряды и
пространственный анализ, морфометрия и стратиграфия.
Arlequin предоставляет большой набор основных методов для получения
информации о генетических и демографических особенностях наборов
генетико-популяционных данных.
Structure представляет собой пакет программного обеспечения для
использования данных о генотипах нескольких локусов для исследования
структуры популяции.
NewHybrids - это программа, использующаяся для оценки апостериорной
вероятности того, что генетически отобранные особи попадают в каждую из
заданных пользователем категорий гибридов.
6

7.

7

8.

2
Программы обработки нуклеотидных
последовательностей
BioEdit
Mega
SplitsTree4
TCS
8

9.

BioEdit - редактор выравнивания биологических последовательностей.
MEGA представляет собой интегрированный инструмент для проведения
автоматического и ручного выравнивания последовательностей,
построения филогенетических деревьев, изучения баз данных в Интернете,
оценки скорости молекулярной эволюции, определения
последовательностей предков и проверки эволюционных гипотез.
SplitsTree4 является ведущим приложением для вычисления неукорененных
филогенетических сетей на основе данных о молекулярных
последовательностях.
TCS - компьютерная программа Java для оценки генеалогий генов, включая
мультифуркации и / или ретикуляции. Оценка сети, реализованная в TCS,
также известна как статистическая экономия. Кладистический анализ
фенотипических ассоциаций с гаплотипами, полученный на основе
картирования рестрикционные эндонуклеаз и данных о последовательности
ДНК.
9

10.

3
Программы для работы с метаданными и
сборки геномов
Ugene — это бесплатный кроссплатформенный пакет
для анализа генома.
Geneious это исследовательский инструмент,
предназначенный для биологов, а не компьютерщиков.
10

11.

11

12.

4
Международная база генетических
данных NCBI GenBank
GenBank — база данных, находящаяся в открытом доступе, содержащая все
аннотированные последовательности ДНК и РНК, а также последовательности
закодированных в них белков. GenBank поддерживается Национальным
центром биотехнологической информации США (NCBI), входящего в состав
Национальных Институтов Здоровья в США, и доступен на бесплатной основе
исследователям всего мира. GenBank получает и объединяет данные,
полученные в разных лабораториях, для более чем 100 000 различных
организмов.
GenBank — архивная база данных, то есть ответственность за содержимое
каждой записи несут создатели этой записи, которыми, как правило, являются
экспериментаторы, определившие данную последовательность. GenBank
вместе с банками EMBL и DDBJ входит в консорциум INSDC, осуществляющий
регулярный обмен данными между этими тремя архивами аннотированных
нуклеотидных последовательностей.
12

13.

5
Проверка и конвертация генетических
данных с помощью BLAST
BLAST (англ. Basic Local Alignment Search Tool —
средство поиска основного локального выравнивания)
— семейство компьютерных программ, служащих для
поиска сходных аминокислотных или нуклеотидных
последовательностей. Используя BLAST,
исследователь может сравнить имеющуюся у него
последовательность с последовательностями из базы
данных и найти предполагаемые гомологи. Является
важнейшим инструментом для молекулярных
биологов, биоинформатиков и систематиков.
13

14.

6
Регистрация генетических данных
Генетические данные объективно требуют специального
регулирования, о чем свидетельствует законодательство многих
стран, где деятельность в сфере генетики куда более
последовательно и полно регламентирована, нежели чем в
Российской Федерации. Необходимость специального
регулирования обусловлена тем, что генетические данные
обладают не просто индивидуальной ценностью для человека, к
которому относятся эти данные, но и социальной (общественной
ценностью). Генетические данные касаются здоровья (физического
и психического), интимной жизни человека и – что делает их
особенными – его родственников, а также тесно связаны с такими
личными аспектами, как происхождение, родство, прошлое,
настоящее и будущее состояние человека.
14

15.

СПАСИБО ЗА ВНИМАНИЕ!
15
English     Русский Правила