Файл: Методы для поиска в данных практической информации.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 12.01.2024

Просмотров: 30

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Биоинформатика включает в себя изучение и разработку компьютерных методов и направлена на получение, анализ, хранение, организацию и визуализацию биологических данных. Вычислительные биологи – это специалисты, которые специализируются на решение биологических задач, при помощи вычислительных систем и инструментов. Основными направлениями биоинформатики являются: биоинформатика последовательностей (поиск последовательностей в геноме человека), анализ экспрессий (анализ того, как наследственная информация от участка ДНК преобразуется в РНК или белок), структурная биоинформатика (анализ и предсказание трехмерной структуры белка, РНК и ДНК).

В биоинформатике применяются прикладная математика, статистика, информатика и другие предметы. Биоинформатика востребована в разных областях, таких как: биохимия, биофизика, генетика, экология и другие. Специалист работающий по профессии биоинформатик должен владеть различными языками программирования, владеть языками запросов к базам данных, обладать умением в структурирование и анализе данных.

Главной целью биоинформатики является понимание и предсказывание биологических процессов. При этом используются и создаются интенсивные вычислительные методы такие как:

  • распознавание предметов, процессов, сигналов и так далее в различных биологический процессах,

  • методы для поиска в данных практической информации,

  • машинное обучение,

  • визуализация биологических данных,

  • и другие.

Основные усилия направлены в следующие области:

  • анализ генетических полседовательностей,

  • аннотация геномов,

  • вычислительная эволюционная биология,

  • оценка биологического разнообразия.

Анализ генетических последовательностей – это сравнение генома в рамках одного или нескольких видов, с целью нахождения одинаковых фрагментов. При помощи этого метода составляются филогенетические деревья, которые показывают эволюционные взаимосвязи между различными видами. Так как при поиске схожих фрагментов генома приходится анализировать тысячи различных генов
, состоящих из миллиардов пар нуклеотидов, приходится использовать специальные программы. Данные программы могут достаточно точно сопоставить похожие последовательности ДНК в геномах разных видов. При этом части такие последовательности могут иметь мелкие мутации, выраженные заменой, вставкой или выпадением отдельных нуклеотидов. В данном случае помогает машинное обучение, которое обучаясь на уже расшифрованных участках ДНК разных видов, понимает, где мутации, а где – нет.

Аннотация геномов – процесс маркировки генов и других объектов в последовательности ДНК. Специалисты, опираясь на уже известные функции генов, декодируют другие части генома. При этом так же применяются специальные программы, зачастую с использованием нейросетей.

Вычислительная эволюционная биология - раздел биологии, исследующий происхождение и появление видов, а так же их развитие. При этом используются следующие инструменты:

  • изучение эволюции большого числа организмов, путем анализа изменений ДНК, а не только изменение строения или физиологии,

  • сравнение генома, что дает информацию о эволюционных событиях, таких как хромосомные перестройки или же удвоение хромосом, передача генетического материала организму-непотомку и так далее,

  • создание компьютерных симуляций, чтобы предсказывать как поведет себя система в будующем.

Благодаря этому разделу можно проследить как изменялся тот или иной вид, а так же визуализировать возможные варианты, как будет изменятся вид в будущем.

Оценка биологического разнообразия – метод, при помощи которого определяют полную генетическую совокупность среды (капля воды, горсть земли, вся биосфера планеты Земля или живой организм), состоящую из всех обитающих видов. Для структурирования используются базы данных, а далее это визуализируется и анализируется. Так же при помощи специального компьютерного обеспечения симулируют модели популяционной динамики или вычисляют общее генетическое здоровье культуры, что может быть полезным агрономам. Один из важнейших потенциалов этой области – анализ последовательностей ДНК вымирающих видов для предотвращения этого в будущем или использовать результаты генетического эксперимента природы, если вид уже вымер.


Таким образом, биоинформатика – область науки, востребованная начиная от медицины, заканчивая сельским хозяйством, без которой другие науки не смогли бы существовать.