Новый программный комплекс «Taxon.pro» облегчит жизнь биологам

«Taxon.pro» — это биоинформационная система, предназначенная для исследования и идентификации биологических объектов в сети Интернет. Её авторы — аспирант Санкт-Петербургского государственного лесотехнического университета (СПбГЛТУ) Александр Геннадьевич Хмарик совместно с коллегой Дмитрием Даниловичем Сластуновым — создали комплекс, состоящий из программы для заполнения данных и интернет-приложения, которое позволяет оперативно найти нужный элемент и изучить его свойства.

Интерфейс Taxon.proПетербуржцы представили свою работу на прошедшей III (V) Всероссийской конференции «Перспективы развития и проблемы современной ботаники», организованной Центральным сибирским ботаническим садом (ЦСБС) СО РАН.

— С 2010 года вместе со специалистами из Ботанического института им. В. Л. Комарова (БИН РАН) и Зоологического института (ЗИН РАН) мы ведём работу в области компьютерной систематизации и уточнения морфологических характеристик биологических таксонов, — рассказывает Александр Хмарик. — Для учёных важно создать такую компьютерную систему, которая бы усовершенствовала работу с информацией в области ботаники и, в частности, систематики растений.


Таксон — это конкретный биологический объект из группы организмов, связанных определенной степенью родства.


Результатом исследования стало создание универсального электронного многовходового определителя. Что это такое? Это комплекс, который ищет объект, или таксон, по его характерным признакам.


Первые опыты по созданию электронных определителей относят к 1960-м годам. В нашей стране первая система «Диагностика-1» была разработана в 1974 году ведущим научным сотрудником ЗИН РАН, кандидатом биологических наук Андреем Львовичем Лобановым.


Работы 40-летней давности помогли аспирантам из СПбГЛТУ создать электронные многовходовые ключи. Если раньше печатные определители позволяли найти таксон по строго заданному пути, то сейчас стало возможным определить объект при любом наборе признаков.

Первой базой данных, которую подготовили петербуржцы с помощью данного программного продукта, стал определитель аборигенных и интродуцированных видов хвойных растений Северо-Запада России. В него вошли 137 таксонов, 130 морфологических признаков, причем каждое свойство объекта содержит несколько значений. Представленные классы для удобства объединили в 12 групп.

Главную задачу, которую поставили перед собой учёные для конкретной базы — точнее описать диагностические признаки вегетативных и репродуктивных органов хвойных растений.

С помощью программы уже можно узнать вид хвойного дерева— Заполнение системы началось еще в 2010 году и продолжается по сей день. Такая длительность связана с отработкой технологий — мы делали подобный проект в первый раз. Самым сложным было сгруппировать таксоны по критериям. Например, описание цвета побега может достигать 20 состояний. Нам пришлось унифицировать и ограничить набор внутри каждого признака, оставив от двух до девяти значений, — объясняет аспирант из Санкт-Петербурга. — При всём при этом база по хвойным уже достаточно долго лежит в открытом доступе и постоянно обновляется, проект «живёт». В итоге он вылился в настоящее научное исследование, в ходе которого нам пришлось собрать огромное количество фотоматериала, наладить контакты со многими отечественными и зарубежными специалистами, консолидировать знания из большого числа малоиспользуемых источников. Многие данные пересматриваются и уточняются по несколько раз, это иногда даже позволяет выявить ошибки и неточности в используемых печатных материалах.

База видов хвойных растений — не единственная наработка в арсенале молодых ученых. Чуть позже они сделали определитель и атлас дендрофильных насекомых средней полосы России. О том, как работает система «Taxon.Pro» на примере древесных вредителей, инженер-программист Дмитрий Сластунов рассказал на прошедшей конференции по ботанике:

— В системе существуют три основных представления и поиска данных. Первое — это браузер таксонов, действующий подобно веб-браузеру. При двойном щелчке по объекту открывается карточка элемента, где описаны его признаки. Второе — многовходовый определитель, который позволяет находить таксоны по его характеристикам и их значениям. Третий вариант отбора — автоматический — действует по принципу печатных ключей, — объясняет Дмитрий Сластунов. — Готовя базу дендрофильных насекомых, мы в качестве характерных признаков взяли древесные породы, используемые в озеленении Санкт-Петербурга, участки повреждений и их типы. В итоге искомый таксон определяется по ущербу, который оставляют древесные вредители.

Дальше начинается техническая сторона дела: подготовка авторских фотографий, полевого материала, отечественных и зарубежных гербариев. Для наиболее естественной передачи изображений были придуманы специальные методы фотографирования с цветокаллибровочной шкалой.

— Работа над полноценной иллюстрированной справочно-аналитической системой занимает от полугода. Сроки зависят от объема и сложности вводимой информации и изначальной степени её структурированности. При подготовке любой базы много времени уходит на формализацию терминов, наполнение и проверку данных, — уточняет Александр Хмарик. — Часто у научных сотрудников уже есть все сведения, которые можно автоматизировано перевести в нужный формат. Бывают проблемы с мотивацией у людей, ведь финансирование на такие проекты найти сложно, но в целом большинство специалистов хотят делиться своими научными достижениями.

Благодаря новому программному комплексу, ученые-ботаники уже создают ряд определителей. В частности, они начали разрабатывать базу данных однолетних астрагалов совместно с сотрудником БИН РАН, доктором биологических наук Андреем Кирилловичем Сытиным, где будут детальнее проверять теоретическую концепцию признака на примере хорошо изученных таксонов.

Браузер таксонов и признаковПрограммный комплекс «Taxon.pro» сейчас находится на начальном этапе развития. В дальнейшем планируется введение инструментов визуального сравнения фотографий, освоение 3D-сканирования объектов живой природы с возможностью просмотреть модель прямо в веб-браузере, а также поддержка функций статистического анализа с применением популярного в Европе языка «R».


«R» — язык программирования для статистической обработки данных и работы с графикой, а также свободная программная среда вычислений с открытым исходным кодом.


На сайте taxon.pro можно ознакомиться с результатами исследовательской работы аспирантов СПбГЛТУ. Проект является открытым: любой специалист может воспользоваться возможностями системы для публикации собственных данных.

Полина Гостева

Фото: 1, 3  — из презентации докладчиков, 2 — Юлия Позднякова