В начале 2017 года в МГУ имени М. В.Ломоносова заработала информационная система, созданная в рамках проекта «Ноев ковчег». Она содержит данные об образцах из биологических коллекций университета и партнеров проекта. Аналогов подобной информационной системы, позволяющей оперировать информацией о биологических образцах самой разной природы, а также управлять хранилищами биоматериала, в мире не существует. Актуальная версия системы доступна для всех желающих.
Представленные в системе данные и организмы уже активно используются в работе учеными-участниками проекта «Ноев ковчег», что отражено в опубликованных ими статьях, последние из которых вышли в журналах Molecular Phylogenetics and Evolution, PLOS ONE и Photosynthesis Research.
Ученые МГУ имени М. В.Ломоносова создают для каждого образца из коллекций подробные паспорта, содержащие разностороннюю информацию о каждом из «коллекционных» организмов. Важно не только присутствие образца в коллекции, но и его подробное описание: что это за организм, кем, где и когда он был собран, чем примечателен и для чего его можно использовать в науке и практике. По словам руководителя направления «Микроорганизмы и грибы» Алексея Соловченко, информационная система имеет потенциал для того, чтобы стать настоящей базой знаний о живых организмах, хранящихся в депозитарии. Она может хранить не только описание самих организмов, но и все методики работы с ними: как их культивировать, изучать и сохранять долгое время. Это критически важно для коллекций одноклеточных организмов, таких как бактерии и микроводоросли.
«Основной принцип работы системы — адаптивная форма паспорта образца, которая изначально вмещает минимум информации, присущей каждому образцу независимо от типа биоматериала и коллекции: данные о том, где и каким образом был получен образец, а также информацию о живом организме, из которого взят материал. Остальная часть паспорта настраивается так, чтобы оптимально и полно отражать сведения, специфичные для разных живых существ и единиц хранения, от бактерий до животных», — сообщает научный координатор проекта «Ноев ковчег», ведущий научный сотрудник биологического факультета МГУ Петр Каменский.
Важной «изюминкой» системы является возможность автоматической загрузки уже известных сведений о хранящихся организмах из авторитетных международных баз данных, таких как Catalog of Life, NCBI GenBank и другие. Таким образом, паспорт образца может содержать самую разнообразную информацию, вплоть до последовательности генома организма.
«Встроенный в систему геномный браузер находится в разработке. У нас есть с десяток геномов образцов, чьи геномы были секвенированы нами в рамках проекта „Ноев ковчег“. Для других образцов требуется разрабатывать выход к внешним базам данных — задачу определять все геномы самостоятельно мы перед собой не ставим. Да это и невозможно: слишком много в наших коллекциях образцов, чтобы даже мечтать об их тотальном секвенировании. Так что интегрироваться с существующими базами данных — это единственное возможное решение», — рассказывает координатор проекта.
Впоследствии система «обрастет» биоинформатическими сервисами, с помощью которых пользователи депозитария извлекут максимум пользы из хранящейся в нем информации и биоматериала.
Создание столь масштабной электронной системы требует строгой упорядоченности образцов, для чего было произведено штрихкодирование. Каждому образцу был присвоен уникальный штрих-код, который наносится непосредственно на образец. Сфотографировав штрих-код обычным смартфоном, можно за доли секунды найти в базе данных всю доступную информацию о данном образце, загрузить его паспорт. Разработчики планируют создать удобный инструментарий для работы с информацией, содержащейся в системе, и внедрить возможность оформления онлайн-заявки для получения биологического материала как внутренним, так и сторонним пользователям.
Число доступных в системе образцов постоянно увеличивается за счет загрузки новых коллекций и добавления информации из уже имеющихся.
«На данный момент в систему загружено около 510 тыс. образцов, 500 тыс. из которых — гербарные образцы, а около 10 тыс. — подробно охарактеризованные микроорганизмы. Для них, помимо микрофотографий, в систему загружены подробные описания, вплоть до предпочитаемого „меню“ и „отпечатков пальцев“ (фрагментов последовательностей генома). К концу 2018 года мы планируем загрузить в информационную систему все образцы, которые есть в коллекциях МГУ», — комментирует Петр Каменский.
Информационная система разработана с таким расчетом, чтобы в ней могли размещаться данные по коллекциям не только МГУ, но и других научных организаций. Таким образом, впервые создан прототип системы, способной объединить в информационном поле все российские биоколлекции.
«Сейчас в системе находится 19 коллекций, процесс инвентаризации, оцифровки и загрузки данных продолжается. Физически коллекции Депозитария МГУ располагаются в тех лабораториях, в которых с ними работают. Если взять биологический факультет, то там находится как минимум сто коллекций. Раньше владельцы коллекций друг про друга знали мало, и, соответственно, пользоваться коллекциями могли только те люди, которые непосредственно с ними работали. С вводом в действие нашей информационной системы ситуация кардинально поменялась», — говорит Петр Каменский.
Создание информационной системы Депозитария МГУ имени М. В.Ломоносова проходит в рамках гранта Российского научного фонда «Научные основы создания Национального банка-депозитария живых систем» (научная часть проекта «Ноев ковчег»).