Файл: The role of digital technologies in potato breeding.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 25.10.2023

Просмотров: 21

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

УДК:

Роль цифровых технологий в селекции картофеля

Байгарашев Тимур

E-mail: baigarashevtimur@mail.ru

THE ROLE OF DIGITAL TECHNOLOGIES IN POTATO BREEDING

Bayrashev Timur
Аннотация. Программа селекции растений включает в себя сотни экспериментов, каждый из которых имеет большое количество записей, генеалогическую информацию, связанный план эксперимента, списки обработок, наблюдаемые признаки и анализ данных. Традиционный метод организации информации о программе разведения, а также записи и обслуживания данных не является централизованным и всегда разбросан по разным файловым системам, что неудобно для извлечения информации о разведении, что приводит к плохому управлению данными и потере важных данных. Администрирование данных требует значительного количества рабочей силы и ресурсов для ведения питомников, испытаний, линий зародышевой плазмы и родословных. Кроме того, транскрипция данных в разбросанных электронных таблицах и файлах приводит к номенклатуре и опечаткам, что влияет на анализ данных и решения по отбору в программах разведения. Точные инструменты записи данных и управления могут повысить эффективность программ разведения.

Abctract. The plant breeding program includes hundreds of experiments, each of which has a large number of records, genealogical information, an associated experiment plan, treatment lists, observed signs and data analysis. The traditional method of organizing information about the breeding program, as well as recording and maintaining data, is not centralized and is always scattered across different file systems, which is inconvenient for extracting information about breeding, which leads to poor data management and loss of important data. Data administration requires a significant amount of manpower and resources to maintain nurseries, trials, germ plasm lines and pedigrees. In addition, transcription of data in scattered spreadsheets and files leads to nomenclature and typos, which affects data analysis and selection decisions in breeding programs. Accurate data recording and management tools can improve the efficiency of breeding programs.
Ключевые слова: цифровые технологии, селекционные программы, управление селекционными данными, оцифровка данных, фенотипирование, точное разведение.

Key words: digital technologies, breeding programs, breeding data management, digitization of data, phenotyping, precise breeding.

Большие объемы фенотипических данных получены в результате тысяч экспериментов, проведенных в тепличных/полевых условиях. Управление таким огромным объемом данных имеет решающее значение для селекционных исследований. Во многих ситуациях эти задачи выполняются несколькими людьми в разное время, в разных местах и ​​разными способами, что приводит к разным уровням сложности и неточности сбора данных. Из-за несоответствий в данных, которые могут пересекаться между разрозненными хранилищами, качество данных часто страдает. Для масштабирования селекционных операций в 21 веке крайне важна оцифровка данных о селекционной работе. Внедрение цифровых селекционных платформ помогает отслеживать селекционные материалы, хранить результаты экспериментов, данные о генотипе, записывать данные о фенотипе и применять алгоритмы для анализа, прогнозирования и отбора. Цифровизация также позволяет селекционеру создавать кроссы, питомники, планировать планировку полей, отслеживать родословные и анализировать данные для получения значимой информации за короткое время для создания превосходных сортов и клонов [2, с. 419].


Концепция цифровизации для сбора фенотипических данных в селекции растений была предложена в 1990-х годах, но масштабы программ были ограничены из-за отсутствия высокопроизводительных вычислительных систем и приложений. Независимо от того, какую стратегию фенотипирования выбирают селекционеры, успех селекционной программы зависит от ее способности эффективно управлять данными. Это решающий фактор, который следует учитывать при использовании больших объемов данных с высокой пропускной способностью. Доступ к данным для сотрудников, простая аналитика, правильное время выбора линии и безопасное среднесрочное и долгосрочное хранение данных зависят от правильного проектирования и реализации конвейера потоковой передачи данных.

Разработке программного обеспечения, позволяющего осуществлять цифровой сбор фенотипических данных в полевых условиях, способствовало внедрение высокопроизводительных компьютеров. Несмотря на то, что в глобальном масштабе было разработано передовое программное обеспечение по информатике селекции для управления и анализа данных селекции, степень его внедрения в программы селекции государственного сектора по-прежнему остается низкой. В результате многие селекционные программы не имеют доступа к историческим наборам данных, в то время как другие не имеют ресурсов для создания долгосрочных надежных наборов данных, необходимых для обоснованных решений по разведению. Крайне важно перейти к оцифровке полученных данных, учитывая огромный объем информации, собранной с помощью генотипирования, тепличных/полевых экспериментов, а также затраты и трудозатраты, связанные со сбором этой информации.

IB FieldBook – это инструмент с открытым исходным кодом, который помогает селекционерам в создании полевых журналов, сборе фенотипических данных и анализе собранных данных для одной и нескольких сред. Этот инструмент использовался для различных культур, например, нута, арахиса, маниоки, бобов, вигны, пшеницы, риса, сорго и кукурузы. IB Fieldbook поддерживает как формат электронной таблицы Microsoft Excel (XLS), так и формат значений, разделенных запятыми (CSV). Импортированные данные можно редактировать в удобном для пользователя интерфейсе и сохранять в базе данных, откуда их затем можно экспортировать в определенный формат программирования для статистического анализа.



PhenoApp – это инструмент с открытым исходным кодом на базе Android, который помогает селекционным программам оцифровывать сбор данных. Проект PhenoApp направлен на повышение общей эффективности программ селекции за счет интеграции и улучшения существующих программ обработки изображений, моделирования и сбора данных с помощью удобных мобильных приложений. Он включает в себя полевой журнал для сбора данных и Intercross для управления скрещиваниями [5, с. 28].

Field Book, удобное для пользователя приложение для работы в полевых условиях, с большим успехом использовалось в программах разведения по всему миру. Field Book устраняет ошибки транскрипции, собирает данные в режиме реального времени и обеспечивает быстрый анализ данных. Это дает селекционерам простой способ сбора данных с полевых участков. Это также позволяет разработчикам дополнительно настраивать его в соответствии со своими индивидуальными потребностями в сборе данных. Полевая книга создает множество папок, таких как экспорт полей, импорт полей, данные графика, ресурсы, база данных и признаки. В Field Book можно загрузить файлы XLS и CSV. В полевой книге данные собираются путем создания признаков. Панель черт позволяет пользователю управлять существующими чертами, а также создавать новые черты или изменять существующие. В Field Book доступны двенадцать различных форматов признаков, а именно: числовой, процентный, категориальный, дата, текст, логическое значение, счетчик, фото, рейтинг болезни, местоположение, мультикат и аудио. Параметр «Импорт и экспорт» на панели инструментов можно использовать для создания и передачи списков характеристик между различными устройствами. Полевой журнал совместим с программным обеспечением «Система управления разведением» (BMS), и файлы, созданные в BMS, могут быть перенесены в полевой журнал и наоборот. Приложение Field Book можно синхронизировать с BMS для прямой передачи данных в BMS.

Intercross – это Android-приложение с открытым исходным кодом для планирования, отслеживания и управления скрещиваниями. Заводчики могут использовать два различных интерфейса для отслеживания хода целевых скрещиваний: базовый список с различными комбинациями и сетка с конкретными родительскими комбинациями. Интеркросс определяет, является ли скрещивание открытым опылением, самоопылением, поликроссом или двуродительским на основе родительской комбинации. Intercross также может зафиксировать всю новую партию семян или процесс создания семейства. Intercross также имеет встроенное сканирование штрих-кода, что позволяет пользователям быстро просматривать отдельные кросс-страницы путем поиска определенных кросс-идентификаторов по штрих-коду. При использовании сложной идентификации образцов интеграция штрих-кода значительно снижает количество ошибок. Intercross позволяет пользователям группировать людей, устанавливать уникальную идентификацию, и распечатать этикетку со штрих-кодом, чтобы
упростить отслеживание кроссов в программах, создающих поликроссы [3, с. 236].

Phenobook – еще один простой и удобный инструмент для организации, сбора и сохранения экспериментальных данных для последующего анализа. Phenobook был создан для сбора фенотипических наблюдений простым и экономичным способом. Он включает веб-программное обеспечение для планирования экспериментов, ввода и визуализации данных, а также экспорта, а также мобильное приложение для удаленного сбора данных. Ожидается, что Phenobook улучшит соответствующие процедуры за счет уменьшения ошибок ввода, что приведет к повышению качества и надежности исследований.

PhenoTyper: еще один простой и недорогой инструмент, PhenoTyper – это приложение с открытым исходным кодом для управления данными, в котором используются мобильные устройства или персональные цифровые помощники (КПК). Схемы создаются из опубликованных онтологий. Интерфейс КПК хранит данные в формате Extensible Markup Language (XML) и CSV. Консорциум Plant Ontology (PO) был использован для создания контролируемого словаря в PhenoTyper.

Приложение Phenom: Приложение Phenom – это приложение для Android с открытым исходным кодом, которое повышает эффективность сбора фенотипических данных в открытом поле/теплице/питомнике и т.д. Приложение Phenom разработано Phenome Networks Ltd, Израиль. Он заменяет старый метод с ручкой и бумагой, экономя время, сводя к минимуму опечатки, связывая фотографии с данными о признаках и позволяя пользователям просматривать прошлые данные для принятия более эффективных решений. Его используют более 70 частных организаций по всему миру.

GridScore: GridScore — это инструмент фенотипирования растений для сбора, визуализации и обмена данными. В GridScore доступны такие функции, как привязка GPS, маркировка изображений и распознавание речи. GridScore использует API Web Speech, IndexedDB и дисплеи High Dots Per Inch (HiDPI). Он объединяет визуальное представление вида плана поля с системой штрих-кода. Данные каждого этапа программы разведения можно просматривать, извлекать и распечатывать в виде штрих-кодов [1, с. 41].

Поскольку компьютеры теперь имеют встроенные микрофоны и звуковые карты, запись голоса не требует дополнительного оборудования. Программное обеспечение для распознавания голоса преобразует данные в форматы, необходимые для дальнейших исследований, включая числовой формат. Включение речевого интерфейса позволяет собирать полевые данные без помощи рук, и можно использовать многие другие инструкции без использования дополнительных кнопок. Речевой интерфейс также может быть доступен для пользователей, не говорящих по-английски, поскольку программное обеспечение на основе речи было создано для разных языков – это программное обеспечение для сбора данных на базе Windows и Android, которое предлагает голосовые команды для ввода данных и навигации с помощью функции «Command & Control». Smatrix предлагает широкий выбор языков, и можно легко записывать данные на своем родном языке. Кроме того, Smatrix может управлять акцентами или диалектами, поскольку он адаптируется к произношению. Smatrix с подходящей гарнитурой включает систему шумоподавления для уменьшения нежелательного фонового шума. Кроме того, если произносятся значения, выходящие за пределы определенного диапазона значений, генерируется сообщение об ошибке. В зависимости от эксперимента пользователи сообщают, что скорость сбора данных при использовании Smatrix увеличивается до четырех раз.


Другой конвейер для записи голоса и диктовки для сбора, ввода и проверки полевых данных был разработан Ref. Этот конвейер полностью автоматизирует этап ввода данных, устраняя необходимость в партнере на всех этапах сбора и проверки данных. Это означает, что один человек может собирать данные так же эффективно, как и команда из двух или более человек. Этот конвейер использует цифровое устройство записи звука и бесплатное программное обеспечение [6, с. 117].

Так, например, в 2019 году в Индии была начата миграция родительских линий в BMS, и в настоящее время было добавлено 4918 линий зародышевой плазмы, включая рекуррентные родительские линии, передовые селекционные клоны и разновидности. Были созданы блоки скрещивания и селекционные питомники для двух селекционных программ, и предпринимаются усилия по воспроизведению этой работы и в других программах. В рамках Всеиндийского проекта скоординированных исследований по картофелю начиная с 2020 года и далее все основные многоцентровые испытания разрабатывались в BMS, а данные импортировались непосредственно в виде таблиц Excel, полученных из различных центров AICRP в формате BMS. Кроме того, все испытания картофеля AICRP за последние 10 лет были переработаны в BMS и загружены в виде онлайн-репозитория для будущего использования. Унифицированная единая платформа от выбора родительских линий до финального мультилокального тестирования AICRP уменьшит сложности и ошибки в программах разведения.

Таким образом, можно заключить, что успешный процесс размножения зависит от надежного и эффективного управления данными, включая их хранение, поиск и анализ. Традиционные методы записи и сбора данных, как правило, отнимают много времени, являются дорогостоящими и обычно предполагают значительное вмешательство человека, что увеличивает вероятность ошибок при транскрипции. Более того, селекция требует широкого и точного фенотипирования популяций растений для успешного применения геномных стратегий для введения желаемых признаков. Объем данных увеличивается день ото дня, что затрудняет интерпретацию вручную и принятие решений. Недавнее внедрение инструментов оцифровки и программного обеспечения для управления данными селекции демонстрирует отслеживание и мониторинг программы селекции в режиме реального времени и безопасное хранение данных для будущих приложений. Доступно несколько приложений для управления селекционными данными, которые используются для различных культур, включая картофель. Недавние технологические достижения в области анализа речи также сделали программное обеспечение для распознавания речи доступным для исследователей для аудиозаписи данных. Внедрение инструментов управления данными в