Опубликовано 12.03 09:00

Автоматическая проверка «здоровья» семян: как нейросеть YOLOv8-Seg оценивает всхожесть кукурузы

На урожайность сельскохозяйственных культур влияют различные факторы, включая качество семян и условия окружающей среды. Оценка жизнеспособности семян является критически важной задачей для исследователей в области семеноводства, так как играет ключевую роль в определении их качества. Традиционно такая оценка проводилась вручную, что требует значительных временных и трудовых затрат. Для преодоления этого ограничения в данное исследование интегрированы модули ConvUpDownModule (специализированный сверточный модуль), C2f-DSConv (модуль C2f с интегрированной динамической змеевидной сверткой) и T-SPPF (модуль SPPF, объединенный с трансформерным механизмом многоголового внимания) в сеть VT-YOLOv8-Seg, представляющую собой усовершенствованную архитектуру YOLOv8-Seg.

Модуль ConvUpDownModule снижает вычислительную сложность и количество параметров модели. C2f-DSConv использует гибкие сверточные ядра для повышения точности сегментации границ зародышей кукурузы. T-SPPF интегрирует глобальную информацию для улучшения производительности многомасштабной сегментации. Предложенная модель предназначена для обнаружения и сегментации семян и зародышей кукурузы, что способствует автоматизации обнаружения прорастания и расчета его скорости. В задачах обнаружения модель VT-YOLOv8-Seg достигла точности 97,3%, полноты 97,9% и mAP50 98,5%, в то время как в задачах сегментации она продемонстрировала точность 97,2%, полноту 97,7% и mAP50 98,2%. Сравнительные эксперименты с Mask R-CNN, YOLOv5-Seg и YOLOv7-Seg дополнительно подтвердили превосходную производительность нашей модели как в обнаружении, так и в сегментации. Кроме того, с помощью исследований искусственного старения было изучено влияние старения семян на рост и развитие растений кукурузы. Были проанализированы такие ключевые показатели, как всхожесть и скорость роста ростков, тесно связанные с энергией прорастания, что демонстрирует эффективность предложенного подхода для оценки жизнеспособности семян.

Что касается мирового объема производства, кукуруза (Zea mays L.) является самой важной продовольственной культурой [1]. Во всем мире кукуруза выращивается на площади более 205 миллионов гектаров, а общий объем производства составляет около 1,2 миллиарда метрических тонн [2]. Ее значимость подчеркивает критическую необходимость оценки качества семян, особенно их жизнеспособности, что имеет важнейшее значение для семеноводческой отрасли [3]. Жизнеспособность семян играет ключевую роль в растениеводстве, так как урожайность и эффективность использования ресурсов в значительной степени зависят от успешного появления всходов в поле. В частности, жизнеспособность семян определяет их способность равномерно и дружно прорастать в различных условиях окружающей среды [4]. Это делает ее важнейшим показателем для оценки физиологического потенциала семян на различных этапах производства. Более того, оценка жизнеспособности семян помогает в отборе высококачественных партий семян для удовлетворения потребительского спроса, что дополнительно подчеркивает ее актуальность. Это важнейший инструмент для оценки физиологического потенциала семян на различных этапах производства. Кроме того, она служит основой для отбора высококачественных партий семян для удовлетворения потребительского спроса. Являясь ключевым показателем качества семян, который напрямую влияет на урожайность сельскохозяйственных культур, оценка прорастания семян остается фундаментальной задачей для исследователей в области семеноводства [5].

Традиционные методы оценки качества семян, особенно тестирования их жизнеспособности, в основном полагаются на трудоемкие и занимающие много времени ручные измерения. Традиционные тесты на прорастание подвержены субъективным ошибкам и часто ограничивают масштабируемость и эффективность оценок, что приводит к плохой воспроизводимости и противоречивым статистическим результатам между разными оценщиками. Таким образом, крайне необходим объективный, воспроизводимый, быстрый и финансово осуществимый метод измерения. Большинство методов тестирования семян, установленных Международной ассоциацией по тестированию семян (ISTA), оцениваются вручную с использованием различных стандартизированных процессов, адаптированных для конкретных культур [6]. Следовательно, существует острая потребность в более быстрых и эффективных способах определения момента прорастания семян.

Современные технологии анализа изображений были применены для обнаружения семян благодаря их способности автоматизировать процесс и предоставлять количественные измерения с минимальной ошибкой [7]. Были разработаны такие системы, как GERMINATOR и Seed Vigor Imaging System (SVIS), для оценки прорастания и жизнеспособности семян [8,9]. GERMINATOR анализирует цветовой контраст между зародышевым корешком и семенной кожурой для оценки прорастания у таких видов, как Brassica и Arabidopsis, в то время как SVIS определяет жизнеспособность семян, измеряя длину проростка по данным пикселей RGB. Несмотря на их полезность, эти методы все еще требуют ручного ввода или специализированного оборудования, что ограничивает их обобщаемость и эффективность.

В сельскохозяйственной отрасли нашла значительное применение технология машинного зрения, которая претерпела существенные усовершенствования [10,11,12,13]. Исследователи разработали методы, использующие технологию машинного зрения для проверки качества семян [14,15,16]. Для прогнозирования прорастания семян в ссылке [17] использовалась комбинация моделей картирования изображений и линейного дискриминантного анализа. В ссылке [18] использовалась модель K-ближайших соседей (KNN) для повышения точности оценки семян мангостина. Для оценки статуса прорастания семян риса в Таиланде в ссылке [19] была создана Система оценки прорастания семян риса (RSGES), основанная на классификаторах на базе искусственных нейронных сетей. Для классификации жизнеспособности семян чечевицы в ссылке [20] использовались методы интерактивного машинного обучения и анализа изображений проростков. Однако ручное извлечение признаков, используемое классическими классификаторами машинного обучения, приводит к более длительным периодам обучения и более низкой точности.

В последние годы в глубоком обучении был достигнут значительный прогресс, с широким применением в сельском хозяйстве. Это включает его использование в лотках для проращивания и чашках Петри для таких задач, как обнаружение, идентификация и анализ прорастания семян [21,22,23]. В ссылках [24,25] глубокое обучение было интегрировано с подходами машинного обучения для разработки крупномасштабных систем оценки прорастания. Эти системы используют UNet, модели гауссовских смесей и другие методы для идентификации признаков, связанных с прорастанием, у различных видов сельскохозяйственных культур. Кроме того, детекторы на основе сверточных нейронных сетей (CNN), такие как Mask R-CNN и Faster R-CNN, использовались для выделения областей интереса для обнаружения прорастания семян [26,27]. Однако их зависимость от собственных наборов данных и высокие требования к вычислительным ресурсам ограничивают их доступность.

Алгоритмы серии YOLO (You Only Look Once) стали надежной альтернативой, предлагая легковесную архитектуру и возможности быстрого обнаружения. Исследователи использовали модели на основе YOLO для обнаружения прорастания семян с замечательным успехом. Например, в ссылке [28] была разработана Система оценки жизнеспособности семян пшеницы (WSVAS) с использованием YOLOv4, достигнув средней точности (mAP) 97,59% и полноты 97,35%. Аналогично, в ссылках [29,30,31] были представлены модели, такие как SGR-YOLO и CSGD-YOLO, которые дополнительно оптимизировали вычислительную эффективность и точность обнаружения для различных типов семян. Для обнаружения статуса прорастания семян кукурузы в разные временные интервалы Чэнь и др. [32] создали набор данных на основе чашек Петри о статусе прорастания семян кукурузы в разное время прорастания. Несмотря на эти достижения, существующие исследования в основном фокусируются на обнаружении прорастания, им не хватает всесторонних метрик, таких как оценка жизнеспособности семян и скорости роста ростков.

Чтобы определить скорость и энергию прорастания семян кукурузы, в этом исследовании была разработана модель глубокого обучения, способная обнаруживать и сегментировать прорастание семян на различных этапах старения. Три различных эксперимента по старению были проведены в камере старения, а эксперименты по прорастанию проводились с использованием чашек Петри при комнатной температуре. Фотографии делались с часовыми интервалами для документирования процесса прорастания. Поскольку энергия прорастания является наиболее значимым фактором в индексе оценки жизнеспособности семян, обнаружение прорастания служит важнейшим шагом. Однако существующим исследованиям не хватает методов, которые интегрируют обнаружение энергии прорастания с сегментацией, особенно учитывая изменение размера ростка, вызванное различиями в жизнеспособности семян на стадии прорастания. Это исследование восполняет эти пробелы, предлагая инновационный подход к оценке жизнеспособности семян с использованием модифицированной модели YOLOv8-Seg. Вклад этого исследования заключается в следующем:

(1) Разработка модели VT-YOLOv8-Seg: На основе модели YOLOv8n мы внедрили несколько усовершенствований, включая ConvUpDownModule, C2f-DSConv и T-SPPF. Эти улучшения обеспечивают точную сегментацию тел и почек семян кукурузы.

(2) Интеграция сегментации экземпляров для анализа прорастания: Предложенная модель применяет методы сегментации экземпляров для выделения областей ростков, обеспечивая точный расчет скорости прорастания и предоставляя всестороннюю оценку качества семян.

(3) Применение в исследованиях старения: Модель была использована для анализа индексов прорастания семян кукурузы после обработки искусственным старением, что дало представление о влиянии старения семян на рост и развитие урожая.

Мы предлагаем быстрый, точный и масштабируемый метод для интеллектуального обнаружения прорастания семян, предлагая практическое решение для оценки жизнеспособности семян в сельскохозяйственном производстве. Решая задачи оценки как энергии прорастания, так и жизнеспособности семян, это исследование не только вносит вклад в область автоматизированной оценки семян, но и служит ценным справочным материалом для будущих исследований по развитию культур и эффектам старения семян.

2.1. Сбор данных

Для исследования жизнеспособности семян они были классифицированы на основе чистоты поверхности и однородности. Критерии отбора семян включали однородность размера, цвета и видимого физического состояния, чтобы минимизировать мешающие факторы во время анализа. Поврежденные, обесцвеченные или имеющие неправильную форму семена были исключены. Продолжительность старения была установлена как T0 (контрольная группа), T1 (24 ч), T2 (48 ч) и T3 (72 ч). Для каждой группы было отобрано по тридцать семян. Три набора семян подверглись экспериментам по старению в условиях температуры 45 °C и влажности, превышающей 95%, что обеспечило среду с высокой температурой и влажностью. После старения семена были извлечены и хранились в прохладном, хорошо вентилируемом помещении.

Впоследствии исследования по прорастанию проводились при комнатной температуре для сравнения состаренных семян с исходными, не подвергшимися старению образцами. Стандартизированные тесты на прорастание, проведенные в соответствии с национальными стандартами, использовались для оценки таких факторов, как энергия прорастания, среднее время прорастания и другие соответствующие показатели. Чтобы улучшить видимость растущего зародышевого корешка на фоне, семена помещали в чашки Петри на черную ткань. Ткань смачивали водопроводной водой, а чашки Петри накрывали крышкой, чтобы минимизировать эффекты испарения воды и высыхания семян. Решетчатая крышка иногда могла создавать блики в зависимости от настроек камеры.

Различные стадии прорастания регистрировались с помощью методов цифровой съемки. Одно изображение захватывалось каждый час, что давало 24 изображения в день и 168 изображений в течение семи дней, в общей сложности 2016 изображений. Исследование было направлено на классификацию этих изображений на основе отдельных чашек Петри. Все изображения были сделаны при комнатной температуре в офисных условиях. Условия освещения были стандартизированы с использованием комбинации искусственного источника света и встроенного света камеры. В частности, офисная настольная лампа с цветовой температурой приблизительно 4000 K использовалась в паре со встроенным светодиодным светом камеры для обеспечения равномерного освещения. Эта схема освещения оставалась неизменной на протяжении всей съемки, которая длилась приблизительно семь дней. Чашки Петри были расположены в виде сетки 4 × 3, где колонки были обозначены как T0, T1, T2 и T3. Промышленная камера (YT-CAM8008LA-4K/4G) была расположена на фиксированной высоте 20 см над чашками Петри, чтобы обеспечить стабильный и неизменный обзор для регистрации процесса прорастания.

2.2. Предварительная обработка данных

Как показано на Рисунке 1а, изображение было разделено на более мелкие, одинакового размера участки, каждый из которых содержал одну чашку Петри. Как показано на Рисунке 1b, ограничивающие рамки были созданы вокруг каждого семени с помощью программы с открытым исходным кодом LabelMe, что позволило маркировать семена и создавать полигональные аннотации. Каждое изображение имело разрешение 640 × 640 пикселей и было в формате JPEG. Файл разметки в формате JSON был преобразован в TXT-файл, содержащий несколько координатных точек.

Рисунок 1. (a) Иллюстрация изображений, показывающих процесс прорастания семян в чашках Петри. Затем изображения были кадрированы, чтобы сфокусироваться на одной чашке Петри в каждом экземпляре. (b) Показан пример из набора данных LabelMe. (c) Изменения семян документировались в течение семи дней. Для презентации набора данных было выбрано первое изображение из каждого семидневного интервала.

Прорастание — это процесс появления зародышевого корешка из семенной кожуры. Для обучения и проверки модели в этом исследовании использовалось 120 семян, в результате чего было получено 2016 изображений семян. В каждую чашку Петри помещали по десять семян, и наблюдения систематически проводились каждый час в течение семи дней (168 ч) после первоначального размещения. Успешное завершение эксперимента позволило получить 168 изображений одного семени, сделанных с помощью этой технологии. Изменения в семени в течение семидневного периода показаны на Рисунке 1c, который включает изображения, отобранные из первоначальных наблюдений, проводимых каждые 24 ч.

Онлайн-аугментация данных, которая подразумевает операции дополнения набора данных в реальном времени, интегрирована в сеть YOLOv8 на этапе обучения модели. Во время обучения применяются такие методы онлайн-аугментации, как HSV-аугментация, случайная перспектива, MixUp и мозаика. Поскольку YOLOv8 выполняет онлайн-аугментацию для улучшения разнообразия и обобщающей способности набора данных модели, дополнительная автономная аугментация набора данных не требуется для оптимизации эффективности обучения.

Для этого исследования было собрано в общей сложности 2016 изображений прорастания семян кукурузы. Впоследствии весь набор данных был разделен на обучающую, валидационную и тестовую выборки в соотношении 7:2:1.

2.3. Построение модели сети

2.3.1. Структура сети YOLOv8-Seg

Исключительная точность и возможности быстрого обнаружения алгоритмической структуры YOLO (You Only Look Once) отличают ее от других методов обнаружения. Благодаря частым обновлениям и итерациям семейство моделей YOLO получило широкое признание как система обнаружения объектов в реальном времени. Она широко используется для обнаружения и классификации сельскохозяйственных культур, вредителей, болезней и других соответствующих аспектов в автоматизированном и точном земледелии.

YOLOv8 — это современный алгоритм обнаружения объектов, разработанный командой Ultralytics, который значительно улучшает YOLOv5, принимая безанкерную, одноэтапную структуру обнаружения [32]. Его архитектура разделена на четыре основных компонента: модуль ввода, магистраль (backbone), шея (neck) и голова (head). Модуль ввода интегрирует несколько передовых функций, таких как адаптивное масштабирование изображения, адаптивный расчет анкеров и мозаичная аугментация данных, что позволяет динамически настраивать входные изображения в соответствии с требованиями модели. Более крупные модели включают такие методы, как MixUp и CopyPaste, для улучшения разнообразия данных и повышения эффективности обобщения.

Магистраль использует улучшенный принцип проектирования ELAN, заменяя структуру C3 в YOLOv5 на более продвинутую структуру C2f. Эта модификация вводит дополнительные остаточные связи и ответвления, оптимизируя извлечение признаков при сохранении легковесной конструкции. Настройка количества каналов в зависимости от масштаба модели дополнительно улучшает производительность.

Шея включает в себя конструкции сети агрегации путей (PAN) [33] и сети пирамид признаков (FPN) [34] для эффективного объединения признаков разных масштабов. Эта структура улучшает способность к локализации объектов и захвату семантической информации, обеспечивая надежное многомасштабное слияние признаков.

Голова использует разделенную структуру, разделяя задачи классификации и локализации для повышения точности обнаружения. Принимая безанкерный подход, она устраняет необходимость в традиционных анкерных рамках, значительно увеличивая скорость обнаружения.

Модель сегментации экземпляров YOLOv8 (YOLOv8-Seg) является улучшением исходной структуры обнаружения объектов YOLOv8. Чтобы обеспечить сегментацию экземпляров на уровне пикселей, это расширение включает сеть YOLACT [35]. Для каждого объекта, обнаруженного на изображении, модель генерирует выходные данные, которые включают маску, метку класса и оценку достоверности. Модификации архитектуры YOLOv8-Seg были вызваны необходимостью повысить ее пригодность для сельскохозяйственных приложений. Обновленная модель включает передовые методы для эффективного изменения размеров объектов и их форм. Расширенные возможности сегментации обеспечивают точную идентификацию объектов неправильной формы, что необходимо для задач точного земледелия. Уточняя механизмы извлечения и слияния признаков, улучшенная YOLOv8-Seg достигает оптимального баланса между скоростью и точностью, что делает ее высокоэффективной для мониторинга сельского хозяйства в реальном времени. Рисунок 2 иллюстрирует структуру сети и детали YOLOv8-Seg.

Рисунок 2. Структура модели YOLOv8-Seg.

2.3.2. Структура сети VT-YOLOv8-Seg

Оценка семян традиционно выполняется исследователями вручную, что является трудоемким, отнимает много времени и подвержено ошибкам. Это исследование предлагает метод сегментации на основе YOLOv8-Seg, названный VT-YOLOv8-Seg, который не только обнаруживает прорастающие семена, но и отделяет семя от ростка, позволяя вычислять скорость роста ростка. Этот метод минимизирует подверженные ошибкам ручные шаги и повышает точность сегментации почек семян, сохраняя при этом компактную модель, работающую в реальном времени. Рисунок 3 представляет подробную архитектуру сети.

Рисунок 3. Диаграмма архитектуры сети VT-YOLOv8-Seg со всеми точками улучшения и некоторыми сетевыми деталями.

Структура сети VT-YOLOv8-Seg состоит из трех основных компонентов: головы, шеи и магистрали. Перед подачей изображения в магистраль выполняются первичные действия по подготовке данных, такие как аугментация данных. ConvUpDownModule обозначает модифицированный сверточный модуль, C2f_DSConv обозначает блок C2f, включающий DSConv, а T-SPPF — это улучшенный модуль SPPF, вводящий механизм многоголового внимания трансформера. Эти модули улучшают базовую структуру YOLOv8-Seg, повышая извлечение признаков, точность сегментации и вычислительную эффективность. ConvUpDownModule оптимизирует изучение признаков для наборов данных с однородным фоном, уменьшая избыточность и сохраняя производительность. DSConv обеспечивает точную сегментацию нерегулярных ростков семян, улучшая обнаружение краев, что критически важно для различения тонких или трубчатых форм. Наконец, T-SPPF использует механизмы самовнимания для захвата многомасштабных признаков, улучшая как локальное, так и глобальное контекстуальное понимание. VT-YOLOv8-Seg обеспечивает точную сегментацию семян и ростков в лабораторных условиях. Сетевые параметры почти идентичны параметрам исходной модели, за исключением добавления сетевого модуля. Ее особенности обеспечивают простоту использования и производительность в реальном времени, и она может работать на автономных устройствах.

2.3.3. ConvUpDownModule

Рисунок 4a иллюстрирует сверточный блок, используемый в архитектуре YOLOv8. В этом исследовании предлагается ConvUpDownModule, как показано на Рисунке 4b. Улучшенная архитектура YOLOv8 заменяет первые три набора сверток 3 × 3 в магистрали на ConvUpDownModule. Используя сетевые архитектуры DenseNet и ResNet, сначала применяются два ядра свертки 3 × 3 с s = 2 и p = 1 для уменьшения размера исходных карт признаков до одной четверти от входных карт признаков, после чего следуют остаточные соединения для облегчения изучения признаков.

Рисунок 4. (a) Сверточный блок YOLOv8. (b) Структура ConvUpDownModule. «33» относится к ядру свертки размером 3 на 3.

Набор данных по прорастанию семян кукурузы, собранный в лабораторных условиях, имеет относительно однородный фон. Уменьшение карты признаков помогает отфильтровать избыточную информацию, сохраняя при этом существенные признаки. Меньшая карта признаков приводит к уменьшению количества параметров для обработки последующими слоями, тем самым ускоряя как процесс обучения, так и процесс логического вывода.

2.3.4. C2f_DSConv

Точное отделение семени от ростка необходимо для определения скорости прорастания семян. Первоначальная оценка жизнеспособности семян исследователями может содержать ошибки из-за неточной сегментации, что может повлиять на дальнейшие селекционные тесты.

Квадратная ограничивающая рамка безразлична к локальной информации нерегулярных целей, в то время как исходная сеть YOLOv8-Seg зависит от внутренней ограничивающей рамки точности обнаружения магистрали. Поэтому было решено интегрировать деформируемую свертку (DCN) [36] в магистраль для улучшения эффекта сегментации сети на изогнутых и тонких ростках кукурузы. Это позволило бы некоторым ядрам свертки 3×3 изменять свою форму, чтобы адаптироваться к нерегулярной структуре ростков, сохраняя при этом стабильность структуры свертки для уменьшения смещения.

Для создания сверточных ядер с сильным восприятием нерегулярных кривых в этой статье вводится динамическая змеевидная свертка (DSConv) [37]. Она демонстрирует превосходную производительность в сегментации трубчатых структур, адаптируется к вытянутым и извилистым локальным структурным особенностям и улучшает восприятие геометрических структур. Используя такие стратегии, как квантование и смещение, DSConv значительно снижает вычислительные требования и требования к памяти, тем самым ускоряя процесс логического вывода. Рисунок 5 иллюстрирует вариацию ядра свертки.

Рисунок 5. Пример вариации ядра свертки DSConv [37].

В этом разделе описывается применение DSConv для извлечения нерегулярных локальных признаков краев, предполагая 2D координаты свертки K и центральные координаты K_i = (x_i, y_i). Исходное ядро свертки 3 × 3 K обозначается как

Ядро свертки становится более гибким за счет добавления деформационного смещения Δ, которое фокусируется на нерегулярных краях трубчатых структур. Ядро свертки 3×3 расширяется до размера 9×9 и выпрямляется вдоль обеих осевых направлений с использованием итеративного подхода, как показано на Рисунке 6. Формула для каждой позиции сетки в K, используя ось X в качестве примера: ├ K_(i±c) = (x_(i±c), y_(i±c) ), где c = {0,1,2,3,4} обозначает горизонтальное расстояние от центральной сетки. Каждая позиция сетки Ki±c в K определяется в результате кумулятивного процесса. Ki±1 увеличивается на смещение Δ={δ | δ ∈ [-1,1]} относительно Ki, причем расстояние определяется положением предыдущей сетки. Таким образом, смещение Δ должно накапливаться, чтобы гарантировать, что конечное ядро свертки K придерживается линейной структуры.

Рисунок 6. (a) Метод расчета координат DSConv. (b) Рецептивное поле DSConv [37].

Направление оси X:

Направление оси Y:

Смещение Δ обычно является малым значением, что требует преобразования координат позиции в целые числа с помощью билинейной интерполяции, как реализовано ниже:

где B представляет ядро билинейной интерполяции, K обозначает дробную позицию в уравнениях (2) и (3), а K' представляет полную пространственную позицию.

Как показано на Рисунке 6, DSConv охватывает диапазон 9 × 9 во время деформации, что вызвано сдвигами вдоль двух измерений (оси X и оси Y). Используя свою динамическую структуру, DSConv адаптируется к вытянутым трубчатым структурам более эффективно, улучшая восприятие ключевых свойств.

2.3.5. T-SPPF

По сравнению с семенем, недавно проросший росток кукурузы мал. Модуль T-SPPF вводится для повышения точности сегментации в различных масштабах, тем самым захватывая больше и лучшую информацию о признаках. Рисунок 7 иллюстрирует структуру модуля T-SPPF.

Рисунок 7. Структура модуля T-SPPF.

Модуль SPPF сначала пропускает карту признаков через сверточный блок 1 × 1, который извлекает начальные признаки, одновременно снижая вычислительную сложность. Чтобы смягчить влияние признаков с различными размерами масштаба, используются три параллельных адаптивных слоя пулинга для адаптивной настройки размера ядра пулинга в соответствии с размером входных признаков. После процесса объединения объединенные признаки передаются в модуль механизма многоголового внимания. Используя корреляцию между картами пирамид признаков, механизм многоголового внимания улучшает способность обнаруживать сегментацию целей в разных масштабах, более эффективно захватывает глобальную информацию и интегрирует информацию, изученную головным модулем, в нескольких масштабах [38]. Каждая голова внимания генерирует матрицу весов внимания для взвешивания входной карты признаков. Выходные данные всех голов внимания впоследствии объединяются в единую карту признаков, взвешенную по вниманию. Механизм многоголового внимания трансформера улучшает способность захватывать глобальную информацию, использует корреляции между картами пирамид признаков и усиливает способность обнаруживать цели сегментации на различных масштабах.

Затем входные карты признаков подвергаются даунсэмплингу тремя слоями макс-пулинга, которые уменьшают размер карты признаков и сохраняют критически важную информацию, выбирая максимальное значение в каждом окне пулинга. Модуль T-SPPF содержит три слоя макс-пулинга, каждый из которых создает выходные карты признаков с различными размерами и разрешениями. Выходные карты признаков от трех слоев макс-пулинга подвергаются операции объединения, чтобы объединить их в более крупную карту признаков. Эта объединенная карта признаков содержит информацию о признаках из нескольких масштабов и местоположений, обеспечивая богатые входные данные для последующих сверточных слоев. Благодаря многомасштабному извлечению и слиянию признаков модель адаптируется к целевым объектам различных размеров более эффективно, повышая точность сегментации семян и ростков.

2.4. Параметры эксперимента и конфигурация

Модель для этого исследования обучалась с использованием операционной системы Windows 10. Модель обучения нейронной сети для задачи многоклассовой сегментации была построена с использованием фреймворка глубокого обучения PyTorch на компьютере, оснащенном процессором Intel(R) Xeon(R) Gold 5218R CPU @ 2.10 GHz и графическим процессором NVIDIA GeForce RTX 2080 Ti. В Таблице 1 представлены наиболее часто используемые версии программного обеспечения. Настройки обучения включают входное изображение 640 × 640, размер пакета 16, начальную скорость обучения 0.001, 50 эпох и оптимизатор Adam.

Таблица 1. Среда обучения и тестирования.

2.5. Критерии оценки модели

Возьмем задачу бинарной классификации в машинном обучении в качестве примера: если фактический результат положительный и предсказанный результат положительный, предсказанный результат является истинно положительным (TP); если фактический результат отрицательный, а предсказанный результат положительный, предсказанный результат является ложноположительным (FP); если фактический результат положительный, а предсказанный результат отрицательный, предсказанный результат является ложноотрицательным (FN); и если фактический результат отрицательный и предсказанный результат отрицательный, предсказанный результат является истинно отрицательным (TN).

Точность (Precision, P) и полнота (Recall, R) выводятся из матрицы ошибок, которая включает истинно положительные (TP), истинно отрицательные (TN), ложноположительные (FP) и ложноотрицательные (FN) результаты. Точность (P) — это доля предсказанных положительных результатов от общего количества предсказанных положительных результатов, отражающая точность классификации сети, в то время как полнота представляет собой отношение истинно положительных результатов, правильно предсказанных сетью, к общему количеству фактических истинно положительных результатов. Соответствующие формулы следующие:

Intersection over Union (IoU) представляет собой отношение пересечения к объединению в обнаружении объектов и используется для измерения степени перекрытия между границами, сгенерированными моделью, и исходными размеченными границами. Если IoU превышает 0.5, объект считается обнаруживаемым. Если область истинности (ground truth) обозначена как A, а размеченная область как B, то

Средняя точность (Average Precision, AP) для одной категории была рассчитана путем ранжирования предсказаний модели на основе их оценок достоверности и определения площади под кривой точность-полнота (PR) следующим образом:

Средняя средняя точность (mean Average Precision, mAP) — это среднее значение AP, рассчитанное по всем категориям, что дает всестороннюю оценку производительности модели по всем классам.

Параметры (params) относятся к количеству параметров, которые модель изучает, что служит мерой ее сложности. Большее количество параметров обычно требует больше памяти GPU во время обучения и влияет на объем памяти и видеопамяти, который занимает модель.

2.6. Показатели для оценки жизнеспособности семян

Жизнеспособность семян является важнейшим предиктором потенциала прорастания семян, появления всходов и характеристик хранения в различных условиях окружающей среды. Физиологическое созревание семян зависит как от их генетической структуры, так и от условий, в которых они хранятся. Процесс старения, вызванный естественным снижением жизнеспособности семян, влияет на появление всходов и их способность противостоять неблагоприятным условиям. Он также делает сельскохозяйственные культуры более восприимчивыми к вредителям и болезням, что в конечном итоге влияет на рост и потенциал урожайности.

Старение семян является критической фазой в жизненном цикле семени. Физиологическая спелость представляет собой стадию, на которой семена находятся на пике своей жизненной силы, после чего они начинают терять жизнеспособность. Наиболее часто используемый метод для моделирования старения семян включает искусственное старение обработанных семян. В эксперименте использовались семена кукурузы одного и того же сорта для изучения того, как старение семян влияет на рост и развитие кукурузы. Семена кукурузы подвергались искусственному старению в инкубаторе и тепличных условиях при высокой температуре и влажности. Были установлены три градиента старения: T1 (24 ч), T2 (48 ч) и T3 (72 ч).

Цель эксперимента состояла в том, чтобы изучить взаимосвязь между старением семян и характеристиками прорастания семян кукурузы, а также изменения жизнеспособности семян в различных условиях старения.

Это исследование было направлено на четыре из двадцати семи показателей прорастания, предоставляемых R-пакетом germinationmetrics [39]: среднее время прорастания (MGT), индекс прорастания (GI), энергия прорастания (семь дней) и энергия прорастания (три дня). Алгоритм, используемый для расчета этих показателей, представлен в Таблице 2.

Таблица 2. Представление показателей прорастания.

3.1. Поисковый эксперимент

YOLOv8n-Seg, YOLOv8s-Seg, YOLOv8m-Seg, YOLOv8l-Seg и YOLOv8x-Seg представляют пять сетевых моделей YOLOv8, доступных на GitHub, каждая разного масштаба. Чтобы оценить сегментационную mAP50 и количество параметров модели, мы провели эксперименты с использованием моделей YOLOv8-Seg разных масштабов. Значения сегментационной mAP50 для моделей YOLOv8-Seg разных масштабов показаны на Рисунке 8а. Результаты для трех моделей, YOLOv8m/l/x-seg, не показывают значительных различий с точки зрения mAP50, ключевого показателя для моделей YOLO, со значениями 95.3%, 95.7% и 96.1% соответственно. Модель YOLOv8n-Seg имеет размер 3.4M, и ее сегментационная mAP50 на 3.2% ниже, чем у самой производительной YOLOv8x-seg. YOLOv8n/s-Seg достигли значений сегментационной mAP50 92.9% и 93.7% соответственно. Все результаты превысили 90%. Учитывая сценарий использования исследования, необходимость развертывания на периферийных устройствах и требование легковесности, мы выбрали YOLOv8n-Seg в качестве окончательной экспериментальной модели.

Рисунок 8. (a) Сегментационная mAP50 для моделей YOLOv8-Seg разных размеров. (b) Комплексный обзор сегментационной mAP50 и времени логического вывода для каждого разрешения изображения.

Во время обучения мы использовали четыре различных размера входных изображений: 416 × 416 пикселей, 640 × 640 пикселей, 768 × 768 пикселей и 1024 × 1024 пикселей. Это позволило нам оценить влияние разрешения изображения на производительность сегментации сети YOLOv8n-Seg. Подробное резюме влияния каждого разрешения изображения на сегментационную mAP50 и время логического вывода представлено на Рисунке 8b. Согласно результатам, сегментационная mAP50 увеличилась на 1.3%, а время логического вывода возросло на 2 мс при увеличении разрешения изображения с 416 × 416 пикселей до 640 × 640 пикселей. Это свидетельствует о том, что небольшое увеличение времени логического вывода компенсируется улучшенной производительностью сегментации экземпляров модели. Однако время логического вывода увеличилось на 5.1 мс и 7.7 мс соответственно при дальнейшем увеличении разрешения до 768 × 768 пикселей и 1024 × 1024 пикселей. В сравнении, сегментационная mAP50 показала лишь незначительные улучшения на 0.15% и 0.18% соответственно. Полученные данные указывают на то, что сеть YOLOv8n-Seg показывает лучшие результаты при обучении с разрешением 640 × 640 пикселей.

3.2. Абляционный эксперимент

Чтобы проверить эффективность методов оптимизации, обеспечить совместимость между различными подходами, оптимизировать использование ресурсов и избежать путаницы и несоответствий во время обучения модели и принятия решений, в этом исследовании были проведены абляционные сравнительные эксперименты. Используя набор данных по прорастанию кукурузы, три различных метода оптимизации были включены в исходную сеть YOLOv8-Seg. Сети YOLOv8-Seg (ConvUpDownModule), YOLOv8-Seg (C2f_DSConv), YOLOv8-Seg (T-SPPF) и VT были сравнены, каждая обучена в течение 50 партий, как указано в Таблице 3.

Таблица 3. Производительность YOLOv8-Seg при комбинировании различных методов оптимизации. Текст, выделенный курсивом, представляет улучшенные модули модели.

ConvUpDownModule был включен в задачу обнаружения, улучшив точность, полноту и mAP50 модели до 92.6%, 92.4% и 93.7% соответственно. Эти улучшения на 0.4%, 3.3% и 0.6% выше, чем у исходной модели. В то время как параметры модели были уменьшены на 0.22 миллиона, точность, полнота и mAP50 в задаче сегментации увеличились до 93%, 92.8% и 94.6% соответственно, что на 0.8%, 3.7% и 2% выше исходной модели. Это демонстрирует, что ConvUpDownModule может изучать более полезные представления информации, используя при этом меньше параметров. Также очевидно, что на способность карты признаков извлекать признаки из семян и ростков кукурузы в этом исследовании существенно не влияет уменьшение ее размера вдвое. Уменьшение карты признаков вдвое оказывается более эффективным, чем использование исходного размера карты признаков.

Добавление DSConv увеличило точность сегментации на 2.7% и mAP50 на 3.9%, а также точность обнаружения на 1.6% и mAP50 на 2.6% соответственно по сравнению с предыдущей моделью. Это предполагает, что динамическая змеевидная свертка эффективно сегментирует края объекта, что выгодно для сегментации ростков кукурузы. Однако улучшение полноты незначительно по сравнению с другими показателями, и DSConv имеет ограничения в распознавании различных категорий, что влияет на баланс модели; следовательно, ее следует комбинировать с дополнительными методами.

После добавления модуля T-SPPF точность, полнота и mAP50 модели в задаче обнаружения увеличились до 96.1%, 95.8% и 96.3% соответственно, превысив исходную модель на 3.9%, 6.7% и 3.2%. В задаче сегментации точность, полнота и mAP50 модели улучшились до 96.8%, 97.2% и 97.7%, превзойдя исходную модель на 5.4%, 6.8% и 5.1% соответственно, в то время как количество параметров уменьшилось на 0.08 млн.

Модель VT-YOLOv8-Seg, интегрирующая ConvUpDownModule, DSConv, T-SPPF и YOLOv8-Seg, показала наилучшую производительность обнаружения с точностью 97.3%, полнотой 97.9% и mAP50 98.5%. В задаче сегментации модель достигла mAP50 98.2%, полноты 97.7% и точности 97.2%. Все показатели были значительно улучшены, в то время как количество параметров осталось таким же, как в исходной модели.

3.3. Результаты обучения модели

Мы обучили VT-YOLOv8-Seg, используя набор данных по прорастанию стареющих семян кукурузы, и Рисунок 9 иллюстрирует показатели производительности во время обучения и валидации. Во время обучения box_loss плавно сходится от начального значения выше 0.4 почти к 0, демонстрируя высокую точность без переобучения. Seg_loss также показывает четкую тенденцию к снижению и сходимости, в то время как уменьшение потерь классификации (cls_loss) указывает на повышение надежности модели при классификации целей. Уменьшение потерь направления/потока (dfl_loss) отражает способность модели изучать и предсказывать направленные или связанные с потоком характеристики объектов.

Рисунок 9. Оценка производительности модели YOLOv8-Seg во время обучения и валидации. Синяя сплошная линия представляет значение показателя в ходе фактического процесса обучения/валидации, т.е. реальные точки данных, рассчитанные для каждой эпохи. Желтая пунктирная линия используется для сглаживания кривой, что облегчает наблюдение общей тенденции.

Во время валидации модели все показатели потерь демонстрируют тенденции сходимости, аналогичные наблюдаемым во время обучения, с конечными стабильными значениями, немного превышающими результаты обучения. Это свидетельствует о том, что модель хорошо обобщает данные за пределами обучающего набора. Со средней точностью, превышающей 0.9 при 50% IoU (mAP50), и производительностью выше 0.7 при более строгом диапазоне 50–95% IoU (mAP50–95), точность масок (precision(M)) и полнота (recall(M)) остаются выше 0.9. Эти результаты подтверждают надежную производительность модели при строгих критериях оценки сегментации.

Для обучения VT-YOLOv8-Seg был использован набор данных по прорастанию стареющих семян кукурузы. Рисунок 9 иллюстрирует показатели производительности как для обучения, так и для валидации. В процессе обучения box_loss постепенно сходится от начального значения выше 0.4, асимптотически приближаясь к 0, демонстрируя высокую точность без переобучения. Кроме того, seg_loss демонстрирует четкую тенденцию к снижению и сходимости, в то время как уменьшение потерь классификации (cls_loss) указывает на повышенную надежность классификации целей. Способность модели изучать и предсказывать направление или поток объекта дополнительно отражается в уменьшении показателя специфических потерь, потерь направления/потока (dfl_loss).

Во время валидации все показатели потерь демонстрируют тенденции сходимости, аналогичные тем, что были в обучении, с конечными стабильными значениями, немного превышающими результаты обучения. Это предполагает, что модель хорошо обобщает невидимые данные за пределами обучающего набора. Со средней точностью, превышающей 0.9 при 50% IoU (mAP50), и производительностью выше 0.7 при более сложном диапазоне 50–95% IoU (mAP50–95), точность масок (precision(M)) и полнота (recall(M)) остаются выше 0.9. Эти результаты подтверждают надежность модели и ее высокую производительность при строгих критериях оценки сегментации.

В заключение, модель VT-YOLOv8-Seg демонстрирует эффективную сегментацию в различных порогах IoU, эффективно изучая признаки семян и ростков кукурузы без переобучения и давая благоприятные результаты обучения. Ее низкие и стабильные значения потерь способствуют ее высокой производительности на наборе данных по прорастанию стареющих семян кукурузы.

Исходная модель (YOLOv8-Seg) показала ограничения в обнаружении мелких целей и не смогла точно сегментировать ростки кукурузы, как показано сравнением масок на Рисунке 10. Анализ выявляет неоптимальное обнаружение и сегментацию, особенно на ранних стадиях роста ростков кукурузы, ограниченную способность распознавать нерегулярные края и недостаточную гибкость свертки. Эти недостатки в первую очередь объясняются неадекватным слиянием признаков, что препятствует производительности обнаружения мелких целей.

Рисунок 10. Группы (a–c) иллюстрируют способность модели обнаруживать и сегментировать мелкие цели на ростках кукурузы. И в группе (a), и в группе (c) наблюдаются проблемы пропуска обнаружения: мелких ростков в группе (a) и вытянутых ростков в группе (c). Группа (b), с другой стороны, демонстрирует проблему повторных обнаружений.

Усовершенствованная модель включает ConvUpDownModule, который уменьшает параметры модели и удаляет избыточную информацию из карт признаков; DSConv, обладающую гибким сверточным ядром, которое улучшает обнаружение нерегулярных краев ростков кукурузы и повышает точность сегментации краев; и модуль SPPF, который управляет многомасштабной информацией о признаках для улучшения способности сети обнаруживать мелкие цели. Тесты демонстрируют, что наша оптимизированная модель VT-YOLOv8-Seg эффективно сегментирует изогнутые и нерегулярные края при обнаружении семян и ростков, одновременно более умело обрабатывая мелкие цели по сравнению с исходной моделью.

При обнаружении первой стадии сегментированных ростков кукурузы, группа (a) на Рисунке 10 сравнивает две модели, показывая, что улучшенная VT-YOLOv8-Seg успешно обнаруживает мелкие цели, которые исходная модель не смогла идентифицировать. Группа (a) иллюстрирует, как улучшенная модель VT-YOLOv8-Seg успешно обнаруживает мелкие цели прорастания, которые исходная модель не смогла идентифицировать. Мелкие цели особенно сложны из-за их низкой плотности пикселей и нечетких границ на ранней стадии прорастания. Добавление модуля T-SPPF обеспечивает лучшее многомасштабное слияние признаков, повышая чувствительность модели к этим тонким признакам. В группе (b) экспериментальные результаты исходной модели выявляют повторные обнаружения, которые эффективно устраняются в модели VT-YOLOv8-Seg. Это улучшение объясняется двумя ключевыми факторами: уменьшением избыточной фоновой информации и улучшенной способностью обнаруживать изогнутые структуры ростков. Уменьшая влияние нерелевантных фоновых признаков, модель VT-YOLOv8-Seg избегает неправильной интерпретации перекрывающихся или неоднозначных областей как отдельных экземпляров. Кроме того, усиленная способность обнаруживать изогнутые цели обеспечивает более точную идентификацию и сегментацию изогнутых структур ростков, которые часто ошибочно классифицируются исходной моделью. Пропуск обнаружения остается проблемой в группе (c), с большими областями пропущенных почек по сравнению с группой (a). Пропуск обнаружения остается значительной проблемой в группе (c), где исходная модель показывает большие области пропущенных почек по сравнению с улучшенной моделью в группе (a). Эти пропуски часто происходят для вытянутых и неправильной формы целей, которые исходная архитектура с трудом воспринимает из-за ограниченных возможностей адаптации к краям. Интеграция DSConv в модели VT-YOLOv8-Seg напрямую решает это ограничение. DSConv динамически настраивает сверточные ядра, чтобы лучше соответствовать контурам вытянутых объектов, значительно повышая точность сегментации для этих сложных случаев.

3.4. Сравнительный эксперимент

Мы протестировали модель VT-YOLOv8-Seg с популярными сетями сегментации, такими как Mask-RCNN [40], YOLOv5-Seg [41] и YOLOv7-Seg [42], чтобы подтвердить эффективность и преимущества модели. VT-YOLOv8-Seg, YOLOv8-Seg, YOLOv7-Seg и YOLOv5-Seg были оценены на тестовой выборке после обучения с одинаковыми параметрами обучения. Для Mask-RCNN скорость обучения, размер пакета, импульс обучения, снижение веса и количество итераций были установлены на 0.004, 2, 0.9, 1 × 10^(−4) и 30 эпох соответственно. Как указано в Таблице 4, точность (P), полнота (R), средняя точность (mAP) и количество параметров каждой сети сегментации оценивались в ходе всего эксперимента.

Таблица 4. Результаты для пяти алгоритмов.

Производительность улучшенного алгоритма YOLOv8-Seg по сравнению с другими моделями представлена в Таблице 4. Точность, полнота и mAP50 составляют 97.3%, 97.9% и 98.5% в задаче обнаружения и 97.2%, 97.7% и 98.2% в тесте сегментации соответственно. По сравнению с методом YOLOv8-Seg, улучшения составляют 5.1%, 8.8% и 6.4% в задаче обнаружения и 5.8%, 7.3% и 6.6% в задаче сегментации. Для задачи обнаружения улучшения составляют 7.8%, 10.3% и 8.5% по сравнению с методом YOLOv5-Seg, а для задачи сегментации улучшения составляют 19.1%, 16.3% и 12.8% соответственно. Задача обнаружения улучшена на 9.6%, 12.9% и 7% по сравнению с методом YOLOv7-Seg, в то время как задача сегментации улучшена на 12.2%, 11% и 7.6%. При сравнении с методом Mask-RCNN показатели оценки алгоритма улучшились на 5.6%, 10.9% и 6% для задачи обнаружения и на 4.6%, 8.3% и 6.7% для задачи сегментации.

В дополнение к своей превосходной производительности, VT-YOLOv8n-Seg сохранил исключительную эффективность параметров, имея всего 3.15 миллиона параметров. Это сопоставимо с YOLOv8-Seg (3.20 миллиона), но значительно ниже, чем у YOLOv7-Seg (81.5 миллиона) и Mask R-CNN (239 миллионов). Легковесная архитектура VT-YOLOv8n-Seg подчеркивает ее пригодность для приложений реального времени на устройствах с ограниченными ресурсами.

VT-YOLOv8n-Seg включает несколько инновационных компонентов для повышения производительности. ConvUpDownModule минимизирует избыточные карты признаков, тем самым улучшая вычислительную эффективность и представление признаков. Модуль DSConv специально разработан для адаптации к нерегулярным краям ростков, обеспечивая точную сегментацию изогнутых и вытянутых структур. Используя механизм многоголового внимания на основе трансформера, модуль T-SPPF вводит многомасштабное слияние признаков, улучшая способность модели обнаруживать мелкие и сложные цели. Адаптированный для сельскохозяйственных приложений, VT-YOLOv8n-Seg достигает оптимального баланса между высокой точностью и низкими вычислительными требованиями, что делает его идеальным для развертывания в средах с ограниченными ресурсами. Его превосходные возможности сегментации значительно улучшают отслеживание прорастания семян, что является критическим фактором в оценке жизнеспособности семян и повышении продуктивности сельского хозяйства.

Рисунок 11а показывает взаимосвязь между количеством параметров и производительностью (mAP50) для обнаружения Box и Mask в различных моделях. Модель VT-YOLOv8-Seg достигает самых высоких показателей mAP50 как для обнаружения Box, так и для Mask, сохраняя при этом значительно меньшее количество параметров по сравнению с Mask-RCNN. В частности, VT-YOLOv8-Seg достигает mAP50(B) и mAP50(M), близких к 0.99, с приблизительно 3 миллионами параметров, что подчеркивает ее эффективность и точность. Напротив, Mask-RCNN, с более чем 250 миллионами параметров, обеспечивает более низкую производительность по обоим показателям, что отражает убывающую отдачу от точности, несмотря на существенно больший размер модели. Модели YOLOv5-Seg и YOLOv7-Seg демонстрируют умеренную производительность со значениями mAP50(Box) и mAP50(Mask) в диапазоне от 0.9 до 0.92, в то время как YOLOv8-Seg работает немного лучше, но все еще уступает VT-YOLOv8-Seg. Рисунок 11b иллюстрирует динамику обучения mAP50(M) по эпохам для тех же моделей. VT-YOLOv8-Seg демонстрирует превосходное поведение сходимости, достигая почти идеальной mAP50(M) 0.9 к 50-й эпохе. Эта быстрая сходимость отражает эффективность архитектурных усовершенствований, таких как T-SPPF для многомасштабного слияния признаков и DSConv для улучшенного обнаружения вытянутых и сложных структур. Напротив, Mask-RCNN стабилизируется на уровне приблизительно 0.85 mAP50(M). YOLOv5-Seg и YOLOv7-Seg демонстрируют заметные колебания во время обучения и сходятся на уровне приблизительно 0.8 и 0.9 mAP50(M) соответственно. Хотя YOLOv8-Seg демонстрирует улучшенную стабильность по сравнению с YOLOv5-Seg и YOLOv7-Seg, она все еще уступает VT-YOLOv8-Seg как по скорости сходимости, так и по конечной производительности.

Рисунок 11. Сравнение производительности различных моделей. (a) Взаимосвязь между количеством параметров (миллионы) и mAP50 для обнаружения Box и Mask. (b) Динамика обучения mAP50(M) в течение 50 эпох.

3.5. Результаты экспериментов по прорастанию стареющих семян кукурузы

3.5.1. Обнаружение прорастающих семян

Было проведено всестороннее сравнение вариабельности ручного подсчета и подсчета с помощью платформы, чтобы проверить точность этой модели обнаружения прорастания семян. Эксперименты были разделены на четыре группы с регистрацией количества проросших семян каждые 24 ч, чтобы сравнить модельный и ручной подсчеты прорастания. Как показано на Рисунке 12, где сравниваются результаты ручного подсчета и модельного обнаружения, ошибка в подсчете проросших семян относительно невелика, при этом наблюдается высокая степень соответствия. Результаты ручного подсчета были получены усреднением подсчетов пяти человек, чтобы минимизировать субъективность и повысить надежность базовых измерений. Несмотря на небольшие ошибки, расхождения объясняются текущими ограничениями в точности обнаружения модели, которая требует дальнейшей доработки для повышения производительности. Эти результаты подчеркивают надежность модели VT-YOLOv8-Seg, а также указывают на области для улучшения.

Рисунок 12. (a–d) Сравнение результатов ручного подсчета и модельного обнаружения семян кукурузы в четырех группах обработки с различным временем старения.

Таблица 5, в которой сравниваются четыре группы семян, обобщает результаты по четырем показателям. Результаты продемонстрировали, что среднее время прорастания (MGT) демонстрировало возрастающую тенденцию, что согласуется с гипотезой о том, что жизнеспособность семян снижается по мере увеличения времени старения. Напротив, показатели энергии прорастания (G) и индекса прорастания (GI) значительно снижались по мере увеличения продолжительности обработки искусственным старением. В Таблице 6 представлены значения показателей для каждой из четырех групп семян.

Таблица 5. Сравнение значений g (t = 3), g (t = 7), GI, MGT четырех групп семян.

Таблица 6. Подобранные уравнения с соответствующими значениями R².

3.5.2. Скорость роста ростков

Площадь ростка определяется путем применения наилучших обученных параметров из VT-YOLOv8-Seg к задаче предсказания, подсчета количества точек маски и их нанесения на график при отрисовке изображения маски. Подсчитывается общее количество ненулевых пикселей в маске, а затем тензор преобразуется в значения Python для вычисления площади маски после предсказания. На изображении маски семя и росток различаются двумя цветами: зеленый для семени и красный для ростка. Используя количество пикселей, представляющих площадь ростка, пиксели чашки Петри и фактический размер чашки Петри, фактическая площадь ростка может быть рассчитана следующим образом:

Контрольная группа и три группы семян кукурузы с различной продолжительностью старения были созданы для экспериментов по прорастанию, всего четыре группы, каждая из которых состояла из 30 семян (распределенных по трем чашкам Петри), при этом семена были отобраны для обеспечения однородности положения и морфологии. Кривая роста была подобрана для семян с использованием средней площади ростка из подсчитанных семян. Большинство коммерческих автоматизированных тестов на жизнеспособность семян оценивают прорастание только в трех-семидневный период. Это исследование включало построение кривых роста почек в зависимости от отношения площади ростка ко времени путем сегментации почек семян и анализа результатов. Было замечено, что по мере увеличения градиента времени старения кривая становилась более пологой, а скорость прорастания замедлялась по сравнению с контролем и тремя группами семян, подвергнутыми различным градиентам старения. Общее сравнение кривых роста для четырех групп семян, показанное на Рисунке 13, выявило, что T3 (время старения 72 ч) имел самый медленный рост, T2 (время старения 48 ч) показал самое позднее время первого прорастания, а T0 (контроль) продемонстрировал самый быстрый рост и самое раннее прорастание. Кривые, полученные из подобранного экспоненциального уравнения, отражали ту же тенденцию, что и исходная кривая роста. После подбора уравнения полученные значения использовались для построения кривой производной.

Рисунок 13. (a,b) Горизонтальная ось представляет время эксперимента по прорастанию, а вертикальная ось указывает на площади ростков кукурузы, рассчитанные по выходным данным модели. (c) Горизонтальная ось представляет время прорастания, а вертикальная ось отображает значения производных первого порядка, полученных из аппроксимации кривой. (a) Изображает кривую роста площади ростка кукурузы во времени. (b) Сравнивает подобранные кривые четырех наборов. (c) Представляет уравнение производной, полученное путем дифференцирования первого порядка подобранного уравнения, которое аппроксимирует скорость роста ростка кукурузы. T0 (контроль), T1 (время старения 24 ч), T2 (время старения 48 ч) и T3 (время старения 72 ч) являются экспериментальными группами.

Кривые роста четырех групп семян были проанализированы путем подбора уравнений с использованием программного обеспечения Origin. После подбора экспоненциальных уравнений данные были обработаны с помощью дифференцирования первого порядка для получения производных уравнений. Окончательные производные уравнения были получены для представления скорости прорастания. Кривая скорости прорастания, полученная из уравнения, представляет несколько иные результаты. Результаты показывают, что T0 стабильно демонстрировал самую высокую скорость прорастания, превосходя другие группы на протяжении всего эксперимента. T1, будучи медленнее изначально, превысил скорость T0 после 130 ч, что предполагает, что краткосрочная обработка высокой температурой и влажностью может повысить жизнеспособность семян на более поздних стадиях прорастания. T3 оставался непроросшим до 80 ч, но демонстрировал более высокую производную ставку, чем T2 в течение этого периода, что может быть связано с ограничениями процесса подгонки, указывая на то, что производная модель требует доработки для лучшей точности. Анализ подтверждает, что обработка старением снижает жизнеспособность семян, о чем свидетельствуют более пологие кривые роста и более низкие скорости прорастания в T2 и T3. Однако временный эффект восстановления, наблюдаемый в T1 из-за высокой влажности, требует дальнейшего исследования. Небольшие расхождения между предсказанными и наблюдаемыми кривыми роста, особенно в T2 и T3, подчеркивают необходимость более точного уравнения скорости прорастания, адаптированного для этой задачи обнаружения жизнеспособности семян. Мы планируем доработать модель и предложить более точное уравнение скорости прорастания, адаптированное для этой задачи обнаружения жизнеспособности семян. Результаты подобранных уравнений представлены в Таблице 6.

Жизнеспособность семян традиционно оценивается путем изучения энергии прорастания, но расчет скорости прорастания обеспечивает более тонкий подход к анализу жизнеспособности семян. В этом исследовании было проанализировано 120 семян, с отбором 30 семян на материал. Хотя такой размер выборки сбалансировал ограничения ресурсов и экспериментальную осуществимость, он ограничивает обобщаемость. В частности, небольшой размер выборки может не полностью отражать изменчивость в более широких популяциях семян или в различных условиях окружающей среды. Таким образом, к результатам следует относиться с осторожностью. Будущие исследования должны включать более крупные и разнообразные выборки для повышения статистической надежности и более широкой применимости.

Достижения в алгоритмах сегментации и переносимости моделей сделали сегментацию экземпляров ценным инструментом для оценки как энергии, так и скорости прорастания семян. Например, YOLOv8-Seg продемонстрировала значительный потенциал в задачах сегментации. В ссылке [43] YOLOv8-Seg использовалась в качестве базовой модели, которая была дополнительно улучшена для автоматической сегментации отдельных листьев на изображении с mAP50 86.4%. В ссылке [44] была предложена улучшенная сегментация экземпляров YOLOv8 (BFFDC-YOLOv8-Seg) для точной сегментации сорняков на сложных фонах. mAP50 составила 98.8%, и эти два примера показывают, что семейство YOLOv8 обладает отличным потенциалом в задачах сегментации. Эти примеры иллюстрируют эффективность семейства YOLOv8 в задачах сегментации.

Модель VT-YOLOv8-Seg представляет инновационный подход для анализа жизнеспособности семян, предлагая быстрый, экономически эффективный и действенный метод сегментации семян и ростков кукурузы. Несмотря на значительные достижения, необходим дальнейший прогресс для улучшения применимости модели в различных культурах. Ключевые области для улучшения включают создание более полного набора данных о ростках для улучшения разнообразия признаков и обобщения, а также доработку точности модели, на которую влияет плотность пикселей в выходных данных сегментации. Более того, для изучения скорости прорастания будущие исследования должны быть направлены на разработку алгоритмов, способных интерпретировать вариации в динамике прорастания, которые позже могут быть интегрированы в модель. Заглядывая вперед, 3D-анализ изображений может дальше продвинуть наши возможности сегментации ростков. В конечном счете, эти усилия направлены на улучшение качества семян и производства продуктов питания, способствуя устойчивости сельского хозяйства.

Чтобы повысить точность обнаружения жизнеспособности семян кукурузы, в этом исследовании применяется сеть YOLOv8-Seg для сегментации ростков кукурузы. Мы предлагаем модель VT-YOLOv8-Seg, которая интегрирует динамическую змеевидную свертку, ConvUpDownModule и механизм T-SPPF для точного определения границ семян и ростков, обеспечивая точное наблюдение за прорастанием семян. VT-YOLOv8-Seg эффективно обрабатывает многомасштабную информацию о признаках, улучшая обнаружение нерегулярных краев ростков, повышая точность сегментации и уменьшая параметры модели за счет минимизации избыточной информации в картах признаков.

Модель VT-YOLOv8-Seg использовалась для подсчета проросших семян, расчета индекса прорастания и оценки влияния градиентов старения на энергию прорастания семян кукурузы. Было выполнено сравнение подсчетов прорастания от сети VT-YOLOv8-Seg с ручным подсчетом для поддержки установления классов энергии прорастания семян.

Применяя VT-YOLOv8-Seg к сегментации семян и почек кукурузы, была получена кривая потенциала прорастания, показывающая отношение площади ростка ко времени. Наклон этой кривой указывает на скорость прорастания, предоставляя удобный метод для мониторинга жизнеспособности семян. Эта модель предлагает новый аналитический подход к измерению качества семян и служит техническим справочником для изучения жизнеспособности прорастания семян и разработки надежных моделей оценки жизнеспособности семян.

1. Anbes, T.; Abebe, D.; Elmihun, M.; Asredie, S.; Ewenetu, W.; Chanie, Y. Assessment of seed quality and identifying sources of contaminants for maize seed across seed generations accessed through different seed source in Northwest Amhara. Int. J. Food Agric. Nat. Resour. 2024, 5, 85–96. [Google Scholar] [CrossRef]

2. FAO. Database: Crops and Livestock Products FAOSTAT. Available online: https://www.fao.org/faostat/en/#data/QCL (accessed on 22 January 2025).

3. Filho, M.; Agricola, J.J.S. Seed vigor testing: An overview of the past, present and future perspective. Sci. Agric. 2015, 72, 363–374. [Google Scholar] [CrossRef]

4. Finch-Savage, W.E.; Bassel, G.W. Seed vigour and crop establishment: Extending performance beyond adaptation. J. Exp. Bot. 2016, 67, 567–591. [Google Scholar] [CrossRef] [PubMed]

5. King, T.; Cole, M.; Farber, J.M.; Eisenbrand, G.; Zabaras, D.; Fox, E.M.; Hill, J.P. Food safety for food security: Relationship between global megatrends and developments in food safety. Trends Food Sci. Technol. 2017, 68, 160–175. [Google Scholar] [CrossRef]

6. Milivojević, M.; Ripka, Z.; Petrović, T. ISTA rules changes in seed germination testing at the beginning of the 21st century. J. Process. Energy 2018, 22, 40–45. [Google Scholar] [CrossRef]

7. Dell’ Aquila, A. Digital imaging information technology applied to seed germination testing. A review. Agron. Sustain. Dev. 2009, 29, 213–221. [Google Scholar] [CrossRef]

8. Joosen, R.V.L.; Kodde, J.; Willems, L.A.J.; Ligterink, W.; van der Plas, L.H.W.; Hilhorst, H.W.M. GERMINATOR: A software package for high-throughput scoring and curve fitting of Arabidopsis seed germination. Plant J. 2010, 62, 148–159. [Google Scholar] [CrossRef] [PubMed]

9. Hoffmaster, A.F.; Xu, L.; Fujimura, K.; Bennett, M.A.; Mcdonald, E.M.B. The Ohio State University Seed Vigor Imaging System (SVIS) for Soybean and Maize Seedlings. Seed Technol. 2005, 27, 7–24. [Google Scholar]

10. Liakos, K.G.; Busato, P.; Moshou, D.; Pearson, S.; Bochtis, D. Machine Learning in Agriculture: A Review. Sensors 2018, 18, 2674. [Google Scholar] [CrossRef] [PubMed]

11. Rehman, T.U.; Mahmud, M.S.; Chang, Y.K.; Jin, J.; Shin, J. Current and future applications of statistical machine learning algorithms for agricultural machine vision systems. Comput. Electron. Agric. 2019, 156, 585–605. [Google Scholar] [CrossRef]

12. Castillo-Girones, S.; Munera, S.; Martínez-Sober, M.; Blasco, J.; Cubero, S.; Gómez-Sanchis, J. Artificial Neural Networks in Agriculture, the core of artificial intelligence: What, When, and Why. Comput. Electron. Agric. 2025, 230, 109938. [Google Scholar] [CrossRef]

13. Albayrak, U.; Golcuk, A.; Aktas, S.; Coruh, U.; Tasdemir, S.; Baykan, O. Classification and Analysis of Agaricus bisporus Diseases with Pre-Trained Deep Learning Models. Agronomy 2025, 15, 226. [Google Scholar] [CrossRef]

14. Chaugule, M.A. Application of image processing in seed technology: A survey. Technol. Adv. Eng. 2014, 2, 153–159. [Google Scholar]

15. Dell’Aquila, A.; Van Eck, J.W.; van der Heijden, G.W.A. The application of image analysis in monitoring the imbibition process of white cabbage (Brassica oleracea L.) seeds. Seed Sci. Res. 2000, 10, 163–169. [Google Scholar] [CrossRef]

16. Krubej, U.; Rozman, R.; Stajnko, D. The accuracy of the germination rate of seeds based on image processing and artificial neural networks. Agricultura 2015, 12, 19–24. [Google Scholar] [CrossRef]

17. de Medeiros, A.D.; Pinheiro, D.T.; Xavier, W.A.; da Silva, L.J.; Dias, D. Quality classification of Jatropha curcas seeds using radiographic images and machine learning. Ind. Crops Prod. 2020, 146, 112162. [Google Scholar] [CrossRef]

18. Awty-Carroll, D.; Clifton-Brown, J.; Robson, P. Using k-NN to analyse images of diverse germination phenotypes and detect single seed germination in Miscanthus sinensis. Plant Methods 2018, 14, 5. [Google Scholar] [CrossRef] [PubMed]

19. Lurstwut, B.; Pornpanomchai, C. Image analysis based on color, shape and texture for rice seed (Oryzasativa, L.) germination evaluation. Agric. Nat. Resour. 2017, 51, 383–389. [Google Scholar]

20. Limao, M.A.R.; Dias, D.; Araújo, J.D.; Soares, J.M.; Nascimento, W.M.; da Silva, L.J. Classification of lentil seed vigor based on seedling image analysis techniques and interactive machine learning. J. Seed Sci. 2023, 45, e202345038. [Google Scholar] [CrossRef]

21. Zhao, J.F.; Ma, Y.; Yong, K.C.; Zhu, M.; Wang, Y.Q.; Luo, Z.W.; Wei, X.; Huang, X.H. Deep-learning-based automatic evaluation of rice seed germination rate. J. Sci. Food Agric. 2023, 103, 1912–1924. [Google Scholar] [CrossRef]

22. Huang, Z.L.; Wang, R.J.; Cao, Y.; Zheng, S.J.; Teng, Y.; Wang, F.M.; Wang, L.S.; Du, J.M. Deep learning based soybean seed classification. Comput. Electron. Agric. 2022, 202, 107393. [Google Scholar] [CrossRef]

23. Eryigit, R.; Tugrul, B. Performance of Various Deep-Learning Networks in the Seed Classification Problem. Symmetry 2021, 13, 1892. [Google Scholar] [CrossRef]

24. Colmer, J.; O’Neill, C.M.; Wells, R.; Bostrom, A.; Reynolds, D.; Websdale, D.; Shiralagi, G.; Lu, W.; Lou, Q.J.; Le Maizeu, T.; et al. SeedGerm: A cost-effective phenotyping platform for automated seed imaging and machine-learning based phenotypic analysis of crop seed germination. New Phytol. 2020, 228, 778–793. [Google Scholar] [CrossRef]

25. Nehoshtan, Y.; Carmon, E.; Yaniv, O.; Ayal, S.; Rotem, O. Robust seed germination prediction using deep learning and RGB image data. Sci. Rep. 2021, 11, 22030. [Google Scholar] [CrossRef]

26. Reddy, D.R.; Cheruku, R.; Kodali, P. SeedAI: A novel seed germination predictionsystem using dual stage deep learning framework. Environ. Res. Commun. 2023, 5, 125014. [Google Scholar] [CrossRef]

27. Genze, N.; Bharti, R.; Grieb, M.; Schultheiss, S.J.; Grimm, D.G. Accurate machine learning-based germination detection, prediction and quality assessment of three grain crops. Plant Methods 2020, 16, 157. [Google Scholar] [CrossRef] [PubMed]

28. Fu, X.Q.; Han, B.; Liu, S.Y.; Zhou, J.Y.; Zhang, H.W.; Wang, H.B.; Zhang, H.; Ouyang, Z.Q. WSVAS: A YOLOv4-based phenotyping platform for automatically detecting the salt tolerance of wheat based on seed germination vigour. Front. Plant Sci. 2022, 13, 1074360. [Google Scholar] [CrossRef] [PubMed]

29. Yao, Q.; Zheng, X.M.; Zhou, G.M.; Zhang, J.H. SGR-YOLO: A method for detecting seed germination rate in wild rice. Front. Plant Sci. 2024, 14, 1305081. [Google Scholar] [CrossRef]

30. Sun, W.; Xu, M.; Xu, K.; Chen, D.; Wang, J.; Yang, R.; Chen, Q.; Yang, S. CSGD-YOLO: A Maize Seed Germination Status Detection Model Based on YOLOv8n. Agronomy 2025, 15, 128. [Google Scholar] [CrossRef]

31. Terven, J.; Cordova-Esparza, D.M.; Romero-Gonzalez, J.A. A Comprehensive Review of YOLO Architectures in Computer Vision: From YOLOv1 to YOLOv8 and YOLO-NAS. Mach. Learn. Knowl. Extr. 2023, 5, 1680–1716. [Google Scholar] [CrossRef]

32. Chen, C.; Bai, M.; Wang, T.; Zhang, W.; Yu, H.; Pang, T.; Wu, J.; Li, Z.; Wang, X. An RGB image dataset for seed germination prediction and vigor detection—Maize. Front. Plant Sci. 2024, 15, 1341335. [Google Scholar] [CrossRef] [PubMed]

33. Liu, S.; Qi, L.; Qin, H.; Shi, J.; Jia, J. Path Aggregation Network for Instance Segmentation. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Salt Lake City, UT, USA, 18–23 June 2018. [Google Scholar]

34. Lin, T.Y.; Dollar, P.; Girshick, R.; He, K.; Hariharan, B.; Belongie, S. Feature Pyramid Networks for Object Detection. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Honolulu, HI, USA, 21–26 July 2017. [Google Scholar]

35. Bolya, D.; Zhou, C.; Xiao, F.; Lee, Y.J. YOLACT: Real-Time Instance Segmentation. In Proceedings of the IEEE/CVF International Conference on Computer Vision, Seul, Republic of Korea, 27 October–2 November 2019; pp. 9156–9165. [Google Scholar]

36. Dai, J.; Qi, H.; Xiong, Y.; Li, Y.; Zhang, G.; Hu, H.; Wei, Y. Deformable Convolutional Networks. In Proceedings of the IEEE International Conference on Computer Vision, Venice, Italy, 22–29 October 2017. [Google Scholar]

37. Qi, Y.; He, Y.; Qi, X.; Zhang, Y.; Yang, G. Dynamic Snake Convolution based on Topological Geometric Constraints for Tubular Structure Segmentation. In Proceedings of the IEEE/CVF International Conference on Computer Vision, Paris, France, 4–6 October 2023. [Google Scholar]

38. Vaswani, A.; Shazeer, N.; Parmar, N.; Uszkoreit, J.; Jones, L.; Gomez, A.N.; Kaiser, L.; Polosukhin, I. Attention Is All You Need. In Proceedings of the 31st Conference on Neural Information Processing Systems, Long Beach, CA, USA, 4–9 December 2017. [Google Scholar]

39. Aravind, J.; Devi, S.V.; Radhamani, J.; Jacob, S.R.; Srinivasan, K.; ICARNBGPR. Germination Metrics: Seed Germination Indices and Curve Fitting. Available online: https://github.com/cran/germinationmetrics (accessed on 22 January 2025).

40. He, K.; Gkioxari, G.; Dollár, P.; Girshick, R. Mask R-CNN. In Proceedings of the IEEE International Conference on Computer Vision, Venice, Italy, 22–29 October 2017; pp. 2961–2969. [Google Scholar]

41. Redmon, J.; Divvala, S.; Girshick, R.; Farhadi, A. You Only Look Once: Unified, Real-Time Object Detection. In Proceedings of the Computer Vision & Pattern Recognition, Las Vegas, NV, USA, 27–30 June 2016. [Google Scholar]

42. Wang, C.Y.; Bochkovskiy, A.; Liao, H.Y.M. YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, New Orleans, LA, USA, 18–24 June 2022. [Google Scholar]

43. Wang, P.; Deng, H.; Guo, J.X.; Ji, S.Q.; Meng, D.; Bao, J.; Zuo, P. Leaf Segmentation Using Modified YOLOv8-Seg Models. Life 2024, 14, 780. [Google Scholar] [CrossRef]

44. Lyu, Z.; Lu, A.J.; Ma, Y.L. Improved YOLOv8-Seg Based on Multiscale Feature Fusion and Deformable Convolution for Weed Precision Segmentation. Appl. Sci. 2024, 14, 5002. [Google Scholar] [CrossRef]

Yu H, Ling X, Chen Z, Bi C, Zhang W. Detection of Aging Maize Seed Vigor and Calculation of Germ Growth Speed Using an Improved YOLOv8-Seg Network. Agriculture. 2025; 15(3):325. https://doi.org/10.3390/agriculture15030325

Перевод статьи « Detection of Aging Maize Seed Vigor and Calculation of Germ Growth Speed Using an Improved YOLOv8-Seg Network» авторов Yu H, Ling X, Chen Z, Bi C, Zhang W., оригинал доступен по ссылке. Лицензия: CC BY. Изменения: переведено на русский язык