Опубликовано 02.04 11:00

Как предсказать урожай риса за два месяца до сбора

Рис является одной из наиболее широко возделываемых продовольственных культур в Северо-Восточном Китае. Прогнозирование урожайности риса до сбора урожая важно для точного формирования стратегий управления полями и быстрой оценки общего производства риса.

Этого можно достичь с помощью модели на уровне пикселей, которая оценивает урожайность сельскохозяйственных культур на основе информации из каждого пикселя. В предыдущих исследованиях преимущественно использовались данные дистанционного зондирования, климатические данные и статистика урожайности риса либо за отдельные периоды роста, либо за все вегетационные периоды для оценки урожайности. Эти подходы ограничены задержкой в оценке урожайности и недостаточностью в исследовании временных рядов признаков на уровне пикселя.

В данном исследовании представлена разработка новой архитектуры глубокого обучения, предназначенной для раннего прогнозирования урожайности риса в уезде Цянь-Горлос, Северо-Восточный Китай. Эта архитектура использует нейронную сеть с долгой краткосрочной памятью, интегрированную с механизмом внимания (ALSTM). В данной структуре временным окном для раннего прогнозирования урожайности является период от фазы выбрасывания метелки до молочной спелости, а в качестве временных рядов признаков выступают вегетационные индексы: нормализованный разностный индекс красного края (NDRE), зеленый хлорофилльный вегетационный индекс (GCVI) и нормализованный разностный водный индекс (NDWI) за период от пересадки риса до фазы молочной спелости. Точность прогнозирования урожайности составляет R² = 0,88, RMSE = 341,82 кг/га, MAE = 280,29 кг/га, что превосходит показатели LASSO (R² = 0,71, RMSE = 567,10 кг/га, MAE = 487,38 кг/га), RF (R² = 0,79, RMSE = 506,70 кг/га, MAE = 418,90 кг/га) и LSTM (R² = 0,83, RMSE = 451,11 кг/га, MAE = 326,31 кг/га). Модель ALSTM, представленная в этой статье, демонстрирует свою надежность после обобщения на вегетационный сезон 2022 года. Она может прогнозировать урожайность риса в текущем году за два месяца до сбора урожая, предоставляя ценный ориентир для разработки стратегий управления полями с целью повышения продуктивности риса.

Будучи одной из наиболее значимых сельскохозяйственных культур в мире, рис составляет 41% от общего объема производства зерна [1]. Китай занимает позицию крупнейшего производителя риса в мире, производя примерно 206 миллионов тонн ежегодно, что составляет 28% от общемирового производства риса. Однако в последние годы производство риса в Китае сталкивается со стагнацией [2,3]. Для увеличения производства необходимо разрабатывать оптимальные стратегии управления полями с помощью быстрого и точного подхода к раннему прогнозированию урожайности риса, позволяющего прогнозировать урожайность текущего года [4,5]. Это позволит производителям своевременно принимать корректирующие меры, если прогнозируемая урожайность окажется ниже ожидаемой [6].

В то время как опытные агрономы могут приблизительно оценивать урожайность путем неинвазивного наблюдения за морфологическими характеристиками культур, такие оценки, основанные на эмпирических знаниях, являются субъективными по своей природе и непригодны для решения крупномасштабных задач [7]. Дистанционное зондирование обладает преимуществом в предоставлении своевременных, всеобъемлющих и пространственно-временных данных на обширных пространственных масштабах. В последние десятилетия оно эффективно использовалось для прогнозирования урожайности сельскохозяйственных культур [8,9,10]. Методы прогнозирования урожайности сельскохозяйственных культур с помощью дистанционного зондирования можно классифицировать на две категории [11]: процессно-ориентированные модели имитации роста культур и эмпирические регрессионные модели. Процессно-ориентированные модели имитации роста культур зависят от результатов оценки урожайности на точечном масштабе [12]. Такие модели требуют широкого набора входных переменных, включая влажность почвы и вегетационный индекс, рассчитанные по данным дистанционного зондирования, условия удобрения, плотность растений и ежедневные метеорологические данные, что делает их неприменимыми для различных культур, регионов и лет из-за вычислительных затрат и ограничений в требованиях к данным [13,14]. И наоборот, эмпирические регрессионные методы используют простые входные размерности, полученные на основе регрессионных методов. Урожайность культур обычно прогнозируется путем анализа эмпирических корреляций между вегетационными индексами (VIs) и фактической урожайностью, зафиксированной в поле [15]. Нет необходимости в сложных параметрах культур [16]. Однако предварительное прогнозирование урожайности культур демонстрирует высоко сложную нелинейную взаимосвязь между входными переменными. В результате эмпирические модели подходят только для конкретных сортов культур, местоположений и лет, что приводит к ограниченной обобщаемости на больших географических территориях [17].

Недавние достижения в области компьютерного оборудования, алгоритмов и доступности данных демонстрируют эффективность машинного обучения (ML) в агрономическом анализе [18]. Проблема недостаточных обобщающих способностей, присущая традиционным эмпирическим моделям, может быть успешно решена с помощью метода машинного обучения [19]. Различные модели машинного обучения, такие как метод опорных векторов, случайный лес, искусственные нейронные сети и гауссовская регрессия процессов, эффективно использовались для прогнозирования урожайности путем построения нелинейной взаимосвязи между входными переменными окружающей среды (такими как температура, осадки, влажность почвы, солнечная радиация, тип почвы и вегетационный индекс, например NDVI) и урожайностью [20,21]. Эти модели демонстрируют более высокую точность, чем традиционные эмпирические регрессионные модели, которые полагаются на статистические взаимосвязи между наблюдаемыми переменными окружающей среды и урожайностью культур и избегают использования параметров роста культур в качестве переменных, как в процессно-ориентированных моделях [22]. Тем не менее, такие проблемы, как переобучение, длительная продолжительность обучения и ограниченное количество скрытых слоев, ограничивают способность моделей машинного обучения решать нелинейные задачи и формировать прогнозы урожайности культур на больших территориях [23]. По сравнению с методами машинного обучения, многослойные архитектуры моделей глубокого обучения расширяют возможности извлечения признаков из данных и в настоящее время используются в исследованиях по оценке урожайности культур [24]. Модели сетей с долгой краткосрочной памятью (LSTM) применялись для оценки урожайности, поскольку они способны обрабатывать данные временных рядов и улавливать сложные нелинейные взаимосвязи. Например, Tian и др. [25] использовали модель глубокого обучения LSTM для оценки урожайности кукурузы на уровне уезда. В исследовании были интегрированы данные дистанционного зондирования, включая NDVI, влажность почвы, и метеорологические данные, такие как температура и осадки, с LSTM для прогнозирования урожайности пшеницы в регионе Гуаньчжун. Однако только модель LSTM не могла в полной мере уловить важность климатических переменных в прогнозировании урожайности. Чтобы решить эту проблему, мы ввели механизм внимания в модель LSTM для оценки значимости различных входных переменных и выявления ключевых периодов роста, тем самым повысив точность прогнозов урожайности модели [26,27].

Тем не менее, современные модели оценки урожайности все еще демонстрируют определенные ограничения. Существующие исследования по оценке урожайности либо используют полный период роста для оценки урожайности, пренебрегая временным окном ранней оценки, что приводит к невозможности оценить урожайность до сбора урожая, либо полагаются только на переменные признаки одного периода роста, игнорируя временные характеристики, что приводит к менее точной модели [28,29]. Кроме того, исследования по оценке урожайности на основе спутниковых данных в основном сосредоточены на уездном масштабе и не имеют анализа на уровне пикселей, который оценивает урожайность культур на основе информации из каждого пикселя. Это ограничение препятствует точной разработке стратегий управления полями для повышения урожайности [30]. Резюмируя, текущие исследования по оценке урожайности ограничены задержкой в оценке урожайности, недостаточным анализом переменных временных рядов и проведением на уровне пикселей.

В данной статье предлагается основа для раннего прогнозирования урожайности риса на уровне пикселей, интегрирующая механизм внимания в сеть LSTM (ALSTM). Она объединяет измеренные данные об урожайности риса с временными рядами вегетационных индексов для оценки урожайности риса в уезде Цянь-Горлос, Северо-Восточный Китай. Основные научные вопросы данного исследования заключаются в следующем: (1) Как можно разработать основу глубокого обучения ALSTM для оценки урожайности риса на уровне пикселей и какова ее точность по сравнению с базовой моделью? (2) Каково оптимальное временное окно для раннего прогнозирования урожайности риса? (3) Какие вегетационные индексы наиболее значимы для оценки урожайности риса? Данное исследование направлено на ответы на эти вопросы, позволяя прогнозировать урожайность текущего года за два месяца до сбора риса. Полученные результаты предоставляют преимущества для прогнозирования урожая зерновых, страхования урожая, оценки ущерба от стихийных бедствий и международных торговых дискуссий, предлагая руководство для государственных и соответствующих директивных органов в разработке стратегий управления полями для повышения урожайности.

2.1. Район исследования

Район исследования, уезд Цянь-Горлос, расположен в западной части провинции Гирин, Северо-Восточный Китай (Рисунок 1). Уезд Цянь-Горлос относится к умеренному континентальному муссонному климату и находится в полугумидной и полуаридной переходной зоне. Измеренная глубина промерзания почвы составляет 1,8 м. Типичное среднегодовое количество осадков составляет 450,6 мм, с максимумом 612,4 мм [31]. Среднегодовая скорость испарения составляет 1696,5 мм, относительная влажность воздуха — 62,4%. Годовое общее количество солнечного сияния составляет 2801,6 часа. Эти климатические условия создают оптимальную среду для выращивания риса. Площадь выращивания риса в уезде Цянь-Горлос составляет примерно 10,55% от общей площади, отведенной под основные культуры [31,32]. За последние пять лет среднегодовое производство риса в этом районе составляет 675 800 тонн. Схема посадки состоит из однолетнего риса, который высаживается в первой половине мая и собирается в конце сентября. Цикл роста риса охватывает шесть основных периодов роста: период пересадки, период кущения, период стеблевания, период выбрасывания метелки, период молочной спелости и период желтой спелости [33] (Таблица 1).

Рисунок 1. Карта района исследования, районов выращивания риса и участков отбора проб.

Таблица 1. Периоды роста однолетнего риса в Северо-Восточном Китае.

2.2. Данные

2.2.1. Данные дистанционного зондирования

Данное исследование основано на мультиспектральных спутниковых снимках Sentinel-2, полученных из Европейского центра данных Copernicus (ESA Copernicus Data Centre) (https://scihub.copernicus.eu/ (дата обращения: 5 января 2024 г.)). Sentinel-2 — это новое поколение мультиспектральных спутников для съемки, инициированное Европейской комиссией и Европейским космическим агентством, широко используемое для целей мониторинга окружающей среды. Sentinel-2, состоящий из 2A и 2B, обеспечивает высокое временное и пространственное разрешение и предоставляет период повторного пролета 10 дней для каждого спутника, что является преимуществом благодаря наличию двух дополняющих друг друга спутников [34,35,36]. Снимки дистанционного зондирования состоят из 13 диапазонов, от видимого и ближнего инфракрасного до коротковолнового инфракрасного, с максимальным пространственным разрешением 10 м (Таблица 2). Продукты данных уровня L1C были загружены с ESA, а преобразование данных L1C в данные дистанционного зондирования коэффициента отражения уровня L2A было выполнено с помощью плагина Sen2Cor-2.5.0. Полученные снимки Sentinel-2 впоследствии были подвергнуты предварительной обработке, включая атмосферную коррекцию и радиометрическую калибровку.

Таблица 2. Спектральные параметры диапазонов изображений Sentinel-2.

2.2.2. Измерение урожайности риса

Исследовательская группа собрала 235 точек фактического измерения урожайности риса в районе выращивания риса уезда Цянь-Горлос в период желтой спелости в 2022 и 2023 годах, из которых 100 точек были зарегистрированы в 2022 году и 135 точек в 2023 году. Чтобы избежать точек отбора проб в смешанных пикселях и повысить репрезентативность точек отбора проб, выбор был в первую очередь сосредоточен на обширных районах распространения риса. Размер пикселя снимка Sentinel-2 составляет 100 м²; поэтому мы разделили пиксель 100 м² на четыре равные области. Центр каждой области был обозначен как точка отбора проб с площадью участка отбора 25 м². Один квадратный метр риса был собран в каждом из пяти направлений от центра пробного квадрата: юго-восток, северо-запад и север. После возвращения в лабораторию собранный рис подвергался процессам обмолота, сушки и взвешивания. Вес для площади 1 м² риса определялся на основе влажности 14,5%. Совокупная масса пяти направлений пробного квадрата использовалась для определения урожайности риса на пробном квадрате 25 м². Урожайность риса с четырех пробных квадратов суммировалась для расчета урожайности пикселя (Рисунок 2).

Рисунок 2. Взаимосвязь между точкой отбора проб, участком отбора и пикселем при наземном обследовании.

2.2.3. Картографирование пространственного распределения риса

Определение площади посевов необходимо для оценки полей сельскохозяйственных культур. Период с конца июня по август в Северо-Восточном Китае является пиковым периодом роста риса, в течение которого различные физиологические параметры, такие как зеленый индекс и содержание воды, достигают максимальных уровней. В этом временном окне для достижения оптимальной классификации культур мы разработали помесячные данные временных рядов индекса наземных вод, улучшенного вегетационного индекса, нормализованного разностного вегетационного индекса и относительного вегетационного индекса в качестве переменных признаков с июня по август 2023 года, используя снимки Sentinel-2 с пространственным разрешением 10 м. Затем была построена модель дерева решений для определения площади посадки риса в уезде Цянь-Горлос. Результаты показывают, что общая точность классификации карты пространственного распределения риса достигает 86,4%, а общая площадь риса в уезде Цянь-Горлос в 2023 году составляет 78 133 га (Рисунок 1).

2.3. Методы

Мы предлагаем основу глубокого обучения, которая интегрирует механизм внимания с LSTM для раннего прогнозирования урожайности риса. Используя передовую аналитику данных и методологии глубокого обучения, мы предоставляем новые идеи для раннего прогнозирования урожайности однолетнего риса на уровне пикселей в Северо-Восточном Китае. Последовательность исследовательского процесса изложена ниже (Рисунок 3): (1) Метод коэффициента корреляции Пирсона используется для определения взаимосвязи между вегетационными индексами и урожайностью культур в различные периоды роста, что позволяет идентифицировать вегетационные индексы, которые особенно значимы для урожайности риса. (2) В различные периоды роста риса вегетационный индекс, идентифицированный на предыдущем шаге, служит независимой переменной, а измеренная урожайность риса выступает в качестве зависимой переменной. Такая настройка облегчает разработку модели оценки урожайности временных рядов ALSTM наряду с тремя базовыми моделями: LASSO, случайный лес (RF) и LSTM. Был использован метод кросс-валидации с использованием 135 точек отбора проб в 2023 году. (3) Сравнить результаты оценки урожайности ALSTM и базовых моделей для различных временных рядов, используя метрики коэффициента детерминации (R²), среднеквадратичной ошибки (RMSE) и средней абсолютной ошибки (MAE). (4) Определить оптимальное временное окно для раннего прогнозирования урожайности риса и подтвердить представленную в данной статье основу прогнозирования урожайности ALSTM. Представленная в данной статье основа прогнозирования урожайности риса ALSTM дополнительно проверена с использованием данных 2022 года, при этом 135 точек отбора проб были использованы для проверки надежности.

Рисунок 3. Схема работы для раннего прогнозирования урожайности однолетнего риса на уровне пикселей в уезде Цянь-Горлос, Северо-Восточный Китай. Красная рамка представляет модель ALSTM, предложенную в данной статье, а синяя рамка представляет базовые модели.

2.3.1. Расчет и отбор вегетационных индексов

Предыдущие исследования показывают, что чувствительность вегетационных индексов к урожайности культур различается в различных периодах роста культур. DVI, EVI, EXG, GCVI, GNDVI, NDRE, NDVI, NDWI, OSAVI и RVI демонстрируют значительную чувствительность к урожайности культур и часто используются как для качественной, так и для количественной оценки урожайности культур [37,38,39,40] (Таблица 3). Чтобы отобрать вегетационные индексы, чувствительные к урожайности риса, мы первоначально скорректировали временное разрешение снимков Sentinel-2 с 10 дней на каждый интервал периода роста риса, следуя основным периодам роста однолетнего риса в Северо-Восточном Китае (Таблица 1). Преобразование включало расчет среднего коэффициента отражения по всем снимкам Sentinel-2, соответствующим каждому периоду роста. После этого, как указано в Таблице 3, были рассчитаны вегетационные индексы для пяти периодов роста.

Коэффициент корреляции Пирсона r позволяет оценить линейную корреляцию между переменными [41]. В этом исследовании мы используем его для оценки взаимосвязи между урожайностью риса и вегетационным индексом, стремясь отобрать вегетационные индексы, которые наиболее чувствительны к урожайности риса среди анализируемых. Абсолютное значение r находится в диапазоне 0–1. Когда абсолютное значение приближается к 1, сила корреляции между переменными x и y возрастает. И наоборот, когда значение приближается к 0, корреляция между двумя переменными x и y уменьшается. Метод расчета представлен в Уравнении (1).

где O_j — прогнозируемая урожайность, ¯O_j — среднее значение прогнозируемой урожайности, y_j — измеренная урожайность, ¯y_j — среднее значение измеренной урожайности, j — номер точки отбора проб, n — количество точек отбора проб.

Таблица 3. Вегетационные индексы, обычно используемые для прогнозирования урожайности риса.

2.3.2. Нейронная сеть ALSTM

Модель ALSTM, разработанная в этом исследовании, представляет собой основу глубокого обучения, предназначенную для изучения признаков временных рядов в данных дистанционного зондирования и урожайности. Она состоит из двух основных компонентов [51]: сети LSTM и механизма внимания (Рисунок 4). Сеть LSTM эффективно обрабатывает данные временных рядов, тогда как механизм внимания напоминает процесс избирательного визуального внимания человека, который отдает приоритет ключевым компонентам данных входной последовательности, влияющим на выходные данные, тем самым облегчая получение важной информации из данных входной последовательности [52]. Структура ALSTM состоит из шести различных слоев: входного слоя, слоя LSTM, слоя механизма внимания, выходного слоя и двух слоев исключения (dropout). Входной слой состоит из вегетационного индекса риса, соответствующего каждому периоду роста. Слой исключения изменяет параметры путем разрыва связей от нейронов с заданной вероятностью во время обучения модели. Этот метод предназначен для снижения риска переобучения модели. Слой механизма внимания, реализованный после слоя LSTM, служит для распределения значений вероятности, отражающих влияние процесса роста культуры на урожайность. В этом документе подробно описывается использование платформы TensorFlow для построения модели ALSTM. Входные данные масштабируются до диапазона 0–1 с помощью нормализации Max–Min. Для распределения 80% данных измерений урожайности для целей обучения и резервирования 20% для валидации модели используется метод 5-кратной кросс-валидации. Этот подход направлен на минимизацию дисперсии при выборе модели и повышение надежности модели.

Рисунок 4. Общая структура модели ALSTM для прогнозирования урожайности риса (модифицировано из Tian и др. [52]).

После проведения многочисленных сеансов обучения сети оптимальные параметры установлены следующим образом: Размер пакета (batch size) настроен как одна пятая от общего количества точек отбора проб культур, а количество эпох обучения сети установлено на 1000. Блок LSTM настроен на 10. Начальная скорость обучения установлена на 0,0006. Используемый метод оптимизации — стохастический градиентный спуск. Функция потерь — среднеквадратичная ошибка. Чтобы предотвратить переобучение во время обучения сети и повысить обобщающую способность сети, слой исключения включен перед слоем LSTM и после слоя механизма внимания, с параметром исключения, настроенным на 0,1.

2.3.3. Базовые модели

Мы также выбрали LASSO, RF и LSTM в качестве базовых моделей для облегчения сравнения и оценки структуры ALSTM в отношении точности прогнозирования урожайности риса. LASSO представляет традиционный подход к линейной регрессии. На данном этапе модель случайного леса является наиболее распространенным подходом для прогнозирования урожайности в области машинного обучения. Структура LSTM — это модель глубокого обучения для анализа временных рядов, которая похожа на ALSTM, но без механизма внимания.

LASSO — это традиционная модель линейной регрессии, которая уменьшает параметры модели с помощью L1-подхода [53]. Значения параметров модели могут быть минимизированы до 0, чтобы сжать параметры, не связанные с зависимой переменной. Этот подход направлен на повышение точности прогнозов и объяснительной способности модели при одновременном снижении риска переобучения. Коэффициент штрафа L2, установленный в этом исследовании, составляет 0,002.

RF основан на концепции ансамблевого обучения, объединяя несколько деревьев решений для классификации или регрессии, чтобы повысить производительность модели и снизить риск переобучения в одной модели [54]. Каждый узел в дереве модели случайного леса обозначает случайный выбор признаков. Ограничение количества извлеченных признаков повышает обобщающую способность модели. RF широко использовался для прогнозирования урожайности культур благодаря вышеупомянутым характеристикам, демонстрируя свою способность эффективно оценивать урожайность культур в больших масштабах. После оптимизации гиперпараметров в этом исследовании количество деревьев (Ntree) в модели случайного леса (RF) устанавливается равным 500, а максимальное количество узлов (Maxnodes) в каждом дереве устанавливается равным 300.

LSTM — это модель глубокого обучения, предназначенная для моделирования данных временных рядов [55]. Она имеет архитектуру, которая использует временные блоки передачи информации для представления временной логики многомерных данных. В то же время она имеет архитектуру временных блоков, характерную для рекуррентных нейронных сетей, что соответствует кумулятивному процессу роста культур. Было показано, что она способна распознавать закономерности в длительных временных рядах данных и эффективно моделировать сложные нелинейные взаимосвязи. В этой статье представлена архитектура LSTM, которая включает входной слой, два скрытых слоя с LSTM-блоками и конечный выходной слой. Эта модель всесторонне анализирует сложные корреляции временных рядов между признаками и получает знания о характеристиках роста риса в течение пяти различных периодов роста на основе данных дистанционного зондирования.

2.3.4. Оценка модели

Чтобы уменьшить переобучение, мы использовали k-кратную кросс-валидацию во время обучения модели. Образцы случайным образом разбиваются на k поднаборов данных. На каждой итерации k-1 из этих поднаборов данных используются для моделирования, в то время как оставшийся поднабор данных служит валидационным набором. Конечная точность модели определяется путем расчета среднего значения k значений точности моделирования. Значение k в этом документе установлено равным 5. В 2023 году было собрано 135 точек отбора проб, которые были распределены в среднем по пяти поднаборам выборок. Четыре из этих наборов предназначены для целей обучения, в то время как оставшийся набор служит валидационным набором. Процесс кросс-валидации выполняется пять раз, причем каждая подвыборка проходит валидацию один раз. Конечная точность наборов для обучения и валидации модели определяется путем усреднения результатов оценки из пяти наборов для обучения и валидации. Мы выбираем R², RMSE и MAE в качестве метрик для оценки точности модели. R² измеряет долю дисперсии зависимой переменной, объясняемую независимой переменной. Более высокий R² указывает на лучшее соответствие модели. RMSE количественно определяет разницу между прогнозируемыми и фактическими значениями, причем более низкий RMSE указывает на лучшую точность модели. MAE вычисляет среднюю ошибку в прогнозах, причем более низкий MAE указывает на более высокую точность.

3.1. Корреляция между урожайностью риса и вегетационным индексом

Данные о спектральном коэффициенте отражения для красного, зеленого, синего, ближнего инфракрасного и красного края диапазонов были извлечены из снимков Sentinel-2. Впоследствии были рассчитаны различные спектральные индексы, включая DVI, EVI, EXG, GCVI, GNDVI, NDRE, NDVI, NDWI, OSAVI и RVI, для разработки модели прогнозирования урожайности риса. В Таблице 3 представлена конкретная формула расчета. Коэффициент корреляции r использовался для изучения взаимосвязи между урожайностью риса и различными вегетационными индексами в течение каждого периода роста. Тепловая карта, иллюстрирующая корреляцию между вегетационными индексами и измеренной урожайностью культур, показывает, что NDRE, GCVI, NDWI, OSAVI и NDVI демонстрируют более сильную корреляцию с урожайностью риса в течение периодов роста GP3–GP5, достигая значений корреляции, превышающих 0,65 [56,57]. Эта производительность превосходит другие пять вегетационных индексов, среди которых GNDVI демонстрирует самую слабую корреляцию (Рисунок 5). В то же время взаимосвязь между вегетационными индексами GP3, GP4 и GP5 и измеренной урожайностью сильнее, чем для GP1 и GP2, с порядком GP4 > GP3 > GP5. Наиболее значительная корреляция показана между периодом выбрасывания метелки и периодом молочной спелости (Рисунок 5).

Рисунок 5. Тепловая карта значений коэффициента корреляции |r|. (a) Тепловая карта значений коэффициента корреляции |r| между вегетационным индексом и урожайностью риса в пять периодов роста. (b) Тепловая карта вегетационных индексов, связанных с урожайностью риса в GP4, в анализе автокорреляции.

Мы провели анализ автокорреляции различных вегетационных индексов в GP4, который выявляет сильные корреляции между NDRE и NDVI, а также между NDRE и OSAVI, со значениями 0,75 и 0,76 соответственно (Рисунок 5). Три вегетационных индекса включают ближние инфракрасные диапазоны. Коэффициент отражения растительности в ближнем инфракрасном диапазоне в первую очередь определяется внутренней структурой листьев. Этот коэффициент отражения служит ключевым индикатором здоровья растительности и имеет решающее значение для моделирования состояния роста поверхностных культур, оценки степени покрытия и понимания динамики роста культур. NDRE содержит как ближний инфракрасный диапазон, так и диапазон красного края, который характеризуется быстрым изменением коэффициента отражения растительности на пересечении ближнего инфракрасного и красного света. Эта функция эффективно указывает на состояние пигментации растений и общее здоровье. Следовательно, NDRE был сохранен, в то время как NDVI и OSAVI были исключены из-за их автокорреляции с NDRE. В конечном итоге, среди пяти вегетационных индексов, наиболее значимых для урожайности риса, NDRE, GCVI, NDWI, OSAVI и NDVI, для построения модели оценки были выбраны NDRE, GCVI и NDWI.

3.2. Временные ряды для раннего прогнозирования урожайности

Понимание ключевых периодов роста необходимо для точной оценки урожайности. Мы сравнили производительность ALSTM с тремя базовыми моделями: LASSO, RF и LSTM. Это сравнение фокусируется на влиянии различных временных рядов на оценку урожайности. Данные временных рядов были от GP1 до GP2, GP3, GP4 и GP5. Мы установили основу оценки ALSTM наряду с базовыми моделями, используя вегетационные индексы NDRE, GCVI и NDWI в качестве переменных признаков. R², RMSE и MAE четырех вышеупомянутых моделей были сравнены для различных временных рядов (Рисунок 6).

Рисунок 6. Производительность модели и анализ временного окна для различных временных рядов. (a–c) представляют собой производительность моделей оценки, построенных для различных временных рядов. (a) R², (b) RMSE и (c) MAE. (d) представляет собой таблицу оценки производительности модели. Розовый цвет представляет оценку временного ряда GP1-GP4, желтый цвет представляет оценку временного ряда GP1-GP5, а синий цвет представляет оценку с использованием модели ALSTM. Все вышеперечисленное представляет собой результаты оценки для валидационного набора.

Результаты показывают, что значения R² модели ALSTM для прогнозирования урожайности риса в различных периодах роста превзошли значения моделей LASSO, RF и LSTM. Кроме того, RMSE и MAE для модели ALSTM ниже, чем у моделей LASSO и RF (Рисунок 6). Значимость вегетационных индексов для прогнозирования урожайности различается в различных периодах роста. Все четыре модели стабильно свидетельствуют о том, что GP4 является поворотным периодом в точности прогнозирования урожайности, как иллюстрировано розовыми фоновыми столбцами на Рисунке 6. Производительность моделей увеличивается до GP1-GP4. После GP1-GP4, когда рост риса вступает в фазы молочной и желтой спелости, производительность модели снижается без значительных колебаний (показано желтыми фоновыми столбцами на Рисунке 6). Производительность трех базовых моделей демонстрирует постоянное улучшение с расширением временного ряда. Однако производительность этих моделей на GP1-GP5 демонстрирует минимальное улучшение по сравнению с GP1-GP4. Модель ALSTM демонстрирует повышенную производительность по мере расширения временного ряда до GP1-GP4; однако значение R² на GP1-GP5 показывает снижение на 0,1 по сравнению с GP1-GP4. Результаты показывают, что длительный временной ряд не обязательно приводит к более благоприятной оценке урожайности. Улучшение производительности базовых моделей минимально, хотя включение GP5 в временной ряд. Для достижения раннего прогноза урожайности до созревания риса и одновременного поддержания точности модели мы использовали GP1-GP4 в качестве данных временных рядов.

Структура ALSTM показывает превосходную точность по сравнению с LASSO, RF и LSTM. Она эффективно улавливает длительные данные временных рядов, превосходя базовые модели, и демонстрирует повышенную чувствительность к влиянию вегетационных индексов на оценку урожайности в различных периодах роста. GP4 представляет собой ключевую фазу для формирования урожайности риса и точности оценки урожайности. Этот период служит временным окном для оценки урожайности. Структура ALSTM, использующая временной ряд GP1-GP4, демонстрирует превосходную производительность, достигая точных прогнозов урожайности (R² > 0,8) за 1–2 месяца до сбора риса.

3.3. Анализ весов переменных признаков на основе механизма внимания

Модель глубокого обучения работает как «черный ящик»; необходимо идентифицировать признаки входных переменных, которые значимы для целевых векторов, и повысить интерпретируемость модели глубокого обучения [58]. Визуализация механизма внимания дает представление о процессе принятия решений моделью, тем самым повышая прозрачность и надежность модели. Опираясь на визуализацию, мы можем определить, какие компоненты модели получают внимание во время обработки данных. Изучение распределения внимания позволяет исследователям и разработчикам понять, как модель извлекает ценную информацию из входных данных, что имеет решающее значение для устранения неполадок и повышения производительности модели. Анализ важности признаков помогает улучшить интерпретируемость модели глубокого обучения, выявляя, какие входные переменные оказывают большее влияние на прогнозы модели и как эти переменные изменяются в различных периодах роста. Это понимание позволяет нам понять поведение модели и усовершенствовать процесс принятия решений.

На Рисунке 7 иллюстрируются веса вегетационных индексов, полученные из модели ALSTM для GP1–GP5. Он показывает, что веса различных вегетационных индексов в течение одного и того же периода роста демонстрируют сходство; однако веса одного и того же вегетационного индекса в различных периодах роста демонстрируют значительные вариации. Веса, присвоенные каждому вегетационному индексу в GP1 и GP2, относительно ниже, находясь в диапазоне от 0,35 до 0,49. Веса каждого вегетационного индекса в GP3 и GP4 показывают увеличение, хотя GP4 демонстрирует более высокие веса (0,82–0,83), чем GP3 (0,71–0,76). Тем не менее, веса вегетационных индексов в GP5 (0,58–0,68) показывают последующее снижение. Анализ демонстрирует, что GP3 и GP4 оказывают большее влияние на урожайность риса, чем GP1, GP2 и GP5, причем GP4 является наиболее значимым вкладчиком в урожайность. Это соответствует выводам, представленным в Разделе 3.2, указывая на то, что GP4 является ключевой фазой для формирования урожайности риса и точности оценок. Кроме того, это подтверждает, что GP1-GP4 могут служить входными данными временных рядов для модели урожайности ALSTM.

Рисунок 7. Важность переменных признаков в различных периодах роста риса на основе весов механизма внимания.

3.4. Проверка надежности основы прогнозирования урожайности ALSTM

Мы оценили надежность основы прогнозирования урожайности риса ALSTM, применив ее к данным 2022 года. Общая урожайность риса, прогнозируемая моделью в уезде Цянь-Горлос, была сравнена с официально опубликованной урожайностью. Первоначально площадь посадки риса в 2022 году была извлечена с помощью методологии, изложенной в Разделе 2.2.2, в результате чего была получена общая площадь 79 786 га. Затем основа оценки ALSTM, представленная в этой статье, вместе с тремя базовыми моделями (LASSO, RF и LSTM), была использована для прогнозирования урожайности риса в 2022 году. Общее производство риса в уезде Цянь-Горлос в 2022 году, рассчитанное по четырем моделям, составило 700 230 т, 741 420 т, 720 825 т и 638 445 т соответственно. Результаты оценки урожайности в конечном итоге сравниваются с официальными статистическими данными об урожайности для оценки надежности производительности модели. Статистическое бюро уезда Цянь-Горлос сообщило, что общее производство риса за 2022 год составило 686 500 т. По сравнению с фактическим производством, результаты ALSTM показывают увеличение на 2%, LASSO показывает увеличение на 8%, модель RF показывает увеличение на 5%, тогда как LSTM показывает снижение на 7%. Это завышение или занижение связано в основном с проблемой смешанных пикселей в сочетании с неблагоприятными климатическими условиями. Во время сезона дождей и облачной погоды на расчет вегетационных индексов будет влиять. Кроме того, рисовые поля часто сосуществуют с различными другими типами земного покрова, такими как товарные культуры, фруктовые деревья и кустарники, прилегающие к дорогам. Это может привести к неправильной интерпретации характеристик риса наряду с другими структурами земного покрова, потенциально завышая результаты моделирования урожайности. Резюмируя, оценки, полученные с помощью модели ALSTM, являются наиболее близкими к официальным статистическим данным об урожайности в 2022 году, что демонстрирует большую точность по сравнению с базовой моделью, указывая на надежность структуры ALSTM, представленной в этой статье.

Кроме того, мы оценили точность ALSTM и базовых моделей, используя 135 образцов за 2022 год, и построили точечные диаграммы вместе с картами пространственного распределения урожайности (Рисунок 8). Результаты показывают, что значения R², RMSE и MAE для ALSTM составляют 0,85, 115 кг/га и 74 кг/га соответственно, демонстрируя превосходную точность по сравнению с другими тремя базовыми моделями. Карта пространственного распределения урожайности показывает, что три базовые модели не смогли точно оценить урожайность в зоне высоких значений (Рисунок 9). Вегетационный индекс в районах с высокими значениями урожайности может достигать насыщения, что делает его неспособным реагировать на изменения урожайности. В тех случаях, когда определенные вегетационные индексы демонстрируют насыщение и минимальные вариации с урожайностью, модель ALSTM демонстрирует превосходную способность по сравнению с тремя базовыми моделями извлекать значимую информацию, связанную с урожайностью, из интеграции множества вегетационных индексов и данных временных рядов.

Рисунок 8. Сравнение производительности модели в 2022 году. (a–d) представляют собой точечные диаграммы измеренной урожайности в сравнении с прогнозируемой урожайностью LASSO, RF, LSTM и ALSTM.

Рисунок 9. Пространственное распределение прогнозируемой урожайности риса в 2022 году с помощью (a) ALSTM, (b) LASSO, (c) RF и (d) LSTM.

4.1. Преимущества ALSTM в прогнозировании урожайности

В сельском хозяйстве знание влияния фенологических признаков на урожайность культур важно для фермеров и агрономов при разработке программ устойчивого развития. Это исследование интегрирует механизм внимания с моделью LSTM для извлечения ключевых связанных с урожайностью климатических переменных признаков, создавая более надежную и устойчивую модель для прогнозирования урожайности риса в таких регионах, как Северо-Восточный Китай. Результаты показывают, что точность модели прогнозирования урожайности временных рядов ALSTM превосходит базовую модель. Это можно объяснить двумя преимуществами механизма внимания [59]. Во-первых, механизм внимания способен распределять различное внимание (веса) для различных входных переменных, присваивая более высокие веса значимой информации, в то время как более низкие веса используются для игнорирования нерелевантных данных. Это преимущество очевидно из наших результатов, поскольку модель ALSTM присваивает более высокие веса ключевым климатическим признакам в критические периоды роста (например, GP3 и GP4), одновременно минимизируя влияние менее релевантных данных, как показано в распределении весов на Рисунке 7. Кроме того, этот механизм может непрерывно изменять веса, позволяя отбирать важную информацию в различных контекстах. Наши результаты также демонстрируют это преимущество, поскольку механизм внимания помогает модели ALSTM фокусироваться на важных данных в ключевые периоды, обеспечивая эффективное использование данных временных рядов даже с более длинными последовательностями. Это решает проблемы, связанные с рекуррентными нейронными сетями (RNNs) [60], такие как снижение производительности с более длинными входными данными временных рядов и неэффективность вычислений, возникающая из-за последовательности ввода временных признаков.

Существуют прецеденты применения модели ALSTM для прогнозирования урожайности. Авторы [60] разработали новую основу глубокого обучения с использованием ALSTM для прогнозирования урожайности озимой пшеницы на равнине Гуаньчжун. Результаты показали, что модель ALSTM повысила точность прогнозирования и успешно предсказала урожайность озимой пшеницы на 20 дней раньше, чем модель LSTM. Структура ALSTM, разработанная Tian, Wang, Tansey, Han, Zhang, Zhang и Li [52], подходит для применения на уездном уровне; однако структура прогнозирования урожайности риса, представленная в этой статье, предназначена для анализа на уровне пикселей, предоставляя повышенную точность для разработки стратегий управления полями.

4.2. Важные периоды роста для прогнозирования урожайности риса

Цикл плодородия риса начинается с прорастания семян и завершается производством новых семян. Конечная урожайность культур определяется накоплением органического вещества в различные периоды роста на протяжении репродуктивного цикла. Каждый период роста вносит различный вклад в общую урожайность. Оценка идеального времени упреждения для прогнозирования урожайности риса становится важной для обеспечения продовольственной безопасности [61].

Ключевые периоды роста однолетнего риса в Северо-Восточном Китае включают период пересадки, период кущения, период стеблевания, период выбрасывания метелки, период молочной спелости и период желтой спелости. Фаза пересадки указывает на расположение рассады риса, плотность посадки и начальное состояние роста. В период кущения развивается значительное количество листьев риса, а физико-химические характеристики этих листьев указывают на питательное состояние растения риса. Период стеблевания представляет собой основную фазу роста основания стебля риса, а не ключевой период для накопления органического вещества в органах урожайности культур. На протяжении этой фазы стебли риса демонстрируют значительный вертикальный рост, в то время как листья растения риса остаются относительно маленькими. Наличие голой земли влияет на данные спектрального коэффициента отражения. Точность модели прогнозирования урожайности риса, используемой в период стеблевания, недостаточна. Период выбрасывания метелки представляет собой ключевую фазу развития, характеризующуюся усилением репродуктивного роста и потребления питательных веществ в культурах, которые происходят с повышенной активностью и коэволюцией. На протяжении этой фазы скорость накопления сухого вещества в рисе увеличивается и достигает максимального уровня. В период молочной спелости количество зерен в колосе растения риса в основном установлено. Увеличение сухого веса зерен происходит быстрыми темпами, в то время как накопление сухого вещества происходит постепенно. Питательные вещества, синтезированные листьями, непрерывно транспортируются к зернам в значительных количествах [33,62,63]. Следовательно, GP4 представляет собой наиболее ключевую фазу в установлении урожайности риса в периоды выбрасывания метелки и молочной спелости. Выводы согласуются с результатами, указывающими на то, что модель прогнозирования урожайности, использующая данные временных рядов до GP4, демонстрирует наивысшую точность, причем веса вегетационных индексов также достигают пика в GP4 (Рисунок 6 и Рисунок 7). В эти два критических периода роста риса воздействия полегания, водного стресса и света значимы для окончательного формирования урожайности риса. В период выбрасывания метелки недостаточный уровень воды является основным фактором, влияющим на урожайность риса. По мере того как рост риса переходит в период желтой спелости, продолжается снижение содержания хлорофилла в листьях риса [64,65]. Взаимосвязь между различными вегетационными индексами и урожайностью культур уменьшается. Надежность и стабильность модели оценки снижаются после того, как рис вступает в период желтой спелости по этой причине.

Несколько предыдущих исследований определили фазы выбрасывания метелки и молочной спелости как критические периоды роста для прогнозирования урожайности риса. Yang и др. [66] выполнили оценку урожайности риса с использованием сверточной нейронной сети, используя изображения с беспилотных летательных аппаратов, полученные в период молочной спелости. Результаты показывают, что сеть, обученная с использованием набора данных RGB в период молочной спелости, демонстрирует выдающуюся пространственную общность. Son и др. [67] провели крупномасштабную оценку урожайности риса в дельте Меконга, Вьетнам, с помощью улучшенного вегетационного индекса MODIS и нормализованного разностного индекса, сосредоточившись на периоде выбрасывания метелки как на временном окне. Yang и др. [68] предложили методологию оценки урожайности риса на основе данных сезона молочной спелости. Структура разработала новую стратегию и методологию с помощью иерархического моделирования и стратегии принятия решений с нормализованными весами. Этот подход направлен на то, чтобы служить ориентиром для достижения точной оценки урожайности в реальном времени с помощью беспилотной авиационной дистанционной съемки в будущем. Периоды роста, использованные для прогнозирования урожайности в предыдущих исследованиях, соответствуют данной статье, предполагая, что фазы выбрасывания метелки и молочной спелости служат критическими временными окнами для прогнозирования урожайности риса. Кроме того, GP1-GP4 могут быть использованы в качестве временного ряда для раннего прогноза урожайности.

4.3. Важные вегетационные индексы для прогнозирования урожайности риса

Вегетационные индексы предоставляют информацию о физических характеристиках культур в различные периоды роста, включая содержание хлорофилла, площадь листьев и биомассу, которые связаны с урожайностью. Они установили фундаментальную основу для прогнозирования урожайности культур с помощью применения вегетационных индексов. Анализ корреляции Пирсона показал, что NDRE, GCVI и NDWI демонстрируют сильные корреляции с урожайностью риса.

Различие между красным и ближним инфракрасным (NIR) диапазонами служит методом оценки зелености растительности, плотности культур и роста культур. NDVI является наиболее широко используемым вегетационным индексом, полученным из данных красного и ближнего инфракрасного диапазонов для оценки биофизических характеристик растительности. Однако NDVI достигает насыщения при повышенных уровнях индекса площади листьев (LAI). Чувствительность NDVI к LAI уменьшается на этой стадии, причем LAI служит ключевым индикатором урожайности культур, тем самым влияя на точность NDVI в оценке урожайности. NDVI заменяет ближний инфракрасный диапазон в NDVI на диапазон красного края, повышая чувствительность к LAI, содержанию хлорофилла и биомассе за счет включения спектральной информации красного края [47]. Это соответствует нашему выводу о том, что NDRE демонстрирует сильную корреляцию с измеренной урожайностью при оценке урожайности культур.

GCVI в основном используется в сельскохозяйственных и экологических исследованиях, демонстрируя чувствительность к вариациям уровней хлорофилла в растениях. В частности, когда LAI превышает 3, GCVI демонстрирует большую чувствительность к вариациям LAI риса по сравнению с NDVI. Содержание хлорофилла в пологе служит индикатором физиологического состояния риса и интенсивности его фотосинтетической активности [45]. Вариации в GCVI эффективно облегчают мониторинг роста риса в реальном времени, позволяя точно оценивать урожайность риса.

NDWI имеет преимущество в том, что ближний инфракрасный диапазон демонстрирует значительное поглощение и минимальную отражательную способность в водных объектах, тогда как он демонстрирует высокую отражательную способность в растительности. Система реагирует на пространственные и временные закономерности условий поверхностных вод, подавляя рост растительности и подчеркивая присутствие водных объектов. NDWI демонстрирует повышенную чувствительность к методам орошения в полуаридных регионах, характеризующихся низкоплотной сельскохозяйственной деятельностью, в частности при анализе данных в более широких масштабах и за длительные периоды. Это указывает на то, что NDWI более полезен для долгосрочного мониторинга культур на рисовых полях по сравнению с сухими полями. Кроме того, NDWI демонстрирует более медленную скорость насыщения при увеличении площади листьев культур по сравнению с NDVI и EVI, и он эффективно отслеживает преимущества, связанные с водным стрессом растений. Следовательно, NDWI эффективно решает проблему влияния засухи на урожайность риса. Кроме того, NDWI может быть интегрирован с другими вегетационными индексами для улучшения анализа экологической среды [48]. Это соответствует цели данной статьи — разработать модель прогнозирования урожайности с использованием трех вегетационных индексов, NDWI, NDRE и GCVI, одновременно для повышения точности модели.

4.4. Неопределенности и перспективы

В этой статье представлена основа прогнозирования временных рядов ALSTM для риса, подчеркивающая широкое применение моделей глубокого обучения в сельскохозяйственном дистанционном зондировании. Это исследование идентифицирует GP4 как оптимальное временное окно для ранних оценок урожайности, выделяя способность модели улавливать данные временных рядов. Это исследование предоставляет основополагающую основу для прогнозирования урожая зерновых и практики страхования продовольствия. Однако это исследование все еще содержит некоторые неопределенности и области для дальнейшего изучения.

(1) Проверка этого исследования ограничена конкретным регионом, и все еще отсутствует более широкое тестирование в различных географических и климатических условиях. Это ограничивает оценку обобщаемости и практической применимости модели. Поэтому в дальнейшем работа будет сосредоточена на оценке производительности ALSTM в прогнозировании урожайности в различных географических и климатических регионах, дополнительно подтверждая ее применимость и обобщаемость. (2) Что касается выбора входных переменных модели, будущие исследования могут рассмотреть возможность добавления таких параметров, как индекс площади листьев, содержание хлорофилла, влажность почвы и количество осадков, поверх вегетационных индексов, чтобы дополнительно повысить точность и надежность прогнозирования урожайности. Расширяя входные признаки, модель может улавливать больше факторов, связанных с урожайностью, повышая точность прогнозов. (3) ALSTM повышает интерпретируемость модели за счет визуализации весов входных переменных, в то время как традиционные модели культур интегрируют установленные знания физиологии растений и агрономии, делая влияние входных переменных на рост культур более ясным. В дальнейшем исследования будут сосредоточены на изучении того, как объединить модели глубокого обучения с процессно-ориентированными моделями культур, тем самым улучшая интерпретируемость модели при одновременном упрощении вычислительного процесса моделей глубокого обучения, дополнительно продвигая модели прогнозирования урожайности. (4) Помимо моделей ALSTM и LSTM, другие модели временных рядов, такие как GRU и Transformer, также демонстрируют определенные преимущества в прогнозировании временных рядов. В будущем мы изучим производительность этих моделей для различных размеров наборов данных и исследуем их потенциальное применение в прогнозировании урожайности сельскохозяйственных культур. Используя сильные стороны этих передовых моделей временных рядов, мы ожидаем предоставить новые решения для повышения точности прогнозирования урожайности.

В этом исследовании была предложена и применена основа прогнозирования урожайности риса ALSTM на уровне пикселей, основанная на снимках Sentinel-2 и наземных данных об урожайности, в уезде Цянь-Горлос, признанном типичным регионом возделывания однолетнего риса в Северо-Восточном Китае. Мы определили оптимальные вегетационные индексы и временное окно для раннего прогнозирования урожайности, связанные с урожайностью риса. Результаты показывают, что GP4, идентифицированный как период от выбрасывания метелки до молочной спелости, является временным окном для раннего прогнозирования урожайности риса в Северо-Восточном Китае. Вегетационные индексы NDRE, GCVI и NDWI за период GP1–GP4 были включены в структуру ALSTM в качестве переменных временных рядов. Полученные значения R², RMSE и MAE составили 0,88, 341,82 кг/га и 280,29 кг/га соответственно. Структура ALSTM демонстрирует превосходную точность по сравнению с LASSO, RF и LSTM, а также демонстрирует эффективные возможности в улавливании данных временных рядов. Наконец, предложенная модель раннего прогнозирования урожайности ALSTM была распространена на 2022 год, в результате чего были получены значения R², RMSE и MAE, равные 0,85, 408 кг/га и 339 кг/га соответственно. Расхождения между результатами прогнозирования урожайности и статистическим ежегодником составили менее 2%, что демонстрирует надежность основы прогнозирования урожайности. Представленная в этой статье основа прогнозирования урожайности однолетнего риса в Северо-Восточном Китае способна прогнозировать урожайность текущего года за два месяца до сбора риса, что предоставляет ключевые идеи для прогнозирования урожайности риса, оценки ущерба от стихийных бедствий и разработки политики соответствующими директивными органами, помогая смягчить риски потери урожайности до окончания вегетационного сезона.

1. Peng, S.; Tang, Q.; Zou, Y. Current status and challenges of rice production in China. Plant Prod. Sci. 2009, 12, 3–8. [Google Scholar] [CrossRef]

2. Xin, F.; Xiao, X.; Dong, J.; Zhang, G.; Zhang, Y.; Wu, X.; Li, X.; Zou, Z.; Ma, J.; Du, G. Large increases of paddy rice area, gross primary production, and grain production in Northeast China during 2000–2017. Sci. Total Environ. 2020, 711, 135183. [Google Scholar] [CrossRef] [PubMed]

3. Bin Rahman, A.R.; Zhang, J. Trends in rice research: 2030 and beyond. Food Energy Secur. 2023, 12, e390. [Google Scholar] [CrossRef]

4. Son, N.; Chen, C.; Chen, C.; Guo, H.; Cheng, Y.; Chen, S.; Lin, H.; Chen, S. Machine learning approaches for rice crop yield predictions using time-series satellite data in Taiwan. Int. J. Remote Sens. 2020, 41, 7868–7888. [Google Scholar] [CrossRef]

5. Son, N.; Chen, C.; Cheng, Y.; Toscano, P.; Chen, C.; Chen, S.; Tseng, K.; Syu, C.; Guo, H.; Zhang, Y. Field-scale rice yield prediction from Sentinel-2 monthly image composites using machine learning algorithms. Ecol. Inform. 2022, 69, 101618. [Google Scholar] [CrossRef]

6. Timsina, J.; Connor, D.J. Productivity and management of rice–wheat cropping systems: Issues and challenges. Field Crop Res. 2001, 69, 93–132. [Google Scholar] [CrossRef]

7. Yang, G.; Liu, J.; Zhao, C.; Li, Z.; Huang, Y.; Yu, H.; Xu, B.; Yang, X.; Zhu, D.; Zhang, X. Unmanned aerial vehicle remote sensing for field-based crop phenotyping: Current status and perspectives. Front. Plant Sci. 2017, 8, 1111. [Google Scholar] [CrossRef]

8. Jin, X.; Kumar, L.; Li, Z.; Feng, H.; Xu, X.; Yang, G.; Wang, J. A review of data assimilation of remote sensing and crop models. Eur. J. Agron. 2018, 92, 141–152. [Google Scholar] [CrossRef]

9. Zhu, X.; Cai, F.; Tian, J.; Williams, T.K. Spatiotemporal fusion of multisource remote sensing data: Literature survey, taxonomy, principles, applications, and future directions. Remote Sens. 2018, 10, 527. [Google Scholar] [CrossRef]

10. Khanal, S.; Kc, K.; Fulton, J.P.; Shearer, S.; Ozkan, E. Remote sensing in agriculture—Accomplishments, limitations, and opportunities. Remote Sens. 2020, 12, 3783. [Google Scholar] [CrossRef]

11. Prasad, A.K.; Chai, L.; Singh, R.P.; Kafatos, M. Crop yield estimation model for Iowa using remote sensing and surface parameters. Int. J. Appl. Earth Obs. 2006, 8, 26–33. [Google Scholar] [CrossRef]

12. Wang, E.; Engel, T. SPASS: A generic process-oriented crop model with versatile windows interfaces. Environ. Model. Softw. 2000, 15, 179–188. [Google Scholar] [CrossRef]

13. Manivasagam, V.S.; Rozenstein, O. Practices for upscaling crop simulation models from field scale to large regions. Comput. Electron. Agric. 2020, 175, 105554. [Google Scholar] [CrossRef]

14. Divya, K.L.; Mhatre, P.H.; Venkatasalam, E.P.; Sudha, R. Crop simulation models as decision-supporting tools for sustainable potato production: A review. Potato Res. 2021, 64, 387–419. [Google Scholar] [CrossRef]

15. Ding, Y.; Zhang, H.; Wang, Z.; Xie, Q.; Wang, Y.; Liu, L.; Hall, C.C. A comparison of estimating crop residue cover from sentinel-2 data using empirical regressions and machine learning methods. Remote Sens. 2020, 12, 1470. [Google Scholar] [CrossRef]

16. Balaghi, R.; Tychon, B.; Eerens, H.; Jlibene, M. Empirical regression models using NDVI, rainfall and temperature data for the early prediction of wheat grain yields in Morocco. Int. J. Appl. Earth Obs. 2008, 10, 438–452. [Google Scholar] [CrossRef]

17. Gaso, D.V.; Berger, A.G.; Ciganda, V.S. Predicting wheat grain yield and spatial variability at field scale using a simple regression or a crop model in conjunction with Landsat images. Comput. Electron. Agric. 2019, 159, 75–83. [Google Scholar] [CrossRef]

18. Benos, L.; Tagarakis, A.C.; Dolias, G.; Berruto, R.; Kateris, D.; Bochtis, D. Machine learning in agriculture: A comprehensive updated review. Sensors 2021, 21, 3758. [Google Scholar] [CrossRef]

19. Saleem, M.H.; Potgieter, J.; Arif, K.M. Automation in agriculture by machine and deep learning techniques: A review of recent developments. Precis. Agric. 2021, 22, 2053–2091. [Google Scholar] [CrossRef]

20. Sharma, A.; Jain, A.; Gupta, P.; Chowdary, V. Machine learning applications for precision agriculture: A comprehensive review. IEEE Access 2020, 9, 4843–4873. [Google Scholar] [CrossRef]

21. Sharma, R.; Kamble, S.S.; Gunasekaran, A.; Kumar, V.; Kumar, A. A systematic literature review on machine learning applications for sustainable agriculture supply chain performance. Comput. Oper. Res. 2020, 119, 104926. [Google Scholar] [CrossRef]

22. Araújo, S.O.; Peres, R.S.; Ramalho, J.C.; Lidon, F.; Barata, J. Machine learning applications in agriculture: Current trends, challenges, and future perspectives. Agronomy 2023, 13, 2976. [Google Scholar] [CrossRef]

23. Chlingaryan, A.; Sukkarieh, S.; Whelan, B. Machine learning approaches for crop yield prediction and nitrogen status estimation in precision agriculture: A review. Comput. Electron. Agric. 2018, 151, 61–69. [Google Scholar] [CrossRef]

24. Kamilaris, A.; Prenafeta-Boldú, F.X. Deep learning in agriculture: A survey. Comput. Electron. Agric. 2018, 147, 70–90. [Google Scholar] [CrossRef]

25. Tian, H.; Wang, P.; Tansey, K.; Zhang, J.; Zhang, S.; Li, H. An LSTM neural network for improving wheat yield estimates by integrating remote sensing data and meteorological data in the Guanzhong Plain, PR China. Agric. For. Meteorol. 2021, 310, 108629. [Google Scholar] [CrossRef]

26. Niu, Z.; Zhong, G.; Yu, H. A review on the attention mechanism of deep learning. Neurocomputing 2021, 452, 48–62. [Google Scholar] [CrossRef]

27. Liu, F.; Jiang, X.; Wu, Z. Attention mechanism-combined LSTM for grain yield prediction in China using multisource satellite imagery. Sustainability 2023, 15, 9210. [Google Scholar] [CrossRef]

28. Shahhosseini, M.; Hu, G.; Archontoulis, S.V. Forecasting corn yield with machine learning ensembles. Front. Plant Sci. 2020, 11, 1120. [Google Scholar] [CrossRef]

29. Rashid, M.; Bari, B.S.; Yusup, Y.; Kamaruddin, M.A.; Khan, N. A comprehensive review of crop yield prediction using machine learning approaches with special emphasis on palm oil yield prediction. IEEE Access 2021, 9, 63406–63439. [Google Scholar] [CrossRef]

30. Jeong, S.; Ko, J.; Yeom, J. Predicting rice yield at pixel scale through synthetic use of crop and deep learning models with satellite data in South and North Korea. Sci. Total Environ. 2022, 802, 149726. [Google Scholar] [CrossRef]

31. Liu, L.; Xie, Y.; Zhu, B.; Song, K. Rice leaf chlorophyll content estimation with different crop coverages based on Sentinel-2. Ecol. Inform. 2024, 81, 102622. [Google Scholar] [CrossRef]

32. Ma, X.; Ma, Y. The spatiotemporal variation analysis of virtual water for agriculture and livestock husbandry: A study for Jilin Province in China. Sci. Total Environ. 2017, 586, 1150–1161. [Google Scholar] [CrossRef] [PubMed]

33. Sánchez, B.; Rasmussen, A.; Porter, J.R. Temperatures and the growth and development of maize and rice: A review. Glob. Change Biol. 2014, 20, 408–417. [Google Scholar] [CrossRef]

34. Wang, Q.; Shi, W.; Li, Z.; Atkinson, P.M. Fusion of Sentinel-2 images. Remote Sens. Environ. 2016, 187, 241–252. [Google Scholar] [CrossRef]

35. Wang, Q.; Atkinson, P.M. Spatio-temporal fusion for daily Sentinel-2 images. Remote Sens. Environ. 2018, 204, 31–42. [Google Scholar] [CrossRef]

36. Raiyani, K.; Gonçalves, T.; Rato, L.; Salgueiro, P.; Marques Da Silva, J.R. Sentinel-2 image scene classification: A comparison between Sen2Cor and a machine learning approach. Remote Sens. 2021, 13, 300. [Google Scholar] [CrossRef]

37. Zhou, X.; Zheng, H.B.; Xu, X.Q.; He, J.Y.; Ge, X.K.; Yao, X.; Cheng, T.; Zhu, Y.; Cao, W.X.; Tian, Y.C. Predicting grain yield in rice using multi-temporal vegetation indices from UAV-based multispectral and digital imagery. ISPRS J. Photogramm. Remote Sens. 2017, 130, 246–255. [Google Scholar] [CrossRef]

38. Qiao, L.; Tang, W.; Gao, D.; Zhao, R.; An, L.; Li, M.; Sun, H.; Song, D. UAV-based chlorophyll content estimation by evaluating vegetation index responses under different crop coverages. Comput. Electron. Agric. 2022, 196, 106775. [Google Scholar] [CrossRef]

39. Aslan, M.F.; Sabanci, K.; Aslan, B. Artificial Intelligence Techniques in Crop Yield Estimation Based on Sentinel-2 Data: A Comprehensive Survey. Sustainability 2024, 16, 8277. [Google Scholar] [CrossRef]

40. Liu, T.; Wu, F.; Mou, N.; Zhu, S.; Yang, T.; Zhang, W.; Wang, H.; Wu, W.; Zhao, Y.; Sun, C. The estimation of wheat yield combined with UAV canopy spectral and volumetric data. Food Energy Secur. 2024, 13, e527. [Google Scholar] [CrossRef]

41. Taylor, J.A.; Bates, T.R. A discussion on the significance associated with Pearson’s correlation in precision agriculture studies. Precis. Agric. 2013, 14, 558–564. [Google Scholar] [CrossRef]

42. Kaufman, Y.J.; Tanre, D. Atmospherically resistant vegetation index (ARVI) for EOS-MODIS. IEEE Trans. Geosci. Remote Sens. 1992, 30, 261–270. [Google Scholar] [CrossRef]

43. Corti, M.; Cavalli, D.; Cabassi, G.; Marino Gallina, P.; Bechini, L. Does remote and proximal optical sensing success-fully estimate maize variables? A review. Eur. J. Agron. 2018, 99, 37–50. [Google Scholar] [CrossRef]

44. Meyer, G.E.; Mehta, T.; Kocher, M.F.; Mortensen, D.A.; Samal, A. Textural imaging and discriminant analysis for distinguishingweeds for spot spraying. Trans. ASAE 1998, 41, 1189–1197. [Google Scholar] [CrossRef]

45. Shuai, G.; Fowler, A.; Basso, B. Within-season vegetation indices and yield stability as a predictor of spatial patterns of Maize (Zea mays L.) yields. Precis. Agric. 2024, 25, 963–982. [Google Scholar] [CrossRef]

46. Daughtry, C.S.T.; Gallo, K.P.; Goward, S.N.; Prince, S.D.; Kustas, W.P. Spectral estimates of absorbed radiation and phytomass production in corn and soybean canopies. Remote Sens. Environ. 1992, 39, 141–152. [Google Scholar] [CrossRef]

47. Li, F.; Miao, Y.; Feng, G.; Yuan, F.; Yue, S.; Gao, X.; Liu, Y.; Liu, B.; Ustin, S.L.; Chen, X. Improving estimation of summer maize nitrogen status with red edge-based spectral vegetation indices. Field Crop Res. 2014, 157, 111–123. [Google Scholar] [CrossRef]

48. McFeeters, S.K. The use of the Normalized Difference Water Index (NDWI) in the delineation of open water features. Int. J. Remote Sens. 1996, 17, 1425–1432. [Google Scholar] [CrossRef]

49. Wan, L.; Cen, H.; Zhu, J.; Li, Y.; Zhu, Y.; Sun, D.; Weng, H.; He, Y. Combining UAV-based vegetation indices, canopy height and canopy coverage to improve rice yield prediction under different nitrogen levels. In Proceedings of the 2019 ASABE Annual International Meeting, Boston, MA, USA, 7–10 July 2019; American Society of Agricultural and Biological Engineers: St. Joseph, MI, USA, 2019; p. 1. [Google Scholar]

50. Pearson, R.L.; Miller, L.D. Remote mapping of standing crop biomass for estimation of the productivity of the short-grass prairie. In Proceedings of the Eighth International Symposium on Remote Sensing of Environment, Ann Arbor, MI, USA, 2–6 October 1972; p. 1355. [Google Scholar]

51. Wang, Q.; Hao, Y. ALSTM: An attention-based long short-term memory framework for knowledge base reasoning. Neurocomputing 2020, 399, 342–351. [Google Scholar] [CrossRef]

52. Tian, H.; Wang, P.; Tansey, K.; Han, D.; Zhang, J.; Zhang, S.; Li, H. A deep learning framework under attention mechanism for wheat yield estimation using remotely sensed indices in the Guanzhong Plain, PR China. Int. J. Appl. Earth Obs. 2021, 102, 102375. [Google Scholar] [CrossRef]

53. Zou, H. The adaptive lasso and its oracle properties. J. Am. Stat. Assoc. 2006, 101, 1418–1429. [Google Scholar] [CrossRef]

54. Belgiu, M.; Drăguţ, L. Random forest in remote sensing: A review of applications and future directions. ISPRS J. Photogramm. Remote Sens. 2016, 114, 24–31. [Google Scholar] [CrossRef]

55. Landi, F.; Baraldi, L.; Cornia, M.; Cucchiara, R. Working memory connections for LSTM. Neural Netw. 2021, 144, 334–341. [Google Scholar] [CrossRef] [PubMed]

56. Panda, S.S.; Ames, D.P.; Panigrahi, S. Application of vegetation indices for agricultural crop yield prediction using neural network techniques. Remote Sens. 2010, 2, 673–696. [Google Scholar] [CrossRef]

57. Bala, S.K.; Islam, A.S. Correlation between potato yield and MODIS-derived vegetation indices. Int. J. Remote Sens. 2009, 30, 2491–2507. [Google Scholar] [CrossRef]

58. Muruganantham, P.; Wibowo, S.; Grandhi, S.; Samrat, N.H.; Islam, N. A systematic literature review on crop yield prediction with deep learning and remote sensing. Remote Sens. 2022, 14, 1990. [Google Scholar] [CrossRef]

59. Xiong, Z.; Xin, Q.; Zhang, Z.; Gui, H. A Meteorology-Driven Lstm For Predicting Time Series of Vegetation Leaf Area Index In Land Surface Model. In Proceedings of the IGARSS 2023—2023 IEEE International Geoscience and Remote Sensing Symposium, Pasadena, CA, USA, 16–21 July 2023; pp. 4915–4918. [Google Scholar]

60. Li, P.; Jiang, X.; Jin, G.; Yu, Y.; Xie, Z. ALSTM: An attention-based lstm model for multi-scenario bandwidth prediction. In Proceedings of the 2021 IEEE 27th International Conference on Parallel and Distributed Systems (ICPADS), Beijing, China, 14–16 December 2021; pp. 98–105. [Google Scholar]

61. Tang, L.; Zhu, Y.; Hannaway, D.; Meng, Y.; Liu, L.; Chen, L.; Cao, W. RiceGrow: A rice growth and productivity model. NJAS—Wagening. J. Life Sci. 2009, 57, 83–92. [Google Scholar] [CrossRef]

62. Fageria, N.K. Yield physiology of rice. J. Plant Nutr. 2007, 30, 843–879. [Google Scholar] [CrossRef]

63. Hattori, Y.; Nagai, K.; Ashikari, M. Rice growth adapting to deepwater. Curr. Opin. Plant Biol. 2011, 14, 100–105. [Google Scholar] [CrossRef]

64. Mosleh, M.K.; Hassan, Q.K.; Chowdhury, E.H. Application of remote sensors in mapping rice area and forecasting its production: A review. Sensors 2015, 15, 769–791. [Google Scholar] [CrossRef]

65. Huang, J.F.; Tang, S.C.; Ousama, A.I.; Wang, R.C. Rice yield estimation using remote sensing and simulation model. J. Zhejiang Univ. Sci. A 2002, 3, 461–466. [Google Scholar] [CrossRef]

66. Yang, Q.; Shi, L.; Han, J.; Zha, Y.; Zhu, P. Deep convolutional neural networks for rice grain yield estimation at the ripening stage using UAV-based remotely sensed images. Field Crop Res. 2019, 235, 142–153. [Google Scholar] [CrossRef]

67. Son, N.T.; Chen, C.F.; Chen, C.R.; Minh, V.Q.; Trung, N.H. A comparative analysis of multitemporal MODIS EVI and NDVI data for large-scale rice yield estimation. Agric. Forest Meteorol. 2014, 197, 52–64. [Google Scholar] [CrossRef]

68. Yang, R.; Zhou, J.; Lu, X.; Shen, J.; Chen, H.; Chen, M.; He, Y.; Liu, F. A robust rice yield estimation framework developed by grading modeling and normalized weight decision-making strategy using UAV imaging technology. Comput. Electron. Agric. 2023, 215, 108417. [Google Scholar] [CrossRef]

Li J, Xie Y, Liu L, Song K, Zhu B. Long Short-Term Memory Neural Network with Attention Mechanism for Rice Yield Early Estimation in Qian Gorlos County, Northeast China. Agriculture. 2025; 15(3):231. https://doi.org/10.3390/agriculture15030231

Перевод статьи «Long Short-Term Memory Neural Network with Attention Mechanism for Rice Yield Early Estimation in Qian Gorlos County, Northeast China» авторов Li J, Xie Y, Liu L, Song K, Zhu B., оригинал доступен по ссылке. Лицензия: CC BY. Изменения: переведено на русский язык