Читая листья риса: как вовремя заметить опасный металл
Быстрая и неразрушающая оценка значений SPAD в листьях имеет решающее значение для мониторинга воздействия кадмиевого (Cd) стресса на рис. Чтобы решить проблему низкой точности оценки в моделях значений SPAD листьев, вызванной потерей спектральной информации в существующих исследованиях, в данной работе предлагается новая модель оценки, объединяющая чувствительные вегетационные индексы (VIss) и диагностические полосы дробного дифференциального порядка (FODcb).
Аннотация
Для проверки эффективности этой новой модели были созданы три сценария: без загрязнения Cd, с загрязнением Cd 1,0 мг/кг и с загрязнением Cd 1,4 мг/кг. Спектральная отражательная способность листьев и значения SPAD измерялись в критические периоды роста риса. Впоследствии были построены 16 вегетационных индексов, и для обработки спектральных данных применено преобразование дробной разности (FOD). Для извлечения VIss и FODcb использовался алгоритм проекции с переменной важностью (VIP). Наконец, с помощью алгоритма случайного леса (RF) были построены три модели: VIss + FODcb-RF, FODcb-RF и VIss-RF. Оцененные значения SPAD листьев для трех моделей показали следующее: (1) наблюдалось значительное различие между значениями SPAD листьев в сценарии без загрязнения Cd и сценарием с загрязнением 1,4 мг/кг Cd на 31-й и 87-й дни после пересадки; (2) спектральный диапазон 400–773 нм был чувствителен для оценки значений SPAD листьев, при этом сценарий с загрязнением Cd демонстрировал более высокую отражательную способность в видимом диапазоне длин волн по сравнению со сценарием без загрязнения Cd; (3) по сравнению с отдельными моделями FODcb-RF и VIss-RF, комбинированная модель (VIss + FODcb-RF) повысила точность оценки значений SPAD листьев. В частности, модель VIss + FOD1.2cb-RF показала наилучшие результаты со значениями R2v, RMSEv и RPDv, равными 0,821, 2,621 и 2,296 соответственно. В заключение, данное исследование демонстрирует эффективность объединения VIss и FODcb для точной оценки значений SPAD листьев риса, загрязненного Cd. Этот вывод послужит методологическим ориентиром для дистанционного мониторинга загрязнения риса кадмием.
1. Введение
Рис, загрязненный кадмием (Cd), не только представляет угрозу для здоровья человека, но и создает потенциальный риск для национальной и глобальной продовольственной безопасности [1,2,3]. Таким образом, усиление контроля за процессом роста риса, накапливающего Cd, имеет важнейшее значение для обеспечения его качества и безопасности. Содержание хлорофилла является надежным индикатором питательного статуса сельскохозяйственных культур, их фотосинтетической способности и стадии развития, а также ключевым параметром для оценки здоровья посевов и степени воздействия стресса окружающей среды [4,5,6]. Кроме того, содержание хлорофилла эффективно отражает степень загрязнения Cd и может служить индикаторным показателем [7,8]. Следовательно, оно стало одним из важнейших параметров для мониторинга загрязнения риса Cd. Многочисленные исследования [9,10,11] показывают значительную корреляцию между значениями SPAD (измеренными с помощью анализатора содержания хлорофилла в листьях) листьев и фактическим содержанием хлорофилла, поэтому первые широко используются для характеристики содержания хлорофилла. Однако прямое полевое измерение значений SPAD листьев с использованием специализированных приборов по-прежнему требует больших трудозатрат и времени, и его сложно реализовать в больших масштабах. Таким образом, разработка быстрых и точных методов мониторинга значений SPAD листьев имеет важнейшее значение для эффективного мониторинга загрязнения рисовых посевов Cd.
Гиперспектральное дистанционное зондирование характеризуется высоким спектральным разрешением, множеством непрерывных каналов и богатой информацией. В последние годы количество исследований значений SPAD листьев с использованием дистанционного зондирования в неблагоприятных условиях постепенно увеличивается. Многочисленные исследования использовали технологию гиперспектрального дистанционного зондирования для оценки значений SPAD листьев таких культур, как кукуруза [12,13,14,15], хлопок [16] и рис [17] в условиях стресса, вызванного засухой, засолением, болезнями и нашествиями вредителей. Прогнозируемые значения R2 находились в диапазоне от 0,61 до 0,91, что демонстрирует осуществимость использования значений SPAD листьев для мониторинга стресса сельскохозяйственных культур. Однако очевидно, что в текущих исследованиях недостаточно внимания уделялось стрессу сельскохозяйственных культур, вызванному тяжелыми металлами. Основная причина заключается в том, что тяжелые металлы являются микроэлементами, присутствующими в очень низких концентрациях в сельскохозяйственных культурах, и механизмы их спектрального отклика остаются плохо изученными. По этим причинам исследования стресса сельскохозяйственных культур, вызванного тяжелыми металлами, были в первую очередь сосредоточены на качественном анализе физиологического, биохимического и спектрального уровней отклика в условиях стресса от тяжелых металлов [18,19,20,21], что затрудняет точное количественное определение взаимосвязи между биохимическими параметрами и спектральной отражательной способностью. Хотя только несколько исследований начали изучать количественные модели спектральной оценки значений SPAD листьев салата при различных концентрациях стресса от Cd [22], было обнаружено, что оценка SPAD листьев на основе нормализованного индекса красной каймы была оптимальной с коэффициентом детерминации (R2) 0,78. Однако большинство вегетационных индексов, используемых в моделировании, заимствованы из других областей, что может сделать их менее релевантными для значений SPAD листьев в условиях стресса от тяжелых металлов. Кроме того, поскольку вегетационные индексы обычно строятся на основе данных отражательной способности, соответствующих двум или трем диапазонам, они могут не улавливать всю спектральную информацию, связанную со значениями SPAD листьев. В результате потеря спектральной информации может быть ключевым ограничивающим фактором для дальнейшего повышения точности модели. Более того, предыдущие исследования [23,24,25] показали, что диапазоны 400–570 нм, 940–990 нм и 1000 нм являются характерными для спектрального отклика почв, загрязненных Cd. Однако эти диапазоны часто исключаются при построении вегетационных индексов. Таким образом, еще предстоит определить, может ли включение этих характерных диапазонов в оценку значений SPAD листьев риса, загрязненного Cd, повысить точность оценки.
Выбор диагностических полос (характерных диапазонов) имеет важнейшее значение для создания высокоточной оценочной модели. Эффективная предварительная обработка спектральных данных является важной предпосылкой для этого выбора. Метод предварительной обработки с помощью дробного дифференциального исчисления (FOD) позволяет выделить незначительные изменения в спектральной информации, усилить более слабые спектральные особенности и улучшить соотношение сигнал/шум спектральной отражательной способности. Он широко применяется в дистанционном зондировании для инверсии содержания тяжелых металлов в рисе [26], содержания органического вещества в почве [27,28,29,30,31], содержания тяжелых металлов [32,33] и содержания солей [34,35,36]. Этот подход может помочь извлечь слабые сигналы в спектральном отклике риса в условиях стресса от Cd. Однако спектральные данные, преобразованные с помощью FOD, часто сталкиваются с "проклятием размерности", и прямое использование полных спектральных данных для построения оценочной модели требует больших вычислительных затрат, неэффективно и не подходит для широкого применения. Таким образом, объединение вегетационных индексов (VIs) и диагностических полос дробного дифференциального порядка (FODcb) является важной проблемой, которую необходимо решить для достижения высокоточной и высокоэффективной оценки значений SPAD в листьях риса в условиях слабых сигналов дистанционного зондирования при загрязнении Cd.
Кроме того, благодаря уникальным преимуществам модели случайного леса (RF) с точки зрения интерпретации важности переменных при моделировании и работы с небольшими размерами выборок [25,37], в этом исследовании использовался FOD для обработки данных спектральной отражательной способности риса в условиях загрязнения Cd, и FODcb были включены в VIss для оценки значений SPAD листьев риса с использованием моделирования RF. Цели этого исследования тройственны: (1) предложить новую модель, объединяющую VIss и FODcb, и проверить ее обоснованность в оценке значений SPAD листьев риса, загрязненного Cd; (2) показать закономерности отклика значений SPAD и спектральной отражательной способности листьев риса в условиях стресса от Cd, тем самым предоставив теоретическую основу для построения модели; и (3) определить диагностические полосы, на которых следует акцентировать внимание при применении комбинированной модели.
2. Материалы и методы
2.1. Дизайн эксперимента
Эксперимент был проведен в 2022 году на испытательной базе Хунаньского НИИ риса в городе Чуньхуа, уезд Чанша, провинция Хунань. Чтобы минимизировать влияние внешних факторов окружающей среды, в этом исследовании был разработан инновационный эксперимент с кадмиевыми бассейнами с рельсовым пластиковым туннелем, который автоматически убирается в дождливые периоды. Чтобы лучше соответствовать реальным условиям выращивания риса, это исследование следовало критериям, изложенным в "Стандартах контроля риска загрязнения почв для сельскохозяйственных угодий" (GB15618-2018), для категоризации качества почвенной среды [38]. В нем также учитывалась ситуация с загрязнением Cd рисовых полей в провинции Хунань. Были созданы три сценария загрязнения Cd с различными соотношениями фактического качества почвы, загрязненной Cd, а именно: без загрязнения Cd (NC), загрязнение Cd 1,0 мг/кг (C1) и загрязнение Cd 1,4 мг/кг (C2). Для тестирования было отобрано двенадцать низконакапливающих Cd селекционных материалов, сортов однолетнего позднего риса, полученных путем радиационного мутагенеза. Семена риса были посеяны 17 мая, пересажены 20 июня и собраны 21 сентября, общий период вегетации в поле составил 128 дней. Для каждого сценария загрязнения Cd было высажено двенадцать низконакапливающих Cd материалов риса с тремя повторностями. Схема эксперимента и схема обработки показаны на Рисунке 1.
Рисунок 1. Схемы эксперимента: (a) проведение эксперимента в реальных условиях и (b) схема программы опытных обработок (где V1–V12 обозначают 12 низконакапливающих Cd тестируемых материалов риса, а повтор 1, повтор 2 и повтор 3 представляют собой три повторности одного и того же тестируемого материала риса, загрязненного Cd).
2.2. Порядок работы
Блок-схема этого исследования представлена на Рисунке 2. Чтобы определить оптимальную модель для оценки значений SPAD в листьях риса, загрязненного Cd, мы построили и сравнили модель RF, основанную на комбинации VIss и FODcb, а также модели, основанные только на FODcb и VIss. Это исследование включало следующие четыре этапа. (1) Сбор данных: данные спектральной отражательной способности листьев риса и соответствующие значения SPAD собирались на 31, 46, 66 и 87 дни после пересадки риса. (2) Обработка данных: Алгоритм Кеннарда–Стоуна (KS) использовался для разделения набора данных на калибровочный и валидационный наборы. Было построено шестнадцать вегетационных индексов, обычно используемых для оценки содержания хлорофилла, а исходные спектральные данные были обработаны с помощью FOD. (3) Выбор признаков: Для выбора VIss и FODcb использовался алгоритм проекции с переменной важностью (VIP). (4) Моделирование и валидация: Три стратегии (на основе комбинации VIss с FODcb, а также только на основе FODcb и VIss) были использованы для построения моделей оценки значений SPAD, которые затем были валидированы с использованием внешних независимых выборок.
Рисунок 2. Блок-схема этого исследования.
2.3. Сбор данных
Гиперспектральные данные и данные SPAD флагового листа собирались с 14-дневными интервалами после пересадки материалов риса в каждом эксперименте. Однако из-за погодных условий, изменений в размере листьев и других факторов запланированный график сбора данных не мог строго соблюдаться. Корректировки вносились на основе фактического времени измерения. В результате данные собирались четыре раза, в частности на 31, 46, 66 и 87 дни после пересадки риса.
2.3.1. Измерение спектральной отражательной способности листьев
Пологовые гиперспектральные данные легко подвержены влиянию фона почвы и погодных условий, что затрудняет обеспечение точности данных. Однако гиперспектральные данные листьев можно измерять in vivo с помощью встроенного активного источника света прибора, что эффективно снижает помехи от внешней среды и повышает точность данных. По этой причине гиперспектральные данные флаговых листьев риса собирали на 31, 46, 66 и 87 дни после пересадки каждого материала с помощью полевого спектрометра FieldSpec4 (производитель Analytical Spectra Device, ASD, Боулдер, Колорадо, США). Прибор был оснащен активным источником света и портативным листовым спектральным щупом, что позволяло проводить прямое измерение in vivo на листе. Прибор имел диапазон длин волн 350–2500 нм с интервалом дискретизации 1,4 нм для 350–1000 нм и 1,1 нм для 1001–2500 нм, а также спектральное разрешение 3 нм @ 700 нм и 8 нм @ 1400 нм/2100 нм. Для каждого материала риса выбирали два флаговых листа с однородным ростом для листовой спектроскопии, выполняли 10 повторностей. Перед измерением каждого материала риса выполняли калибровку один раз с использованием стандартной белой пластины, входящей в комплект портативного листового спектрального щупа. После калибровки белую пластину заменяли черной пластиной для листовой спектрометрии.
2.3.2. Измерение значений SPAD листьев
Флаговый лист играет ключевую роль в фотосинтезе риса и широко признан основным источником ассимилятов, влияющих как на урожайность, так и на качество [39,40]. Таким образом, мониторинг флагового листа дает ценную информацию о состоянии роста растений риса. В этом исследовании для количественного определения значений SPAD флаговых листьев различных материалов риса, подвергшихся разному уровню загрязнения Cd, использовался измеритель содержания хлорофилла SPAD-502 (Konica Minolta, Токио, Япония). В частности, из каждого ряда экспериментального материала случайным образом выбирали два флаговых листа с относительно однородным ростом. Каждый выбранный лист делили на три четко выраженные части: верхушку, середину и основание. Затем регистрировали измерения SPAD для каждой из этих частей, следя за тем, чтобы адаксиальная сторона листа постоянно располагалась по направлению к эмиссионному окну измерителя SPAD-502, избегая при этом главных жилок. Среднее значение SPAD из трех частей вычисляли как репрезентативное значение для каждого листа. Общее значение SPAD для каждого экспериментального материала определяли как среднее показаний двух выбранных листьев. Чтобы уменьшить потенциальное влияние краевого эффекта, листья растений риса, расположенных на границах каждого ряда, исключали.
2.4. Обработка данных
2.4.1. Предварительная обработка спектров и разделение набора данных
В спектральном диапазоне 350–400 нм наблюдается значительный шум из-за квантовых и решеточных эффектов самого материала сенсора. Предыдущие исследования показали, что видимый спектр вместе с частью ближнего инфракрасного спектра (400–1000 нм) обычно используется для оценки различных параметров, связанных с ростом, развитием и питательным статусом риса [41,42,43,44]. Кроме того, ближний инфракрасный спектральный диапазон за пределами 1000 нм обычно используется для оценки параметров качества урожая, таких как содержание белка и крахмала [45,46,47]. Таким образом, для данного исследования был выбран спектральный диапазон от 400 до 1000 нм. Алгоритм KS [48,49] основан на вычислении евклидова расстояния, что гарантирует равномерное распределение образцов в обучающем наборе с точки зрения пространственного расстояния, делая разделение набора данных репрезентативным. Этот алгоритм является одним из наиболее часто используемых методов разделения набора выборок. В этом исследовании алгоритм KS использовался для разделения набора данных в соотношении 2:1. Результаты представлены в Таблице 1. Как показано в Таблице 1, значения SPAD калибровочного набора варьировались от 8,700 до 48,600, со средним значением и коэффициентом вариации 34,547 ± 9,724 и 28,1%, соответственно. Значения SPAD валидационного набора варьировались от 17,000 до 47,200, со средним значением и коэффициентом вариации 39,079 ± 6,253 и 16,0%, соответственно. Статистический анализ калибровочного и валидационного наборов показал, что значения SPAD валидационного набора находились в пределах диапазона калибровочного набора. Это указывает на то, что разделение калибровочного и валидационного наборов было разумным, и валидационные выборки можно было использовать для независимой валидации точности модели.
Таблица 1. Разделение набора выборок по значениям SPAD листьев.
2.4.2. Расчет вегетационных индексов
Вегетационные индексы представляют собой числовые показатели, которые отражают состояние растительности и рассчитываются на основе данных дистанционного зондирования. Эти индексы обычно используются для оценки и мониторинга различных аспектов растительности, включая рост, состояние здоровья и эффективность фотосинтеза. Основываясь на спектральных характеристиках содержания хлорофилла и результатах предыдущих исследований, для данного исследования было выбрано 16 часто используемых вегетационных индексов для оценки значений SPAD. Конкретные формулы расчета приведены в Таблице 2.
Таблица 2. Формулы расчета вегетационных индексов.
2.4.3. Преобразование FOD
Дробное дифференциальное исчисление (FOD) было впервые предложено Лопиталем в 1695 году. Оно изменяет наклон и кривизну спектральной кривой путем уточнения порядка [62], тем самым усиливая слабые различия в диагностических полосах между спектральными кривыми при различных дробных порядках. Это позволяет ему более эффективно выделять незначительные изменения в данных и общую информацию, чем дифференцирование целочисленного порядка. FOD применялось для усиления слабой информации при исследовании содержания Cd и свинца (Pb) в рисе [26] и др. В этом исследовании для расчета спектральной отражательной способности листьев риса в условиях стресса от Cd с использованием FOD применялся алгоритм Грюнвальда–Летникова (G-L), основанный на определении дифференцирования целочисленного порядка. Уравнение расчета выглядит следующим образом:
где n — разность между верхней и нижней производными, f(λ) — функция, где отражательная способность на длине волны λ является независимой переменной, Γ — гамма-функция, а v — порядок. Дробный порядок в этом исследовании варьировался от 0 до 2 порядков с шагом 0,2 порядка, всего 11 порядков.
2.5. Выбор признаков
Метод VIP, который является методом выбора переменных на основе частичной регрессии наименьших квадратов (PLSR), использовался для выбора VIss и FODcb. Основная идея метода VIP заключается в кумулятивном расчете важности каждой переменной j под влиянием компонента w. Это делается путем вычисления оценки VIP для каждой переменной в модели PLSR, что позволяет выбрать спектральные диапазоны [23]. Поскольку среднеквадратичное значение оценок VIP равно 1, VIP > 1 обычно используется в качестве критерия отбора. Оценки VIP могут быть рассчитаны на основе оптимальной модели PLSR с использованием следующей формулы [63]:
где SS(b_k t_k )=b_k^2 t_k^t t_k обозначает объясненную сумму квадратов K-го компонента, w — матрица весов, а h — количество латентных переменных в оптимальной модели PLSR.
2.6. Моделирование и валидация
2.6.1. Моделирование случайным лесом
Алгоритм RF — это метод ансамблевого обучения, основанный на деревьях решений, который использует метод бутстреп-агрегации (бэггинга) с выборкой с возвращением и вычисляет результаты множества прогнозов деревьев на основе принципа взвешенного усреднения [64,65]. Этот алгоритм предлагает преимущества, такие как универсальность, быстрое обучение, высокая эффективность и устойчивость к шуму [66,67], и широко используется в обратном моделировании физических и химических параметров сельскохозяйственных культур [68,69,70]. В этом исследовании регрессионная модель RF была создана с использованием дерева классификации и регрессии в качестве базовой единицы. В регрессионной модели RF выбранные VIss, FODcb и их комбинация, полученные с помощью метода VIP, использовались в качестве независимых переменных, в то время как значения SPAD использовались в качестве зависимой переменной. Входные параметры модели были оптимизированы с использованием байесовского поиска по сетке с целью минимизации среднеквадратичной ошибки (RMSE) выходных данных модели для получения оптимальных значений параметров. Оптимальные решения для трех категорий входных параметров модели представлены в Таблице 3. Процесс моделирования RF был реализован в среде Python 3.10.12.
Таблица 3. Оптимальные входные параметры случайного леса, соответствующие каждой модели.
2.6.2. Оценка точности модели
Точность модели оценивали, используя R², RMSE и относительное процентное отклонение (RPD) [71,72]. Надежная модель должна демонстрировать высокие значения R², низкие значения RMSE и высокие значения RPD. Когда R² ближе к 1, а RMSE меньше, это указывает на лучшее соответствие модели и более высокую точность прогнозирования. Когда RPD < 1,4, модель считается неспособной делать прогнозы; когда 1,4 ≤ RPD < 2, модель может давать приблизительные оценки; а когда RPD ≥ 2, модель считается обладающей превосходной прогностической способностью [73,74]. Формулы для R², RMSE и RPD следующие:
где y_i обозначает измеренное значение SPAD, y ̂_i — прогнозируемое значение SPAD, y ̅ — среднее значение SPAD, n — количество выборок, 〖Std〗_v — стандартная ошибка валидационного набора, а 〖RMSE〗_v — среднеквадратичная ошибка валидационного набора.
3. Результаты
3.1. Изменение значений SPAD при различных сценариях загрязнения Cd
Рисунок 3 показывает тенденции изменения значений SPAD листьев риса при различных сценариях загрязнения Cd на 31, 46, 66 и 87 дни после пересадки. Как показано на рисунке, общая тенденция значений SPAD листьев риса при различных сценариях загрязнения Cd была одинаковой к 87-му дню после пересадки: значения SPAD в целом снижались по мере прогрессирования репродуктивного процесса, за исключением растений в сценарии без загрязнения Cd, у которых наблюдалось восстановление значений SPAD на 66-й день. С точки зрения различных сценариев загрязнения Cd, на 31-й день после пересадки значения SPAD листьев в сценарии с загрязнением 1,4 мг/кг Cd были выше, чем в сценариях без загрязнения Cd и с загрязнением 1,0 мг/кг Cd. Это можно объяснить тем фактом, что на этой стадии рис находился в пиковом периоде вегетативного роста и обладал способностью к самовосстановлению из-за низкой концентрации загрязнения Cd. Однако противоположная тенденция в значениях SPAD наблюдалась на 66-й и 87-й дни после пересадки: порядок был следующим: без загрязнения Cd > загрязнение Cd. Это может быть связано с тем, что на поздней стадии роста риса рост листьев замедлился, а присутствие загрязнения Cd привело к ухудшению структуры хлоропластов, снижению активности хлорофиллазы и уменьшению синтеза фотосинтетических пигментов, что в конечном итоге привело к снижению значений SPAD. Более того, согласно анализу значимых различий, мы также обнаружили, что значения SPAD листьев в сценариях без загрязнения Cd и с загрязнением 1,4 мг/кг Cd были значительно различны на 31-й и 87-й дни после пересадки. Это открытие предоставляет теоретическую основу для использования значений SPAD для косвенного мониторинга стресса риса от Cd.
Рисунок 3. Изменение значений SPAD листьев риса во времени при различных сценариях загрязнения Cd (где одинаковые строчные буквы на рисунке указывают на отсутствие значимых различий между сценариями, а разные строчные буквы указывают на значимые различия между сценариями).
3.2. Диагностические полосы, указывающие на значения SPAD, и их изменения
Выбор спектральных диагностических полос для значений SPAD осуществлялся в соответствии с правилом, согласно которому оценки VIP должны быть больше 1. Результаты для спектральных диагностических полос листьев риса, загрязненного Cd, для разных порядков показаны в Таблице 4. Таблица 4 показывает, что количество диагностических полос варьировалось в зависимости от различных преобразований FOD. В целом, наблюдалась тенденция к первоначальному уменьшению, затем увеличению, а затем снова уменьшению количества диагностических полос по мере увеличения порядка. В частности, количество диагностических полос уменьшалось с увеличением порядка в диапазоне 0–1,0, немного увеличивалось с увеличением порядка в диапазоне 1,0–1,6, а затем снова уменьшалось. Кроме того, конкретное положение диагностических полос демонстрировало снижение непрерывности с увеличением дробного порядка. В частности, непрерывность была сильнее в положениях диагностических полос порядка 0–0,8, в то время как положения диагностических полос порядка 1,0–2,0 постепенно становились более рассеянными. Таким образом, диагностические полосы для значений SPAD листьев риса, загрязненного Cd, были примерно расположены в диапазоне длин волн 400–773 нм.
Таблица 4. Спектральные диагностические полосы значений SPAD листьев при различных дробных порядках.
Рисунок 4 показывает спектральную отражательную способность листьев риса после FOD при различных сценариях загрязнения Cd. Из исходной спектральной отражательной способности на Рисунке 4a можно наблюдать, что листья риса при загрязнении Cd демонстрировали спектральные характеристики, типичные для зеленых растений. В видимом диапазоне света из-за влияния пигментов хлорофилл сильно поглощает синий и красный свет, слабо поглощая зеленый свет, проявляя характерные для зеленых растений "синюю впадину", "красную впадину" и "зеленый пик". В ближнем инфракрасном диапазоне, с минимальным поглощением из-за влияния структуры клеток листа, отражательная способность увеличивается, образуя "ближнее инфракрасное плато". Кроме того, из-за совокупного эффекта "красной впадины" и "ближнего инфракрасного плато" спектр отражательной способности резко возрастает от диапазона красного света к ближнему инфракрасному диапазону, формируя характерную для зеленых растений "красную кайму". Анализируя спектральную отражательную способность при различных сценариях загрязнения Cd, были обнаружены различия в определенных диапазонах. В частности, в видимом спектре спектральная отражательная способность листьев, загрязненных Cd, была выше, чем у листьев риса без загрязнения Cd. В ближнем инфракрасном диапазоне спектральная отражательная способность листьев в сценарии с загрязнением 1,4 мг/кг Cd снижалась по сравнению со сценарием без загрязнения Cd, в то время как противоположная тенденция наблюдалась в сценарии с загрязнением 1,0 мг/кг Cd. Рисунок 4b–k показывают результаты обработки исходных спектров с помощью FOD. Спектральная отражательная способность уменьшалась с увеличением порядка и постепенно сходилась к нулю. Изменения спектральной отражательной способности листьев риса, загрязненного Cd, указывают на то, что листья риса проявляют спектральный отклик на стресс от Cd, что закладывает теоретическую основу для дистанционного мониторинга риса, загрязненного Cd.
Рисунок 4. Спектральная отражательная способность листьев при различных сценариях загрязнения Cd в условиях FOD (где (a–k) обозначают дифференциальные преобразования нулевого порядка, порядка 0,2, порядка 0,4, порядка 0,6, порядка 0,8, порядка 1,0, порядка 1,2, порядка 1,4, порядка 1,6, порядка 1,8 и порядка 2,0 соответственно).
3.3. Точность оценки значений SPAD с помощью модели VIss + FODcb
Анализ чувствительности 16 вегетационных индексов с использованием алгоритма VIP идентифицировал всего 8 чувствительных вегетационных индексов: HCSI, SIPI, NDRE, NDVI, SRI, mND705, CCRI и NPCI. Эти восемь индексов и FODcb использовались в качестве независимых переменных, в то время как значения SPAD листьев риса использовались в качестве зависимой переменной, для создания оценочной модели RF. Чтобы оценить производительность модели, комбинированная модель VIss + FODcb сравнивалась с моделями, построенными с использованием только FODcb и VIss. Результаты показаны на Рисунке 5. Как показано на Рисунке 5, общая точность трех моделей снижалась в следующем порядке: VIss + FODcb-RF > FODcb-RF > VIss-RF. Комбинированная модель VIss + FOD1.2cb была наиболее эффективной для оценки значений SPAD листьев, с R²c и RMSEc для калибровочного набора 0,977 и 1,460 и значениями R²v, RMSEv и RPDv для валидационного набора 0,821, 2,621 и 2,296 соответственно. По сравнению с оптимальной моделью (FOD1.2cb-RF), построенной только с использованием FODcb, модель VIss + FOD1.2cb-RF показала улучшение R²c на 4,380%, снижение RMSEc на 40,481%, увеличение RPDv на 1,593% и снижение RMSEv на 2,782%. По сравнению с моделью VIss-RF, модель VIss + FOD1.2cb-RF показала улучшение R²c на 31,141%, снижение RMSEc на 70,082%, увеличение R²v на 10,647%, увеличение RPDv на 44,221% и снижение RMSEv на 16,555%. С точки зрения точности оценки значений SPAD листьев, комбинированная модель VIss + FODcb продемонстрировала заметное улучшение по сравнению с моделями, использующими только FODcb или VIss. Эффект улучшения по сравнению с моделью, основанной исключительно на VIss, был более выраженным, чем по сравнению с моделью, основанной исключительно на FODcb.
Рисунок 5. Сравнение точности моделирования: (a, b) представляют калибровочный набор и валидационный набор модели VIss + FODcb-RF соответственно; (c, d) представляют калибровочный набор и валидационный набор модели FODcb-RF соответственно; и (e) представляет результаты модели VIss-RF.
Прогнозируемые и наблюдаемые значения оптимальной модели на основе комбинации VIss и FODcb, только FODcb и только VIss были подвергнуты линейной подгонке, и результаты показаны на Рисунке 6. Линия регрессии, более близкая к линии 1:1, указывает на лучшее качество модели. Рисунок 6a–c показывают, что наклоны трех моделей составляли 0,93, 0,90 и 0,68 соответственно. Наклон модели VIss + FOD1.2cb-RF был ближе всего к 1, что указывает на то, что эта модель имела наилучшую производительность для значений SPAD листьев при загрязнении Cd. Однако стоит отметить, что модель, основанная только на VIss, имела R²v валидационного набора больше 0,7 и RPDv больше 1,5, что позволяло проводить приблизительную оценку значений SPAD листьев. Тем не менее, как показано на Рисунке 6c, можно наблюдать, что модель VIss-RF предсказывала большое количество точек данных с одинаковым значением, и большинство точек данных были распределены за пределами 95% доверительного интервала. Это дополнительно подтверждает, что трудно достичь эффективной оценки значений SPAD листьев с помощью модели, построенной из вегетационных индексов, которые содержат ограниченную информацию о спектральных диапазонах.
Рисунок 6. Результаты регрессии прогнозируемых и наблюдаемых значений SPAD на основе оптимальных моделей: (a) VIss + FOD1.2cb-RF, (b) FOD1.2cb-RF и (c) VIss-RF.
3.4. Важность переменных в модели VIss + FODcb
Чтобы дополнительно объяснить, почему эффективность моделирования комбинированной модели VIss + FODcb была лучше, чем у отдельных моделей FODcb и VIss, был проанализирована важность переменных в модели VIss + FODcb-RF. Таблица 5 показывает независимые переменные с 10 лучшими коэффициентами Джини в модели VIss + FODcb-RF. Как показано в Таблице 5, как VIss, так и FODcb играли важную роль в комбинированной модели. До порядка 0,6 комбинированная модель полагалась в основном на VIss для моделирования, и только три диагностические полосы значительно влияли на модель. После порядка 0,8 количество важных диагностических полос в комбинированной модели увеличилось, при этом оптимальная модель VIss + FOD1.2cb-RF имела наибольшее количество важных диагностических полос. Всего было идентифицировано семь важных диапазонов, которые были примерно распределены вокруг диапазонов 520 нм, 680 нм и 700 нм. Среди них 521 нм и 686 нм были двумя лучшими независимыми переменными в комбинированной модели VIss + FOD1.2cb. Этот результат согласуется с выводами Лю и др. [75], которые идентифицировали 518 нм и 686 нм как ключевые характеристики для оценки пологовых значений SPAD риса на разных стадиях роста. По сравнению с другими комбинированными моделями, наибольший коэффициент Джини в оптимальной модели VIss + FOD1.2cb-RF соответствовал спектральной диагностической полосе, а не VIss. Это свидетельствует о том, что спектральные диагностические полосы были более важны, чем вегетационные индексы в комбинированной модели. Это дополнительно подтверждает, что вегетационные индексы, содержащие ограниченную спектральную информацию, имеют более низкую точность для оценки значений SPAD и что следует рассматривать более широкий набор спектральных диагностических полос.
Таблица 5. 10 лучших независимых переменных по коэффициенту Джини в комбинированной модели.
4. Обсуждение
4.1. Изменения спектральной отражательной способности листьев риса при различных сценариях
В этом исследовании мы первоначально исследовали изменения спектральной отражательной способности листьев риса при трех различных сценариях загрязнения Cd и обнаружили, что на видимых длинах волн, особенно между "зелеными пиками" и "красными впадинами", отражательная способность в сценариях с загрязнением Cd была выше, чем в сценарии без загрязнения Cd. Это открытие согласуется с исследованием Чи и др., которое показало, что Cd, накапливающийся в листе, приводит к снижению концентрации хлорофилла, тем самым увеличивая отражательную способность в видимом спектре [19]. Кроме того, это исследование показало, что спектральная отражательная способность не демонстрировала четкой картины изменений в ближнем инфракрасном диапазоне. Этот результат отличается от результатов Чи и др. [19], которые предположили, что спектральная отражательная способность снижалась с увеличением концентрации Cd в этом диапазоне длин волн из-за уменьшения толщины листа. Это может быть связано с тем, что градиент концентрации Cd, использованный в этом исследовании, не был значительно различным, и концентрация обработки больше соответствовала реальным загрязненным Cd сельскохозяйственным угодьям. Кроме того, в этом исследовании использовалось 12 линий риса с низким накоплением Cd, полученных в результате радиационного мутагенеза, и тестируемый материал мог проявлять некоторую толерантность к Cd. Это затрудняло наблюдение четкой картины изменения спектральной отражательной способности в зависимости от обработки Cd. Чтобы лучше понять влияние стресса от Cd на спектры отражательной способности листьев риса, будущие эксперименты должны усовершенствовать агрономическую постановку, включив более широкий диапазон уровней обработки Cd и разнообразные сорта риса (с низким накоплением Cd, с высоким накоплением Cd и обычные сорта). Более того, при сборе спектральных данных одновременно собирались образцы листьев для анализа с помощью сканирующей электронной микроскопии в лаборатории, чтобы исследовать основной механизм спектрального отклика на загрязнение Cd на микроскопическом уровне.
4.2. Спектральные диагностические полосы значений SPAD листьев
В этом исследовании для выбора спектральных диагностических полос для прогнозирования значений SPAD листьев применялся метод VIP. Как показано в Разделе 3.2, где диагностические полосы, соответствующие значениям SPAD листьев, были извлечены при различных преобразованиях FOD, диапазон длин волн 400–773 нм стабильно идентифицировался для большинства дробных порядков. Поэтому мы заключили, что диапазон длин волн 400–773 нм в видимом спектре был чувствительной областью для спектральной оценки значений SPAD листьев при загрязнении Cd. Это в первую очередь связано с тем, что отражательная способность в видимом спектре определяется пигментами листа, тогда как отражательная способность в ближней инфракрасной области в большей степени зависит от структурных характеристик клеток листа. По мере накопления концентрации Cd в листьях, что приводит к снижению содержания хлорофилла, отражательная способность в видимом диапазоне увеличивается, в то время как отражательная способность в ближнем инфракрасном диапазоне уменьшается [19]. Следовательно, колебания концентрации Cd приводят к изменениям содержания хлорофилла, которые, в свою очередь, влияют на отклик спектральной отражательной способности в диапазоне от видимого до ближнего инфракрасного спектра. Это наблюдение дополнительно подтверждает мнение, что диапазон длин волн 400–773 нм служит диагностической полосой для оценки значений SPAD в листьях риса, загрязненного Cd. Кроме того, этот вывод согласуется с заключением Лю и др., которые продемонстрировали, что спектральные индексы, полученные из отражательной способности на 550, 670, 700, 712 и 800 нм, могут использоваться для оценки содержания хлорофилла в рисе в условиях загрязнения тяжелыми металлами Cu и Cd [76]. Хотя методы VIP часто используются для выбора диагностических полос для агрономических параметров [77,78,79] и химических свойств почвы [23,80,81,82], существуют различия в диагностических полосах, получаемых с помощью различных методов выбора признаков. Такие методы, как корреляционный анализ (CA), конкурентный адаптивный перевзвешенный отбор проб (CARS), алгоритм последовательных проекций (SPA) и удаление неинформативных переменных (UVE), также применялись при выборе признаков [83,84,85]. В этом исследовании был протестирован только один часто используемый метод выбора признаков. Влияние различных методов выбора признаков на стабильность спектральных диагностических полос требует дальнейшего изучения.
4.3. Повышение эффективности за счет комбинированной модели
В этой статье мы обнаружили, что модель RF, построенная с использованием комбинации VIss и FOD1.2cb, имела наилучшую точность оценки значений SPAD. Точность оценки значений SPAD ранжировалась следующим образом: VIss + FODcb-RF > FODcb-RF > VIss-RF. Этот результат согласуется с выводами Фэна и др. [86], которые сообщили, что модель, использующая диагностические полосы в качестве входных данных, превосходит модель, использующую вегетационные индексы, для инверсии содержания азота в листьях японики, и Сюй и др. [87], которые обнаружили, что модель, объединяющая вегетационные индексы и текстурные признаки, была более точной, чем модель только с вегетационными индексами, для оценки надземной биомассы риса. Анализируя важность переменных моделирования в комбинированной модели, мы обнаружили, что как VIss, так и FODcb играли ключевую роль в процессе моделирования RF (коэффициенты Джини входят в 10 лучших). Это дополнительно подтвердило, что объединение вегетационных индексов со спектральными диагностическими полосами может повысить точность модели. Это улучшение, вероятно, связано с тем, что вегетационные индексы, полученные в результате математических операций над определенными спектральными диапазонами, в некоторой степени отражают изменения физиологических и биохимических свойств сельскохозяйственных культур. Напротив, преобразования FOD усиливают спектральные детали в условиях стресса от тяжелых металлов, и выбранные диагностические полосы содержат больше спектральной информации, коррелирующей со значениями SPAD листьев. Следовательно, комбинированная модель учитывает как широкие спектральные характеристики, на которые указывают VI, так и детальные особенности, выявленные с помощью FODcb. Интеграция этих двух аспектов помогает оптимизировать выбор признаков, исключить избыточную информацию и, в конечном итоге, повысить точность оценочной модели. Однако в этом исследовании использовалась только модель RF для сравнения производительности оценки трех типов независимых переменных для значений SPAD листьев, без изучения того, как сами модели влияют на точность оценки. В будущей работе было бы полезно провести сравнительное исследование линейных моделей и моделей машинного обучения.
4.4. Ограничения и программы исследований
Значения SPAD листьев являются ключевыми индикаторами для оценки состояния здоровья сельскохозяйственных культур и степени воздействия стресса окружающей среды. В этой статье предлагается новый метод оценки значений SPAD листьев, который объединяет VIss и FODcb. Этот метод не только повысил точность оценки значений SPAD листьев, но и позволил осуществлять дистанционный мониторинг эффекта стресса от Cd на рис. В заключение, модель оценки SPAD, предложенная в этом исследовании, была основана на данных, полученных в ходе контролируемого эксперимента с кадмиевыми бассейнами. Сосредоточившись на единственном влияющем факторе и эффективно смягчив воздействие других переменных на рост риса, модель продемонстрировала улучшенную точность и стабильность. Однако в реальных сельскохозяйственных полях часто наблюдается сосуществование множества стрессов, таких как тяжелые металлы, болезни, насекомые-вредители и засуха, что может вызывать спектральные помехи. Поэтому ключевым направлением будущих исследований при применении этой модели в сельскохозяйственной практике является разработка метода устранения влияния других факторов и точной идентификации сигналов стресса от Cd. Кроме того, это исследование достигло только наземной оценки значений SPAD листьев, и для точного крупномасштабного мониторинга требуются дальнейшие исследования. Интеграция мультиспектральных изображений дистанционного зондирования [48], построение корреляционных преобразований спутник-земля [49] и введение факторов окружающей среды могут предоставить многообещающие прорывы для крупномасштабного и точного мониторинга эффектов стресса от Cd на рис.
5. Выводы
По сравнению с обычно используемыми вегетационными экспериментами, это исследование инновационно спроектировало контролируемый эксперимент с кадмиевыми бассейнами, который в большей степени соответствовал реальной среде выращивания риса. На основе этого эксперимента был получен набор значений SPAD листьев и полных спектров отражательной способности в условиях загрязнения Cd, охватывающий весь период вегетации риса. Кроме того, с помощью методов FOD и VIP, это исследование точно идентифицировало диагностические полосы значений SPAD листьев из полной спектральной информации отражательной способности, что решило проблему потери спектральной информации, которая имела место в прошлом при использовании исключительно вегетационных индексов. Кроме того, это исследование предложило новую модель, объединяющую VIss и FODcb, повышающую точность оценки на 10,65%, достигая более 82% по сравнению с традиционной моделью, основанной исключительно на вегетационных индексах. Это указывает на то, что новая модель имеет значительный потенциал для широкого применения. В заключение, это исследование обеспечивает методологическую поддержку для крупномасштабного применения гиперспектрального дистанционного зондирования в исследованиях стресса риса от Cd и других неблагоприятных физиологических состояний.
Ссылки
1. Chen, G.; Du, R.Y.; Wang, X. Genetic Regulation Mechanism of Cadmium Accumulation and Its Utilization in Rice Breeding. Int. J. Mol. Sci. 2023, 24, 1247. [Google Scholar] [CrossRef] [PubMed]
2. Imran, M.; Hussain, S.; He, L.X.; Ashraf, M.F.; Ihtisham, M.; Warraich, E.A.; Tang, X.R. Molybdenum-Induced Regulation of Antioxidant Defense-Mitigated Cadmium Stress in Aromatic Rice and Improved Crop Growth, Yield, and Quality Traits. Antioxidants 2021, 10, 838. [Google Scholar] [CrossRef] [PubMed]
3. Chen, J.G.; Zou, W.L.; Meng, L.J.; Fan, X.R.; Xu, G.H.; Ye, G.Y. Advances in the Uptake and Transport Mechanisms and QTLs Mapping of Cadmium in Rice. Int. J. Mol. Sci. 2019, 20, 3417. [Google Scholar] [CrossRef] [PubMed]
4. Sonobe, R.; Sugimoto, Y.; Kondo, R.; Seki, H.; Sugiyama, E.; Kiriiwa, Y.; Suzuki, K. Hyperspectral Wavelength Selection for Estimating Chlorophyll Content of Muskmelon Leaves. Eur. J. Remote Sens. 2021, 54, 512–523. [Google Scholar] [CrossRef]
5. Huang, X.; Guan, H.D.; Bo, L.Y.; Xu, Z.Q.; Mao, X.M. Hyperspectral Proximal Sensing of Leaf Chlorophyll Content of Spring Maize Based on A Hybrid of Physically Based Modelling and Ensemble Stacking. Comput. Electron. Agric. 2023, 208, 107745. [Google Scholar] [CrossRef]
6. Sun, J.H.; Yang, L.; Yang, X.T.; Wei, J.; Li, L.T.; Guo, E.H.; Kong, Y.H. Using Spectral Reflectance to Estimate the Leaf Chlorophyll Content of Maize Inoculated With Arbuscular Mycorrhizal Fungi Under Water Stress. Front. Plant Sci. 2021, 12, 646173. [Google Scholar] [CrossRef]
7. Guan, L.; Liu, X.N.; Cheng, C.Q. Research on Hyperspectral Information Parameters of Chlorophyll Content of Rice Leaf in Cd-Polluted Soil Environment. Spectrosc. Spectr. Anal. 2009, 29, 2713–2716. [Google Scholar] [CrossRef]
8. Wu, C.Y.; Liu, M.L.; Liu, X.N.; Wang, T.J.; Wang, L.Y. Developing a new spectral index for detecting cadmium-induced stress in rice on a regional scale. Int. J. Environ. Res. Public Health 2019, 16, 4811. [Google Scholar] [CrossRef]
9. Azia, F.; Stewart, K.A. Relationships Between Extractable Chlorophyll and SPAD Values in Muskmelon Leaves. J. Plant Nutr. 2001, 24, 961–966. [Google Scholar] [CrossRef]
10. Wakiyama, Y. The Relationship between SPAD Values and Leaf Blade Chlorophyll Content throughout the Rice Development Cycle. JARQ Jpn. Agric. Res. Q. 2016, 50, 329–334. [Google Scholar] [CrossRef]
11. Kumar, P.; Sharma, R.K. Development of SPAD Value-Based Linear Models for Non-destructive Estimation of Photosynthetic Pigments in Wheat (Triticum aestivum L.). Indian J. Genet. Plant Breed. 2019, 79, 96–99. [Google Scholar] [CrossRef]
12. Yang, Y.C.; Nan, R.; Mi, T.X.; Song, Y.X.; Shi, F.H.; Liu, X.R.; Wang, Y.Q.; Sun, F.L.; Xi, Y.J.; Zhang, C. Rapid and Nondestructive Evaluation of Wheat Chlorophyll under Drought Stress Using Hyperspectral Imaging. Int. J. Mol. Sci. 2023, 24, 5825. [Google Scholar] [CrossRef] [PubMed]
13. El-Hendawy, S.; Dewir, Y.H.; Elsayed, S.; Schmidhalter, U.; Al-Gaadi, K.; Tola, E.; Refay, Y.; Tahir, M.U.; Hassan, W.M. Combining Hyperspectral Reflectance Indices and Multivariate Analysis to Estimate Different Units of Chlorophyll Content of Spring Wheat under Salinity Conditions. Plants 2022, 11, 456. [Google Scholar] [CrossRef] [PubMed]
14. Yao, Z.F.; Lei, Y.; He, D.J. Early visual detection of wheat stripe rust using visible/near-infrared hyperspectral imaging. Sensors 2019, 19, 952. [Google Scholar] [CrossRef]
15. Wang, H.F.; Huo, Z.G.; Zhou, G.S.; Liao, Q.H.; Feng, H.K.; Wu, L. Estimating Leaf SPAD Values of Freeze-damaged Winter Wheat using Continuous Wavelet Analysis. Plant Physiol. Biochem. 2016, 98, 39–45. [Google Scholar] [CrossRef]
16. Yuan, X.T.; Zhang, X.; Zhang, N.N.; Ma, R.; He, D.D.; Bao, H.; Sun, W.J. Hyperspectral Estimation of SPAD Value of Cotton Leaves under Verticillium Wilt Stress Based on GWO—ELM. Agriculture 2023, 13, 1779. [Google Scholar] [CrossRef]
17. Cao, Y.F.; Xu, H.L.; Song, J.; Yang, Y.; Hu, X.H.; Wiyao, K.T.; Zhai, Z.Y. Applying Spectral Fractal Dimension Index to Predict the SPAD Value of Rice Leaves under Bacterial Blight Disease Stress. Plant Methods. 2022, 18, 67. [Google Scholar] [CrossRef]
18. Priya, S.; Ghosh, R. Monitoring Effects of Heavy Metal Stress on Biochemical and Spectral Parameters of Cotton using Hyperspectral Reflectance. Environ. Monit. Assess. 2023, 195, 112. [Google Scholar] [CrossRef] [PubMed]
19. Chi, G.Y.; Huang, B.; Chen, X.; Shi, Y.; Zheng, T.H. Effects of Cadmium on Visible and Near-infrared Reflectance Spectra of Rice (Oryza sativa L.). Fresenius Environ. Bull. 2011, 20, 391–397. [Google Scholar]
20. Zhang, J.H.; Zeng, L.S.; Sun, Y.H.; Song, C.Y.; Wang, H.; Chen, J.M.; Biradar, C. A pilot study on the effect of Cu, Zn, and Cd on the spectral curves and chlorophyll of wheat canopy at tiller stage. Toxicol. Environ. Chem. 2015, 97, 454–463. [Google Scholar] [CrossRef]
21. Li, Y.X.; Chen, X.Y.; Luo, D.; Li, B.Y.; Wang, S.R.; Zhang, L.W. Effects of Cuprum Stress on Position of Red Edge of Maize Leaf Reflection Hyperspectra and Relations to Chlorophyll Content. Spectrosc. Spectr. Anal. 2018, 38, 546–551. [Google Scholar]
22. Zhou, L.; Zhou, L.J.Y.; Wu, H.B.; Kong, L.J.; Li, J.S.; Qiao, J.L.; Chen, L.M. Analysis of Cadmium Contamination in Lettuce (Lactuca sativa L.) Using Visible-Near Infrared Reflectance Spectroscopy. Sensors 2023, 23, 9562. [Google Scholar] [CrossRef] [PubMed]
23. Tu, Y.L.; Zou, B.; Feng, H.H.; Zhou, M.; Yang, Z.H.; Xiong, Y. A Near Standard Soil Samples Spectra Enhanced Modeling Strategy for Cd Concentration Prediction. Remote Sens. 2021, 13, 2657. [Google Scholar] [CrossRef]
24. Zou, B.; Jiang, X.L.; Feng, H.H.; Tu, Y.L.; Tao, C. Multisource spectral-integrated estimation of cadmium concentrations in soil using a direct standardization and Spiking algorithm. Sci. Total Environ. 2020, 701, 134890. [Google Scholar] [CrossRef] [PubMed]
25. Wang, Y.L.; Zou, B.; Chai, L.Y.; Lin, Z.; Feng, H.H.; Tang, Y.Q.; Tian, R.C.; Tu, Y.L.; Zhang, B.; Zou, H.J. Monitoring of soil heavy metals based on hyperspectral remote sensing: A review. Earth-Sci. Rev. 2024, 254, 104814. [Google Scholar] [CrossRef]
26. Zhang, S.; Fei, T.; Chen, Y.; Hong, Y. Estimating Cadmium-lead Concentrations in Rice Blades through Fractional Order Derivatives of Foliar Spectra. Biosyst. Eng. 2022, 219, 177–188. [Google Scholar] [CrossRef]
27. Wang, X.P.; Zhang, F.; Kung, H.T.; Johnson, V.C. New Methods for Improving the Remote Sensing Estimation of Soil Organic Matter Content (SOMC) in the Ebinur Lake Wetland National Nature Reserve (ELWNNR) in Northwest China. Remote Sens. Environ. 2018, 218, 104–118. [Google Scholar] [CrossRef]
28. Geng, J.; Lv, J.; Pei, J.; Liao, C.; Tan, Q.; Wang, T.; Fang, H.; Wang, L. Prediction of Soil Organic Carbon in Black Soil Based on A Synergistic Scheme from Hyperspectral Data: Combining fractional-order derivatives and three-dimensional spectral indices. Comput. Electron. Agric. 2024, 220, 108905. [Google Scholar] [CrossRef]
29. Hong, Y.; Guo, L.; Chen, S.; Linderman, M.; Mouazen, A.M.; Yu, L.; Chen, Y.; Liu, Y.; Liu, Y.; Cheng, H.; et al. Exploring the Potential of Airborne Hyperspectral Image for Estimating Topsoil Organic Carbon: Effects of Fractional-order Derivative and Optimal Band Combination Algorithm. Geoderma 2020, 365, 114228. [Google Scholar] [CrossRef]
30. Jin, H.; Peng, J.; Bi, R.; Tian, H.; Zhu, H.; Ding, H. Comparing Laboratory and Satellite Hyperspectral Predictions of Soil Organic Carbon in Farmland. Agronomy 2024, 14, 175. [Google Scholar] [CrossRef]
31. Meng, X.; Bao, Y.; Ye, Q.; Liu, H.; Zhang, X.; Tang, H.; Zhang, X. Soil Organic Matter Prediction Model with Satellite Hyperspectral Image Based on Optimized Denoising Method. Remote Sens. 2021, 13, 2273. [Google Scholar] [CrossRef]
32. Chen, L.; Lai, J.; Tan, K.; Wang, X.; Chen, Y.; Ding, J. Development of A Soil Heavy Metal Estimation Method Based on A Spectral Index: Combining Fractional-order Derivative Pretreatment and the Absorption Mechanism. Sci. Total Environ. 2022, 813, 151882. [Google Scholar] [CrossRef] [PubMed]
33. Cui, S.; Zhou, K.; Ding, R.; Cheng, Y.; Jiang, G. Estimation of Soil Copper Content Based on Fractional-order Derivative Spectroscopy and Spectral Characteristic Band Selection. Spectroc. Acta Part A Mol. Biomol. Spectrosc. 2022, 275, 121190. [Google Scholar] [CrossRef] [PubMed]
34. Wang, Z.; Zhang, X.L.; Zhang, F.; Chan, N.W.; Kung, H.T.; Liu, S.H.; Deng, L.F. Estimation of Soil Salt Content using Machine Learning Techniques Based on Remote-sensing Fractional Derivatives, A Case Study in the Ebinur Lake Wetland National Nature Reserve, Northwest China. Ecol. Indic. 2020, 119, 106869. [Google Scholar] [CrossRef]
35. Fu, C.; Tian, A.; Zhu, D.; Zhao, J.; Xiong, H. Estimation of Salinity Content in Different Saline-Alkali Zones Based on Machine Learning Model Using FOD Pretreatment Method. Remote Sens. 2021, 13, 5140. [Google Scholar] [CrossRef]
36. Zhang, D.; Tiyip, T.; Ding, J.; Zhang, F.; Nurmemet, I.; Kelimu, A.; Wang, J. Quantitative Estimating Salt Content of Saline Soil Using Laboratory Hyperspectral Data Treated by Fractional Derivative. J. Spectrosc. 2016, 2016, 1081674. [Google Scholar] [CrossRef]
37. Ning, J.; Zou, B.; Tu, Y.L.; Zhang, X.; Wang, Y.L.; Tian, R.C. Evaluation of Soil As Concentration Estimation Method Based on Spectral Indices. Spectrosc. Spectr. Anal. 2024, 44, 1472–1481. [Google Scholar]
38. Soil environmental quality Risk control standard for soil contamination of agricultural land. GB15618-2018; Ministry of Ecology and Environment: Beijing, China, 2018.
39. Zhang, B.; Ye, W.J.; Ren, D.Y.; Tian, P.; Peng, Y.L.; Gao, Y.; Ruan, B.P.; Wang, L.; Zhang, G.H.; Guo, L.B.; et al. Genetic Analysis of Flag Leaf Size and Candidate Genes Determination of A Major QTL for Flag Leaf Width in Rice. Rice 2015, 8, 2. [Google Scholar] [CrossRef] [PubMed]
40. Hu, C.Y.; Rao, J.; Song, Y.; Chan, S.A.; Tohge, T.; Cui, B.; Lin, H.; Fernie, A.R.; Zhang, D.B.; Shi, J.X. Dissection of Flag Leaf Metabolic Shifts and their Relationship with those Occurring Simultaneously in Developing Seed by Application of Non-targeted Metabolomics. PLoS ONE 2020, 15, e0227577. [Google Scholar] [CrossRef] [PubMed]
41. Wang, L.; Chen, S.S.; Peng, Z.P.; Huang, J.C.; Wang, C.Y.; Jiang, H.; Zheng, Q.; Li, D. Phenology Effects on Physically Based Estimation of Paddy Rice Canopy Traits from UAV Hyperspectral Imagery. Remote Sens. 2021, 13, 1792. [Google Scholar] [CrossRef]
42. Feng, H.; Chen, G.X.; Xiong, L.Z.; Liu, Q.; Yang, W.N. Accurate Digitization of the Chlorophyll Distribution of Individual Rice Leaves using Hyperspectral Imaging and An Integrated Image Analysis Pipeline. Front. Plant Sci. 2017, 8, 1238. [Google Scholar] [CrossRef] [PubMed]
43. Yue, J.B.; Wang, J.; Zhang, Z.Y.; Li, C.C.; Yang, H.; Feng, H.K.; Guo, W. Estimating Crop Leaf Area Index and Chlorophyll Content using A Deep Learning-based Hyperspectral Analysis Method. Comput. Electron. Agric. 2024, 227, 109653. [Google Scholar] [CrossRef]
44. Wen, S.Y.; Shi, N.; Lu, J.W.; Gao, Q.W.; Hu, W.R.; Cao, Z.D.; Lu, J.X.; Yang, H.B.; Gao, Z.Q. Continuous Wavelet Transform and Back Propagation Neural Network for Condition Monitoring Chlorophyll Fluorescence Parameters Fv/Fm of Rice Leaves. Agriculture 2022, 12, 1197. [Google Scholar] [CrossRef]
45. Zhang, J.; Guo, Z.; Ren, Z.S.; Wang, S.H.; Yue, M.H.; Zhang, S.S.; Yin, X.; Gong, K.J.; Ma, C.Y. Rapid Determination of Protein, Starch and Moisture Content in Wheat Flour by Near-Infrared Hyperspectral Imaging. J. Food Compos. Anal. 2023, 117, 105134. [Google Scholar] [CrossRef]
46. Caporaso, N.; Whitworth, M.B.; Fisk, I.D. Near-Infrared Spectroscopy and Hyperspectral Imaging for Non-Destructive Quality Assessment of Cereal Grains. Appl. Spectrosc. Rev. 2018, 53, 667–687. [Google Scholar] [CrossRef]
47. Aulia, R.; Kim, Y.; Amanah, H.Z.; Andi, A.M.A.; Kim, H.; Kim, H.; Lee, W.H.; Kim, K.H.; Baek, J.H.; Cho, B.K. Non-Destructive Prediction of Protein Contents of Soybean Seeds using Near-Infrared Hyperspectral Imaging. Infrared Phys. Technol. 2022, 127, 104365. [Google Scholar] [CrossRef]
48. He, Z.H.; Ma, Z.H.; Li, M.C.; Zhou, Y. Selection of A Calibration Sample Subset by A Semi-supervised Method. J. Near Infrared Spectrosc. 2018, 26, 87–94. [Google Scholar] [CrossRef]
49. Li, H.; Wang, J.X.; Xing, Z.N.; Shen, G. Influence of Improved Kennard/Stone Algorithm on the Calibration Transfer in Near-Infrared Spectroscopy. Spectrosc. Spectr. Anal. 2011, 31, 362–365. [Google Scholar] [CrossRef]
50. Zhou, X.; Huang, W.; Zhang, J.; Kong, W.; Casa, R.; Huang, Y. A Novel Combined Spectral Index for Estimating the Ratio of Carotenoid to Chlorophyll Content to Monitor Crop Physiological and Phenological Status. Int. J. Appl. Earth Obs. Geoinf. 2019, 76, 128–142. [Google Scholar] [CrossRef]
51. Aparicio, N.; Villegas, D.; Royo, C.; Casadesus, J.; Araus, J.L. Effect of Sensor View Angle on the Assessment of Agronomic Traits by Ground Level Hyper-spectral Reflectance Measurements in Durum Wheat under Contrasting Mediterranean Conditions. Int. J. Remote Sens. 2004, 25, 1131–1152. [Google Scholar] [CrossRef]
52. Sims, D.A.; Gamon, J. A Relationships between Leaf Pigment Content and Spectral Reflectance Across a Wide Range of Species, Leaf Structures and Developmental Stages. Remote Sens. Environ. 2002, 81, 337–354. [Google Scholar] [CrossRef]
53. Liu, N.; Townsend, P.A.; Naber, M.R.; Bethke, P.C.; Hills, W.B.; Wang, Y. Hyperspectral Imagery to Monitor Crop Nutrient Status Within and Across Growing Seasons. Remote Sens. Environ. 2021, 255, 112303. [Google Scholar] [CrossRef]
54. Peñuelas, J.; Gamon, J.; Fredeen, A.; Merino, J.; Field, C. Reflectance Indices Associated with Physiological Changes in Nitrogen and Water-limited Sunflower Leaves. Remote Sens. Environ. 1994, 48, 135–146. [Google Scholar] [CrossRef]
55. Barnes, J.D.; Balaguer, L.; Manrique, E.; Elvira, S.; Davison, A. A Reappraisal of the Use of DMSO for the Extraction and Determination of Chlorophylls A and B in Lichens and Higher Plants. Environ. Exp. Bot. 1992, 32, 85–100. [Google Scholar] [CrossRef]
56. Penuelas, J.; Baret, F.; Filella, I. Semi-empirical Indices to Assess Carotenoids/Chlorophyll A Ratio from Leaf Spectral Reflectance. Photosynthetica 1995, 31, 221–230. [Google Scholar]
57. Daughtry, C.S.; Walthall, C.; Kim, M.; De Colstoun, E.B.; McMurtrey Iii, J. Estimating Corn Leaf Chlorophyll Concentration from Leaf and Canopy Reflectance. Remote Sens. Environ. 2000, 74, 229–239. [Google Scholar] [CrossRef]
58. Haboudane, D.; Miller, J.R.; Tremblay, N.; Zarco-Tejada, P.J.; Dextraze, L. Integrated Narrow-band Vegetation Indices for Prediction of Crop Chlorophyll Content for Application to Precision Agriculture. Remote Sens. Environ. 2002, 81, 416–426. [Google Scholar] [CrossRef]
59. Li, X.Q.; Liu, X.N.; Liu, M.L.; Wang, C.C.; Xia, X.P. A hyperspectral index sensitive to subtle changes in the canopy chlorophyll content under arsenic stress. Int. J. Appl. Earth Obs. Geoinf. 2015, 36, 41–53. [Google Scholar] [CrossRef]
60. Gitelson, A.A.; Gritz, Y.; Merzlyak, M.N. Relationships between Leaf Chlorophyll Content and Spectral Reflectance and Algorithms for Non-destructive Chlorophyll Assessment in Higher Plant Leaves. J. Plant Physiol. 2003, 160, 271–282. [Google Scholar] [CrossRef]
61. Barnes, E.; Clarke, T.; Richards, S.; Colaizzi, P.; Haberland, J.; Kostrzewski, M.; Waller, P.; Choi, C.; Riley, E.; Thompson, T. Coincident Detection of Crop Water Stress, Nitrogen Status and Canopy Density using Ground Based Multispectral Data. In Proceedings of the 5th International Conference on Precision Agriculture, Bloomington, MN, USA, 16 July 2000. [Google Scholar]
62. Zhang, A.W.; Yin, S.N.; Wang, J.; He, N.P.; Chai, S.T.; Pang, H.Y. Grassland Chlorophyll Content Estimation from Drone Hyperspectral Images Combined with Fractional-Order Derivative. Remote Sens. 2023, 15, 5623. [Google Scholar] [CrossRef]
63. Chong, I.G.; Jun, C.H. Performance of Some Variable Selection Methods When Multicollinearity is Present. Chemom. Intell. Lab. Syst. 2005, 78, 103–112. [Google Scholar] [CrossRef]
64. Wang, Y.T.; Zhan, Y.G.; Yan, G.J.; Xie, D.H. Generalized Fine-Resolution FPAR Estimation using Google Earth Engine: Random Forest or Multiple Linear Regression. IEEE J. Sel. Top. Appl. Earth Observ. Remote Sens. 2022, 16, 918–929. [Google Scholar] [CrossRef]
65. Wang, X.R.; Zhang, C.; Qiang, Z.P.; Xu, W.H.; Fan, J.M. A New Forest Growing Stock Volume Estimation Model Based on AdaBoost and Random Forest Model. Forests 2024, 15, 260. [Google Scholar] [CrossRef]
66. Li, X.Y.; Jin, H.X.; Eklundh, L.; Bouras, E.H.; Olsson, P.O.; Cai, Z.Z.; Ardö, J.; Duan, Z. Estimation of District-level Spring Barley Yield in Southern Sweden using Multi-source Satellite Data and Random Forest Approach. Int. J. Appl. Earth Obs. Geoinf. 2024, 134, 104183. [Google Scholar] [CrossRef]
67. Wang, S.; Tuya, H.; Zhang, S.W.; Zhao, X.Y.; Liu, Z.Q.; Li, R.S.; Lin, X. Random Forest Method for Analysis of Remote Sensing Inversion of Aboveground Biomass and Grazing Intensity of Grasslands in Inner Mongolia, China. Int. J. Remote Sens. 2023, 44, 2867–2884. [Google Scholar] [CrossRef]
68. Yang, H.B.; Li, F.; Wang, W.; Yu, K. Estimating Above-Ground Biomass of Potato Using Random Forest and Optimized Hyperspectral Indices. Remote Sens. 2021, 13, 2339. [Google Scholar] [CrossRef]
69. Shah, S.H.; Angel, Y.; Houborg, R.; Ali, S.; McCabe, M.F. A Random Forest Machine Learning Approach for the Retrieval of Leaf Chlorophyll Content in Wheat. Remote Sens. 2019, 11, 920. [Google Scholar] [CrossRef]
70. López-Calderón, M.J.; Estrada-Avalos, J.; Rodríguez-Moreno, V.M.; Mauricio-Ruvalcaba, J.E.; Martínez-Sifuentes, A.R.; Delgado-Ramírez, G.; Miguel-Valle, E. Estimation of Total Nitrogen Content in Forage Maize (Zea mays L.) Using Spectral Indices: Analysis by Random Forest. Agriculture 2020, 10, 451. [Google Scholar] [CrossRef]
71. Wang, C.Y.; Gao, B.B.; Yang, K.; Wang, Y.X.; Sukhbaatar, C.; Yin, Y.; Feng, Q.L.; Yao, X.C.; Zhang, Z.H.; Yang, J.Y. Inversion of Soil Organic Carbon Content Based on the Two-point Machine Learning Method. Sci. Total Environ. 2024, 943, 173608. [Google Scholar] [CrossRef] [PubMed]
72. Fan, L.; Fang, S.B.; Fan, J.L.; Wang, Y.; Zhan, L.Q.; He, Y.K. Rice Yield Estimation Using Machine Learning and Feature Selection in Hilly and Mountainous Chongqing, China. Agriculture 2024, 14, 1615. [Google Scholar] [CrossRef]
73. Lin, N.; Ma, X.H.; Jiang, R.Z.; Wu, M.H.; Zhang, W.C. Estimation of Maize Residue Cover Using Remote Sensing Based on Adaptive Threshold Segmentation and CatBoost Algorithm. Agriculture 2024, 14, 711. [Google Scholar] [CrossRef]
74. Yang, J.X.; Li, X.G.; Ma, X.F. Improving the Accuracy of Soil Organic Carbon Estimation: CWT-Random Frog-XGBoost as a Prerequisite Technique for In Situ Hyperspectral Analysis. Remote Sens. 2023, 15, 5294. [Google Scholar] [CrossRef]
75. Liu, H.H.; Lei, X.Q.; Liang, H.; Wang, X. Multi-model rice canopy chlorophyll content inversion based on UAV hyperspectral images. Sustainability 2023, 15, 7038. [Google Scholar] [CrossRef]
76. Liu, M.L.; Liu, X.N.; Li, M.; Fang, M.H.; Chi, W.X. Neural-network Model for Estimating Leaf Chlorophyll Concentration in Rice Under Stress from Heavy Metals Using Four Spectral Indices. Biosyst. Eng. 2010, 106, 223–233. [Google Scholar] [CrossRef]
77. Wang, X.; Xu, G.; Feng, Y.; Peng, J.; Gao, Y.; Li, J.; Han, Z.; Luo, Q.; Ren, H.; You, X.J.A.; et al. Estimation Model of Rice Aboveground Dry Biomass Based on the Machine Learning and Hyperspectral Characteristic Parameters of the Canopy. Agronomy 2023, 13, 1940. [Google Scholar] [CrossRef]
78. Li, X.; Zhang, Y.; Bao, Y.; Luo, J.; Jin, X.; Xu, X.; Song, X.; Yang, G. Exploring the Best Hyperspectral Features for LAI Estimation using Partial Least Squares Regression. Remote Sens. 2014, 6, 6221–6241. [Google Scholar] [CrossRef]
79. Verma, B.; Prasad, R.; Srivastava, P.K.; Yadav, S.A.; Singh, P.; Singh, R. Investigation of Optimal Vegetation Indices for Retrieval of Leaf Chlorophyll and Leaf Area Index using Enhanced Learning Algorithms. Comput. Electron. Agric. 2022, 192, 106581. [Google Scholar] [CrossRef]
80. Wei, G.F.; Li, Y.; Zhang, Z.T.; Chen, Y.W.; Chen, J.Y.; Yao, Z.H.; Lao, C.C.; Chen, H.F. Estimation of Soil Salt Content by Combining UAV-borne Multispectral Sensor and Machine Learning Algorithms. PeerJ 2020, 8, e9087. [Google Scholar] [CrossRef] [PubMed]
81. Shi, X.Y.; Song, J.H.; Wang, H.J.; Lv, X.; Zhu, Y.Q.; Zhang, W.X.; Bu, W.Q.; Zeng, L.Y. Improving Soil Organic Matter Estimation Accuracy by Combining Optimal Spectral Preprocessing and Feature Selection Methods Based on PXRF and VIS-NIR Data Fusion. Geoderma 2023, 430, 116301. [Google Scholar] [CrossRef]
82. Sun, W.C.; Liu, S.; Zhang, X.; Li, Y. Estimation of Soil Organic Matter Content using Selected Spectral Subset of Hyperspectral Data. Geoderma 2022, 409, 115653. [Google Scholar] [CrossRef]
83. Bai, Z.J.; Xie, M.D.; Hu, B.F.; Luo, D.F.; Wan, C.; Peng, J.; Shi, Z. Estimation of Soil Organic Carbon Using Vis-NIR Spectral Data and Spectral Feature Bands Selection in Southern Xinjiang, China. Sensors 2022, 22, 6124. [Google Scholar] [CrossRef] [PubMed]
84. Fan, L.L.; Zhao, J.L.; Xu, X.G.; Liang, D.; Yang, G.J.; Feng, H.K.; Yang, H.; Wang, Y.L.; Chen, G.; Wei, P.F. Hyperspectral-Based Estimation of Leaf Nitrogen Content in Corn Using Optimal Selection of Multiple Spectral Variables. Sensors 2019, 19, 2898. [Google Scholar] [CrossRef]
85. Wu, G.S.; Fang, Y.L.; Jiang, Q.Y.; Cui, M.; Li, N.; Ou, Y.M.; Diao, Z.H.; Zhang, B.H. Early Identification of Strawberry Leaves Disease Utilizing Hyperspectral Imaging Combing with Spectral Features, Multiple Vegetation Indices and Textural Features. Comput. Electron. Agric. 2023, 204, 107553. [Google Scholar] [CrossRef]
86. Feng, S.; Cao, Y.L.; Xu, T.Y.; Yu, F.H.; Chen, C.L.; Zhao, D.X.; Yan, J. Inversion Based on High Spectrum and NSGA2-ELM Algorithm for the Nitrogen Content of Japonica Rice Leaves. Spectrosc. Spectr. Anal. 2020, 40, 2584–2591. [Google Scholar]
87. Xu, T.; Wang, F.; Xie, L.; Yao, X.; Zheng, J.; Li, J.; Chen, S. Integrating the Textural and Spectral Information of UAV Hyperspectral Images for the Improved Estimation of Rice Aboveground Biomass. Remote Sens. 2022, 14, 2534. [Google Scholar] [CrossRef]
Tian R, Zou B, Li S, Dai L, Zhang B, Wang Y, Tu H, Zhang J, Zou L. A Model Combining Sensitive Vegetation Indices and Fractional-Order Differential Characteristic Bands for SPAD Value Estimation in Cd-Contaminated Rice Leaves. Agriculture. 2025; 15(3):311. https://doi.org/10.3390/agriculture15030311
Перевод статьи «A Model Combining Sensitive Vegetation Indices and Fractional-Order Differential Characteristic Bands for SPAD Value Estimation in Cd-Contaminated Rice Leaves» авторов Tian R, Zou B, Li S, Dai L, Zhang B, Wang Y, Tu H, Zhang J, Zou L., оригинал доступен по ссылке. Лицензия: CC BY. Изменения: переведено на русский язык
Фото: freepik















Комментарии (0)