Как нейросети и умные карты помогают точнее вносить осадок сточных вод в почву на сельхозугодьях
Европейский Союз способствует развитию устойчивого подхода к управлению и утилизации твердых отходов. Осадки сточных вод (ОСВ) являются хорошим примером такой экономической модели, поскольку обладают удобряющими и почвоулучшающими свойствами. В данном исследовании для оценки распределения ОСВ на сельскохозяйственных угодьях использовался традиционный разбрасыватель навоза. Для анализа пространственных закономерностей распределения осадка применялись различные методы интерполяции и модели машинного обучения.
Аннотация
Данные собирались с 15 контрольных лотков на экспериментальном поле в ходе трех отдельных испытаний. Статистический анализ с использованием дисперсионного анализа (ANOVA) выявил значительные колебания в количестве осадка по продольной оси поля, но не по поперечной. Для моделирования распределения использовались методы интерполяции, такие как сплайн, кубический сплайн и метод обратных взвешенных расстояний (IDW), в то время как модели машинного обучения (k-ближайших соседей, случайный лес, нейронные сети) классифицировали пространственные закономерности. Для каждой модели были рассчитаны различные метрики производительности. Среди методов интерполяции модель IDW в сочетании с нейронными сетями показала наивысшую точность со значением коэффициента Мэттьюса (MCC) 0,9820. Результаты подчеркивают потенциал интеграции передовых методов в точное земледелие для повышения эффективности внесения и снижения воздействия на окружающую среду. Данный подход создает прочную основу для оптимизации работы сельскохозяйственной техники и поддержки устойчивых практик управления отходами.
1. Введение
Европейский Союз (ЕС) способствует развитию циркулярной экономики, направленной на повторное использование ресурсов и сокращение негативного воздействия на окружающую среду [1]. В этом контексте развитие технологий, способных извлекать питательные вещества из потока отходов и преобразовывать их в безопасный продукт для повторного использования в сельском хозяйстве, может представлять собой выигрышное решение для обеспечения глобальной продовольственной безопасности и решения проблем, связанных с чрезмерным производством отходов [2].
Последние доступные данные по производству осадка сточных вод (ОСВ) свидетельствуют, что в 2022 году в странах Европейского региона было произведено более 9500 тыс. тонн сухого вещества [3]. Ежегодно производимые объемы отходов биомассы создают значительные проблемы для их устойчивого управления, направленного на минимизацию негативного влияния на окружающую среду и здоровье человека. Основные пути утилизации и переработки ОСВ включают сельскохозяйственное повторное использование, сжигание, компостирование и захоронение на полигонах. В частности, в европейских странах преобладает утилизация удобряющих и мелиорирующих свойств ОСВ путем внесения на землю (38%) и компостирования (17%). За ними следуют методы превращения отходов в энергию (30%), широко используемые в Германии, Нидерландах, Швейцарии и Бельгии, которые могут сочетаться с потенциальным восстановлением тепловой энергии и рециклингом фосфора, содержащегося в золе от сжигания. Оставшаяся часть (15%) обычно отправляется на полигоны или утилизируется другими методами [3]. В Италии в 2021 году 52% осадка, полученного при очистке городских сточных вод, было отправлено на операции по захоронению, а оставшиеся 45,6% направлены на операции по утилизации — этот показатель стабильно растет, в частности, в северных районах страны [4].
В этом контексте применение городских ОСВ в качестве органических мелиорантов в сельском хозяйстве предоставляет значительные преимущества благодаря их высокому содержанию питательных веществ (20% сухого вещества (СВ), >1,5% СВ азота и >0,4% СВ фосфора [5]), что может повысить плодородие почвы и улучшить урожайность сельскохозяйственных культур. Однако равномерное распределение ОСВ имеет ключевое значение для максимизации этих преимуществ и минимизации потенциальных экологических рисков, таких как сток питательных веществ или неравномерный рост культур; это также предотвращает точечное накопление тяжелых металлов и органических загрязнителей, содержащихся в ОСВ [6]. Содержание питательных веществ в ОСВ заметно варьируется в зависимости от его происхождения, поскольку на него влияют региональные процессы очистки сточных вод и местная городская деятельность. Эта изменчивость создает проблемы для его стандартизации в качестве удобрения в точном земледелии. Однако данное исследование признает, что такую вариабельность можно решить путем проведения анализа питательных веществ для конкретного участка перед внесением. Такие методы, как датчики в реальном времени и экспресс-лабораторные испытания, могут предоставлять данные в реальном времени о составе питательных веществ, позволяя разрабатывать адаптированные стратегии применения. Интегрируя эти подходы, можно минимизировать потенциальные экологические риски, связанные с дисбалансом питательных веществ, одновременно максимизируя агрономические преимущества использования ОСВ.
Осадок можно вносить с помощью обычных разбрасывателей навоза, предназначенных в первую очередь для твердых органических веществ, которые могут не обеспечивать равномерное распределение, требуемое в сельском хозяйстве. Неточное или неравномерное распределение может привести к чрезмерному или недостаточному внесению на определенных участках, снижая эффективность мелиоранта и потенциально причиняя вред окружающей среде [7,8].
Но еще до равномерности точное земледелие ценит знание изменчивости распределения, если оно известно и постоянно. Таким образом, машина может быть способна соответствовать сложным картам-предписаниям для переменного распределения доз.
Точное земледелие играет ключевую роль в распределении ОСВ. В Италии распространение точного земледелия очень низкое (только 1% от используемой сельскохозяйственной площади) из-за типичной орографии итальянской территории и ферм [9]. Рост цен на сельскохозяйственные ресурсы, такие как удобрения, может стимулировать развитие точного земледелия.
Современная технология точного земделия, предоставляемая владельцами тракторов, в настоящее время зрелая и ее применение устоялось: она позволяет проводить точное внесение удобрений, посев, разбрасывание и орошение. Однако последние достижения в области точного земледелия подчеркивают необходимость в точных и эффективных методах внесения, где такие технологии, как интерполяция и машинное обучение, могут сыграть ключевую роль. Методы интерполяции могут моделировать и прогнозировать пространственное распределение ОСВ, позволяя улучшить практики управления, соответствующие целям точного земледелия [10,11]. Дополнительно, модели машинного обучения могут классифицировать и прогнозировать зоны распределения, оптимизируя внесение осадка и обеспечивая положительное влияние на урожайность культур и экологическую устойчивость [12].
При сравнении результатов точности с кригингом, который традиционно эффективен при моделировании пространственной автокорреляции, обнадеживает тот факт, что комбинация нейронных сетей и сплайн-интерполяции обладает потенциалом не только соответствовать, но, возможно, и превосходить производительность кригинга в определенных аспектах, в основном когда предварительная обработка данных тщательно контролируется [7,13]. Это наблюдение отражает перспективную тенденцию в литературе, где комбинация методов машинного обучения и интерполяции приводит к более надежным пространственным прогнозам.
Дополнительно, исследование, проведенное [14], которые изучали различные методы интерполяции для прогнозирования свойств почвы, добавляет ценную информацию к результатам данного исследования. Их результаты подчеркивают преимущества методов на основе сплайнов, главным образом при использовании вместе с продвинутыми моделями машинного обучения. Это исследование предполагает, что более простые методы, такие как метод обратных взвешенных расстояний (IDW), могут плохо справляться со сложными наборами данных, иллюстрируя преимущества более сложных методов, таких как сплайн-интерполяция.
Это исследование изучает эффективность стандартного разбрасывателя навоза в распределении городского осадка через сельскохозяйственные угодья, используя методы интерполяции для оценки закономерностей разбрасывания и модели машинного обучения для классификации и прогнозирования зон распределения. Результаты направлены на внесение вклада в оптимизацию стратегий внесения осадка, поддерживая более широкое внедрение практик точного земледелия [10,13].
2. Материалы и методы
2.1. Полевые испытания
Полевые эксперименты проводились на испытательном участке, расположенном в Северной Италии, около Сан-Джорджио-ди-Ломеллина (Павия, Италия; 45.156450° с.ш., 8.768105° в.д.). ОСВ поступал с различных городских очистных сооружений по всей Италии и затем обрабатывался оксидом кальция для снижения бактериальной нагрузки и стабилизации массы.
ОСВ вносился с использованием обычного разбрасывателя навоза через предварительно обработанное сельскохозяйственное поле. Пятнадцать лотков (0,50 м × 0,50 м) были размещены для захвата картины разбрасывания, распределенных систематически по продольной и поперечной осям (пять по широте x три по долготе, каждые 3 м) (Рисунок 1). Эксперимент повторялся три раза в постоянных условиях для обеспечения надежности данных и учета любой изменчивости в картине разбрасывания. Осадок, собранный с лотков, немедленно взвешивался (граммы), чтобы избежать потери влаги, которая могла бы повлиять на конечный результат. Вес регистрировался и вносился в файл Excel® для обработки. Цель состояла в том, чтобы оценить способность машины равномерно распределять осадок по полю.
Рисунок 1. Схема экспериментального поля. (a) Местоположение полевых испытаний и положение лотков. (b) Фокус на схему расположения лотков и их пространственное распределение.
2.2. Характеристики разбрасывателя
Прицепной разбрасыватель навоза (Рисунок 2), использовавшийся в испытаниях, имел объем 8 м3, два задних вертикальных ротора (360 об/мин) для разбрасывания и ширину распределения 12 м. Разбрасывание органического материала обеспечивалось цепным ковриком, который перемещал ленту на нижней поверхности тележки. Задний откидной борт с датчиковым гидроцилиндром (MH-Series MS, Temposonics GmbH Co., Люденшайд, Германия) использовался для регулировки высоты открывания в соответствии с характеристиками органического материала внутри разбрасывателя. Дополнительно, был установлен датчик контроля продвижения ленты (модель M18, DigiDevice, Кальвизано, Брешия, Италия) для модуляции скорости и, следовательно, количества материала, подаваемого на задние роторы. В испытаниях разбрасыватель использовался в обычном режиме; установленные датчики собирали информацию без изменения настроек распределения разбрасывателя.
Рисунок 2. Усовершенствованный разбрасыватель навоза, использованный в испытаниях. (a) Общий вид разбрасывателя навоза. (b) Фокус на датчик контроля продвижения ленты. (c) Визуализация датчикового гидроцилиндра (реальные фотографии не полностью описывают датчик).
2.3. Статистический анализ
Осадок, собранный в каждом лотке, анализировался с помощью дисперсионного анализа (ANOVA) после проверки на гомогенность дисперсий и нормальность, чтобы определить, есть ли значимые различия в картинах распределения по повторениям (испытания) и по географическим координатам. Уровень достоверности для анализа был установлен на уровне p < 0,05. Анализ был направлен на выявление любых систематических вариаций в распределении, вызванных механическими ограничениями разбрасывателя или конфигурацией поля. Разделение на географические оси позволило отдельно оценить равномерность распределения по направлению движения (продольная ось) и по ширине поля (широтная ось).
2.4. Методы интерполяции
Пространственная интерполяция использовалась для оценки значения неизвестных точек на основе различных данных, где значение наблюдается.
Программное обеспечение QGIS 3.28 LTR с плагином SAGA позволило оценить пространственное распределение осадка; последовательно применялись три метода интерполяции:
1. Сплайн (Spline): Этот метод создает гладкую кривую, соответствующую точкам данных, идеальную для моделирования постепенных изменений в распределении. Данные (количество осадка, кг) отдельных испытаний включаются в алгоритм, и выбирается размер выходного пикселя сетки (м).
2. Кубический сплайн (Cubic Spline): Это более усовершенствованная версия сплайна, которая обеспечивает более плавный переход между точками данных. Следуя полиномам третьей степени, результат интерполяции получается более гладким и избегает осцилляций. Входные данные такие же, как у сплайна, но настройка выхода несколько иная: кубический сплайн позволяет выбрать минимальное и максимальное количество точек для создания интерполяции (малое количество точек не дает интерполяции, а большое избегает переобучения) и, наконец, плотность точек, используемых в конкретной ячейке.
3. Метод обратных взвешенных расстояний (Inverse Distance Weighting, IDW): Этот метод вычисляет значение неизвестных точек на основе обратного расстояния от известных точек, причем более близкие точки оказывают большее влияние. Алгоритм создает коэффициент, зависящий от расстояния между различными известными точками. Этот метод должен иметь регулярную сетку выборки, иначе интерполяция может содержать больше ошибок и быть менее точной. Входные данные те же, что и в предыдущих методах. Установленный радиус влияет на выходные результаты, а именно на расстояние влияния отдельной точки на итоговую рассчитанную интерполяцию.
Эти методы интерполяции генерировали карты распределения, визуально представляющие картину разбрасывания через поле. Карты анализировались для выявления любых тенденций или аномалий в распределении, с особым вниманием к зонам чрезмерного или недостаточного внесения.
2.5. Классификация методом машинного обучения на полевых данных
Классификация методом машинного обучения валидировала результаты интерполяции. Три алгоритма машинного обучения использовались для классификации закономерностей распределения осадка и прогнозирования зон внесения с использованием интерполированных данных в качестве входных. Реализация была выполнена в среде R с использованием специфических пакетов для каждой модели [15]. Анализ использовал несколько ключевых пакетов R, которые обычно используются в области машинного обучения и анализа данных:
1. Метод k-ближайших соседей (k-Nearest Neighbors, kNN): Алгоритм k-ближайших соседей классифицирует точки на основе преобладающей категории их ближайших соседей, что делает его особенно эффективным в сценариях, где данные имеют локальную структуру. В этом исследовании использовался пакет class [8] для реализации алгоритма kNN, при этом количество соседей (k) выбиралось с помощью перекрестной проверки для оптимизации прогнозной производительности. Пакет caret [16] также использовался для обучения и оценки эффективности модели, позволяя упростить рабочий процесс, включающий предварительную обработку данных, настройку модели и валидацию.
2. Случайный лес (Random Forest, RF): Случайный лес — это метод ансамблевого обучения, который строит множество деревьев решений и объединяет их результаты для повышения точности классификации и контроля переобучения [17]. Пакет randomForest [18] использовался для создания и обучения моделей случайного леса, при этом гиперпараметры, такие как количество деревьев (ntree) и количество переменных, проверяемых при каждом разбиении (mtry), настраивались для достижения наилучшей производительности. Дополнительно, пакет caret снова использовался для управления процессом настройки и для оценки эффективности модели с использованием методов перекрестной проверки.
3. Нейронная сеть (Neural Network, NN): Нейронная сеть, в частности прямая нейронная сеть, была применена для захвата сложных взаимосвязей в данных, предлагая высокую прогнозную точность для нелинейных и высокоразмерных наборов данных. Пакет nnet [8] использовался для реализации нейронной сети с одним скрытым слоем, при этом количество нейронов в скрытом слое (size) и параметр регуляризации (decay) оптимизировались с помощью методов поиска по сетке. Для более сложных моделей глубокого обучения был интегрирован пакет keras [19], позволяющий строить глубокие нейронные сети с несколькими слоями, функциями активации и регуляризацией отсева для смягчения переобучения. Архитектура состояла из входного слоя, соответствующего количеству признаков в предварительно обработанном наборе данных, одного скрытого слоя с 64 нейронами и выходного слоя с одним нейроном, использующим сигмоидную функцию активации для вывода вероятностей бинарной классификации. Скрытый слой использовал функцию активации ReLU для обработки нелинейных зависимостей в данных. Модель обучалась с использованием оптимизатора Adam с начальной скоростью обучения 0,001, выбранной за его эффективность в обработке градиентных обновлений и его адаптируемость во время обучения. Размер пакета был установлен на 32, балансируя вычислительную эффективность и стабильность в процессе обучения. Обучение было ограничено 100 эпохами, с досрочной остановкой для предотвращения переобучения. Досрочная остановка отслеживала потерю на валидации и останавливала обучение, когда улучшение не наблюдалось в течение 10 последовательных эпох. Для дальнейшего смягчения переобучения применялся параметр затухания (decay) 0,01 в качестве регуляризации.
Производительность нейронной сети оценивалась с использованием нескольких метрик как во время фазы обучения и валидации (MT: Training Metrics), так и на тестовом наборе (MP: Prediction Metrics), включая среднюю абсолютную ошибку (MAE) и среднюю квадратичную ошибку (MSE) для измерения точности прогноза и точность (CA) для оценки доли правильно классифицированных экземпляров. Площадь под кривой (AUC) рассчитывалась для оценки способности модели различать классы. Дополнительно, F1-мера, точность (precision) и полнота (recall) использовались для балансировки оценки истинно положительных и ложноотрицательных прогнозов. Коэффициент корреляции Мэттьюса (MCC) был особенно полезен для оценки согласия между прогнозами и истинными значениями, особенно в несбалансированных наборах данных. Эти метрики вычислялись как во время обучения, так и во время валидации, чтобы обеспечить согласованность в оценке эффективности. Набор данных включал количества распределенного осадка (кг), измеренные в 15 точках отбора проб и интерполированные с использованием методов сплайна, кубического сплайна и IDW.
Шаги предварительной обработки данных, включая нормализацию, масштабирование признаков и обработку пропущенных значений, выполнялись с использованием пакета caret, гарантируя, что все модели получают сопоставимые входные данные. Для обеспечения воспроизводимости случайные начальные значения устанавливались с помощью пакета caret в R с использованием set.seed(42) для обеспечения согласованности результатов во время оптимизации и обучения. Значение 42 было выбрано произвольно, так как это широко признанное соглашение в вычислительных исследованиях, обеспечивающее согласованность между реализациями при сохранении случайности в генерируемых последовательностях.
Для каждой модели оптимизация гиперпараметров выполнялась с использованием пакета caret, что позволяло определять оптимальные значения с помощью перекрестной проверки и минимизации ошибки на тестовых данных.
Набор данных был разделен на обучающую (70%) и тестовую (30%) выборки, и каждая модель итерировалась 100 раз для обеспечения надежности. Метрики производительности, включая площадь под кривой (AUC), точность классификации (CA), F1-меру, точность (precision), полноту (recall) и коэффициент корреляции Мэттьюса (MCC), рассчитанные с помощью пакета pROC [20], были вычислены для каждой модели. AUC рассчитывалась с использованием пакета R pROC на основе кривых ROC, сгенерированных для каждой модели. CA, точность (precision), полнота (recall) и F1-мера были получены из матриц ошибок. MCC рассчитывался для оценки корреляции между прогнозами и наблюдениями, что особенно полезно при наличии несбалансированных наборов данных. Модели итерировались 100 раз, и сообщались средние результаты, чтобы уменьшить изменчивость, обусловленную рандомизацией в распределении данных. Эти метрики предоставляли представление об эффективности моделей машинного обучения в точной классификации закономерностей распределения.
3. Результаты
3.1. Дисперсионный анализ и интерполяция по полевым данным
Результаты дисперсионного анализа показали значительную изменчивость в количествах осадка по продольной оси, в частности показав, что одно испытание (Испытание 1) заметно отличалось от других. Напротив, значительных различий по широтной оси не наблюдалось, что предполагает, что производительность машины была менее стабильной по рабочей ширине поля (Таблица 1 и Рисунок 3). Результаты, представленные в Таблице 1, подчеркивают значительную изменчивость в распределении осадка по продольной оси (p < 0,001). Это указывает на то, что разбрасыватель навоза демонстрировал неравномерную производительность по этой оси, с заметным накоплением в центральных зонах. Напротив, результаты по широте (p = 0,770) показывают отсутствие значительных различий, предполагая, что разбрасыватель поддерживает более равномерное распределение по широтной оси. Эффект испытания (p = 0,002) подчеркивает изменчивость между повторениями, вероятно, из-за небольших различий в рабочих условиях или консистенции материала. Рисунок 3 предоставляет визуальное представление закономерностей распределения осадка, собранного во время испытаний. Данные подтверждают значительную продольную изменчивость, при этом более высокие концентрации осадка наблюдались в центральных зонах поля. Этот вывод согласуется с ограничениями технологии разбрасывателя навоза, поскольку неравномерное распределение является известной проблемой для систем с вертикальными роторами. Относительно равномерная картина по широтной оси соответствует незначительным результатам дисперсионного анализа для этого направления. Эти выводы подчеркивают трудности в достижении равномерного распределения при использовании современной технологии разбрасывателей навоза.
Рисунок 3. Распределение значений осадка, собранных в трех испытаниях и по долготе и широте.
Таблица 1. Результаты дисперсионного анализа подчеркивают значимость продольных координат для распределения осадка.
Результаты дисперсионного анализа подтвердили значительные различия в распределении осадка по продольной оси, отражая присущие ограничения разбрасывателя навоза в достижении равномерного распределения через ширину поля. Критерий Тьюки (Таблица 2) использовался для выявления значимых различий в концентрациях осадка, распределенных по продольной оси. Результаты показали три различные зоны: центральную зону и две периферийные зоны. В центральной зоне концентрация была значительно выше, что указывает на более точное распределение в центральной части поля. В периферийных зонах концентрации были ниже, предполагая снижение эффективности выброса материала на концах. Эти различия отражают механические ограничения системы вертикальных роторов разбрасывателя, которая имеет тенденцию концентрировать материал вблизи центральной траектории. Эти результаты согласуются с визуальными закономерностями, выделенными на Рисунке 3.
Таблица 2. Критерий Тьюки для определения зон. Разные буквы представляют значимо различающиеся значения.
Результаты критерия Тьюки подчеркивают необходимость лучшей калибровки разбрасывателя для улучшения равномерности распределения через рабочую ширину. Возможным решением может быть добавление датчиков или компенсационных механизмов для автоматической регулировки выброса материала.
Рисунок 4 иллюстрирует карты пространственного распределения муниципального осадка, сгенерированные с использованием трех методов интерполяции — сплайна, кубического сплайна и метода обратных взвешенных расстояний (IDW) — на основе данных, собранных в ходе трех экспериментальных повторений.
Рисунок 4. Карты интерполяции для каждого испытания с использованием методов сплайна, кубического сплайна и IDW.
Рисунок подчеркивает продольную изменчивость, полученную из дисперсионного анализа, показывая, что самые высокие концентрации находятся в определенных центральных зонах. Этот результат подтверждает ограничения использованного разбрасывателя удобрений, который, несмотря на использование стандартной технологии разбрасывания, испытывает трудности с обеспечением равномерного распределения по всей рабочей ширине. Аналогичные результаты были представлены в предыдущих исследованиях, где неэффективность равномерного распределения объяснялась присущими механическими ограничениями системы вертикальных роторов, а также вариациями в плотности и связности распределяемого материала.
Визуальный анализ закономерностей на Рисунке 4 ясно показывает необходимость в более сложном подходе к моделированию и управлению пространственными распределениями, особенно в приложениях точного земледелия. Сочетание методов интерполяции с продвинутыми методами машинного обучения является перспективным решением для решения этих ключевых проблем. Например, использование нейронных сетей для классификации и прогнозирования зон распределения, как показано в данном исследовании, уже продемонстрировало значительный потенциал для повышения точности внесения [7,11].
Эта интеграция позволяет компенсировать неэффективность традиционных методов и корректировать рабочие параметры сельскохозяйственной техники, такие как скорость движения или открытие разбрасывателя, в реальном времени. Дополнительно, модели машинного обучения, такие как случайный лес или нейронные сети, в сочетании с методами интерполяции, такими как IDW, доказали свою особую эффективность в прогнозировании пространственных вариаций с высокой точностью, даже в условиях неоптимального распределения [10].
3.2. Валидация машинного обучения на обработанных данных
Модели машинного обучения продемонстрировали высокую точность в классификации интерполированных закономерностей распределения. Рисунок 5 показывает матрицы ошибок для моделей машинного обучения, примененных к интерполированным данным. Каждая матрица представляет количество правильных и неправильных прогнозов для каждого класса, разделенных на истинно положительные (TP) — образцы, правильно классифицированные как принадлежащие к классу; ложно положительные (FP) — образцы, неправильно классифицированные как принадлежащие к классу; ложно отрицательные (FN) — образцы, принадлежащие к одному классу, но классифицированные как принадлежащие к другому классу; и истинно отрицательные (TN) — образцы, правильно классифицированные как не принадлежащие к классу.
Рисунок 5. Матрицы ошибок и карты кластеров, иллюстрирующие классификацию. Фактические кластеры представлены цветами (1: зеленый; 2: красный; 3: синий), прогнозируемые кластеры представлены формами (1: круг, 2: крест, 3: треугольник).
Матрицы ошибок показывают, что нейронная сеть (NN) дает наивысшую общую точность, с небольшим количеством FP и FN, особенно в центральных зонах поля. Случайный лес (RF) показывает хорошую точность, но немного большее количество FP в периферийных зонах. Алгоритм k-ближайших соседей (kNN) имеет тенденцию совершать ошибки в пограничных зонах, показывая ограничения в способности к обобщению с менее плотными данными. Эти результаты предполагают, что модель NN более подходит для применений, где сокращение ошибок классификации имеет ключевое значение, в то время как RF и kNN могут быть полезны для менее чувствительных сценариев. Матрицы ошибок показали высокую производительность модели в распознавании зоны, с небольшим количеством ложноположительных и ложноотрицательных результатов. Однако распределение ложноположительных результатов на картах показывает, что они всегда расположены в краевых зонах.
Среди моделей нейронная сеть, примененная к методу интерполяции IDW, обеспечила наивысшую точность, с AUC 0,9841, точностью классификации 0,9789 и MCC 0,982 (Таблица 3). Эти результаты указывают на то, что нейронная сеть в комбинации с IDW особенно эффективна в идентификации и прогнозировании пространственного распределения осадка, даже когда разброс неравномерен.
Таблица 3. Метрики производительности для моделей машинного обучения, примененных к разным методам интерполяции.
4. Обсуждение
Результаты этого исследования подчеркивают как потенциал, так и ограничения использования обычного разбрасывателя навоза для внесения осадка в точном земледелии. Значительная вариация по продольной оси подчеркивает проблему достижения равномерного распределения с текущим оборудованием, особенно через рабочую ширину. Однако интеграция методов интерполяции и машинного обучения представляет собой практическое решение. Точным моделированием картины разбрасывания эти методы позволяют выявлять зоны, требующие корректирующих действий, таких как регулировка перекрытия проходов разбрасывателя для достижения более равномерного покрытия [7,8].
Дополнительно, это исследование предоставляет ценную информацию для разработки стратегий точного земледелия, которые включают продвинутые инструменты анализа данных. Прогнозирование закономерностей распределения с высокой точностью позволяет принимать более обоснованные решения, потенциально приводя к более эффективному использованию ресурсов, снижению воздействия на окружающую среду и повышению урожайности культур. Однако эффективность моделей машинного обучения в значительной степени зависит от качества и количества собранных данных, которые могут различаться в разных полевых условиях или с разными типами разбрасывателей. Дополнительно, хотя методы интерполяции, использованные в этом исследовании, предоставили надежные результаты, они основаны на предположениях о пространственных взаимосвязях между точками данных, которые могут не всегда выполняться на практике [10].
Инновационным аспектом данного исследования является перекрестная проверка результатов интерполяции с использованием моделей машинного обучения, обеспечивающая надежный и точный анализ динамики распределения. Этот подход, редко исследуемый в современной литературе, демонстрирует, как передовые инструменты анализа данных могут быть интегрированы в практики точного земледелия для повышения эффективности внесения осадка и снижения воздействия на окружающую среду.
Несмотря на обнадеживающие результаты, это исследование имеет некоторые ограничения. Во-первых, данные были собраны на одном экспериментальном участке с конкретным типом разбрасывателя навоза. Будущие исследования должны воспроизвести эти анализы в различных условиях окружающей среды и с различным оборудованием, чтобы подтвердить обобщаемость выводов. Во-вторых, методы машинного обучения требуют больших наборов данных для достижения оптимальной производительности, что может создавать препятствия для их практического внедрения в сельскохозяйственных контекстах с ограниченными ресурсами для сбора данных. Разработка более эффективных методов сбора данных и упрощенных моделей обучения могла бы облегчить внедрение этих технологий фермерами.
Длительные воздействия применения городского осадка, такие как накопление тяжелых металлов и органических загрязнителей, также должны быть оценены. Сочетание продвинутых технологических подходов с устойчивыми агрономическими стратегиями является приоритетом для обеспечения как экологических, так и производственных преимуществ.
Это исследование предоставляет практические выводы для разработчиков программного обеспечения точного земледелия и производителей сельскохозяйственной техники. Улучшение механических компонентов разбрасывателей навоза, например, путем внедрения продвинутых датчиков и автоматизированных систем для регулировки скорости и траектории, могло бы дополнительно улучшить равномерность распределения. Параллельно, алгоритмы, разработанные для анализа распределения, могли бы быть интегрированы в системы автоматического вождения тракторов, позволяя проводить внесение ОСВ с привязкой к местоположению в соответствии с картами-предписаниями.
При оценке результатов интерполяции в сравнении с установленными исследованиями возникает несколько убедительных выводов. Представленные результаты согласуются с выводами геостатистических и сельскохозяйственных исследований. Что касается интерполяции сплайнами и кубическими сплайнами, эти методы, как правило, превосходят метод обратных взвешенных расстояний (IDW) благодаря их гладкости и способности моделировать непрерывные поверхности. Нейронные сети также демонстрируют высокую производительность, сочетая преимущества методов сплайнов и машинного обучения для захвата сложных закономерностей [7]. Дополнительно, случайный лес известен своей способностью балансировать точность и полноту, показывая надежные результаты в сельскохозяйственных контекстах, особенно для прогнозирования урожайности культур и состояния почвы [7,10]. Данное исследование следует этой тенденции, при этом методы на основе сплайнов в сочетании с нейронными сетями достигают наивысших метрик оценки, особенно по AUC, F1-мере, точности (precision) и коэффициенту корреляции Мэттьюса (MCC).
Интеграция нейронных сетей со сплайн-интерполяцией повышает прогнозную точность, особенно в сценариях со сложными закономерностями данных [7]. Работа [12] подтверждает наши выводы, так как они отметили, что методы на основе сплайнов и нейронные сети показали исключительно высокую производительность в пространственных прогнозах, особенно в отношении геопространственных данных о свойствах почвы и урожайности культур. Точно так же источник [11] подтвердил, что методы на основе сплайнов особенно эффективны для пространственных прогнозов, особенно при картировании свойств почвы. Это согласуется с нашими выводами, которые указывают, что нейронные сети достигли превосходных результатов по сравнению с другими моделями с точки зрения площади под кривой (AUC) и коэффициента корреляции Мэттьюса (MCC). Эти выводы подчеркивают потенциал сочетания этих продвинутых методов для улучшенного пространственного анализа.
В своем исследовании источник [21] предоставил ключевые выводы о методах интерполяции для прогнозирования индексов качества воды, подчеркнув эффективность методов на основе сплайнов и нейронных сетей, утверждая, что эти подходы дают удивительно точные и надежные прогнозы в сложных пространственных сценариях, значительно превосходя традиционные методы обратных взвешенных расстояний (IDW).
В целом, описанный эксперимент подтверждает преобладающую литературу, выделяя сильные стороны методологий на основе сплайнов и моделей машинного обучения, особенно нейронных сетей. Такая комбинация является ключевой для достижения надежных результатов в пространственном анализе.
5. Выводы
Это исследование подчеркивает практические последствия использования передовых технологий, таких как машинное обучение и методы интерполяции, в точном земледелии. Комбинация интерполяции IDW и нейронных сетей достигла наивысшей точности с коэффициентом корреляции Мэттьюса (MCC) 0,9820, демонстрируя их потенциал для решения проблем пространственной изменчивости и эффективности распределения. Эти результаты предоставляют полезную информацию для улучшения калибровки разбрасывателя навоза и оптимизации полевых операций. Дополнительно, принятие этих методов может улучшить стратегии управления питательными веществами, снижая экологические риски и обеспечивая устойчивые сельскохозяйственные практики. Будущие исследования должны быть сосредоточены на интеграции датчиков реального времени и систем автоматизации для дальнейшего уточнения точности внесения и расширения масштабируемости этих подходов.
Однако несколько ключевых моментов должны быть рассмотрены в будущих исследованиях. Во-первых, настоящее исследование основано на данных одного полевого испытания с конкретным типом разбрасывателя навоза; необходимы дополнительные исследования для валидации этих выводов в различных полевых условиях и с другими типами разбрасывателей. Во-вторых, модели машинного обучения, хотя и точные, требуют больших наборов данных для обучения, что не всегда осуществимо в практических условиях. Будущие исследования должны изучить способы оптимизации сбора данных и обучения моделей, чтобы гарантировать, что эти методы доступны и применимы в различных сельскохозяйственных контекстах. Дополнительно, для улучшения точного управления этими органическими матрицами с высокой вариабельностью важно проводить предварительный лабораторный анализ или, что еще точнее, оперативный анализ экспресс-методами (например, БИК) для управления распределением. Наконец, необходимо дальнейшее исследование длительных воздействий закономерностей распределения осадка на здоровье почвы и продуктивность сельскохозяйственных культур, чтобы гарантировать, что стратегии точного земледелия могут быть устойчиво интегрированы в сельскохозяйственные практики.
Ссылки
1. Directive EU 2018/851 of the European Parliament and of the Council. Available online: https://eur-lex.europa.eu/eli/dir/2018/851/oj (accessed on 13 December 2024).
2. Buckwell, A.; Nadeu, E. Nutrient Recovery and Reuse (NRR) in European Agriculture: A Review of the Issues, Opportunities and Actions; RISE Foundation: Brussels, Belgium, 2016; Issue April. [Google Scholar]
3. Eurostat Statistics. Sewage Sludge Production and Disposal from Urban Wastewater (in Dry Substance (d.s)). Available online: https://ec.europa.eu/eurostat/databrowser/view/ten00030/default/table?lang=en (accessed on 13 December 2024).
4. ISPRA. Rapporto Rifiuti Speciali—Edizione 2023 Rapporto di Sintesi. Available online: https://www.isprambiente.gov.it/files2023/pubblicazioni/rapporti/rapportorifiutispeciali_ed-2023_n-390_versionedati-di-sintesiit.pdf (accessed on 13 December 2024).
5. De Feo, G.; De Gisi, S.; Galasso, M. Fanghi Di Depurazione. Produzione, Caratterizzazione e Trattamento, 1st ed.; Dario Flaccovio Editore s.r.l.: Palermo, Italy, 2013; pp. 1–187. [Google Scholar]
6. Sánchez-Monedero, M.A.; Mondini, C.; De Nobili, M.; Leita, L.; Roig, A. Land Application of Biosolids. Soil Response to Different Stabilization Degree of the Treated Organic Matter. Waste Manag. 2004, 24, 325–332. [Google Scholar] [CrossRef] [PubMed]
7. Setianto, A.; Triandini, T. Comparison of kriging and inverse distance weighted (IDW) interpolation methods in lineament extraction and analysis. J. Southeast Asian Appl. Geol. 2013, 5, 21–29. [Google Scholar] [CrossRef]
8. Venables, W.N.; Ripley, B.D. Modern Applied Statistics with S, 4th ed.; Springer: New York, NY, USA, 2002; pp. 1–498. ISBN 0-387-95457-0. [Google Scholar] [CrossRef]
9. MiPaaf. Linee Guida per lo Sviluppo Dell’agricoltura di Precisione in Italia. Available online: https://agricoltura.regione.campania.it/precisione/pdf/Linee_Guida.pdf (accessed on 13 December 2024).
10. Tan, Q.; Xu, X. Comparative Analysis of Spatial Interpolation Methods: An Experimental Study. Sens. Transducers 2014, 165, 155–163. [Google Scholar]
11. Igaz, D.; Šinka, K.; Varga, P.; Vrbičanová, G.; Aydın, E.; Tárník, A. The Evaluation of the Accuracy of Interpolation Methods in Crafting Maps of Physical and Hydro-Physical Soil Properties. Water 2021, 13, 212. [Google Scholar] [CrossRef]
12. Wu, Y.-H.; Hung, M.-C. Comparison of Spatial Interpolation Techniques Using Visualization and Quantitative Assessment. Applications of Spatial Statistics. In Applications of Spatial Statistics; IntechOpen: Rijeka, Croatia, 2016. [Google Scholar] [CrossRef]
13. Saliba, Y.; Bărbulescu, A. Downscaling MERRA-2 Reanalysis PM2.5 Series over the Arabian Gulf by Inverse Distance Weighting, Bicubic Spline Smoothing, and Spatio-Temporal Kriging. Toxics 2024, 12, 177. [Google Scholar] [CrossRef] [PubMed]
14. Singh, P.; Verma, P. A Comparative Study of Spatial Interpolation Technique (IDW and Kriging) for Determining Groundwater Quality. In GIS and Geostatistical Techniques for Groundwater Science; Elsevier: Amsterdam, The Netherlands, 2019; pp. 43–56. [Google Scholar] [CrossRef]
15. R Core Team. R: A Language and Environment for Statistical Computing; R Foundation for Statistical Computing: Vienna, Austria, 2023; Available online: https://www.R-project.org/ (accessed on 13 December 2024).
16. Kuhn, M. Building Predictive Models in R Using the Caret Package. J. Stat. Softw. 2008, 28, 1–26. [Google Scholar] [CrossRef]
17. Breiman, L. Random Forests. Mach. Learn. 2001, 45, 5–32. [Google Scholar] [CrossRef]
18. Liaw, A.; Wiener, M. Classification and Regression by RandomForest. R News 2002, 2, 18–22. [Google Scholar]
19. Chollet, F. Keras 3: Deep Learning for Humans. Available online: https://github.com/keras-team/keras (accessed on 13 December 2024).
20. Robin, X.; Turck, N.; Hainard, A.; Tiberti, N.; Lisacek, F.; Sanchez, J.C.; Müller, M. PROC: An Open-Source Package for R and S+ to Analyze and Compare ROC Curves. BMC Bioinform. 2011, 12, 77. [Google Scholar] [CrossRef] [PubMed]
21. Garnero, G.; Godone, D. Comparisons between Different Interpolation Techniques. In Proceedings of the International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences—ISPRS Archives, Padua, Italy, 27–28 February 2013; International Society for Photogrammetry and Remote Sensing: Bethesda, MD, USA, 2013; Volume 40, pp. 139–144. [Google Scholar]
Lazzari A, Giovinazzo S, Cabassi G, Brambilla M, Bisaglia C, Romano E. Evaluating Urban Sewage Sludge Distribution on Agricultural Land Using Interpolation and Machine Learning Techniques. Agriculture. 2025; 15(2):202. https://doi.org/10.3390/agriculture15020202
Фото: freepik
Перевод статьи «Evaluating Urban Sewage Sludge Distribution on Agricultural Land Using Interpolation and Machine Learning Techniques» авторов Lazzari A, Giovinazzo S, Cabassi G, Brambilla M, Bisaglia C, Romano E., оригинал доступен по ссылке. Лицензия: CC BY. Изменения: переведено на русский язык









Комментарии (0)