Опубликовано 25.03 12:00

Как нейросеть «видит» горные поля: новая модель для точного учёта фрагментированных земель

Приблизительно 24% площади суши в мире приходится на горные регионы, при этом 10% населения зависят от этих территорий в плане обеспечения сельскохозяйственными землями. Точный мониторинг и статистика обрабатываемых земель в горных районах имеют решающее значение для обеспечения продовольственной безопасности, разработки научно обоснованной политики землепользования и охраны окружающей среды. Однако фрагментированный характер сельскохозяйственных угодий в условиях сложного рельефа снижает эффективность существующих методов выделения. Для решения этой проблемы в данном исследовании предложена каскадная сеть на основе улучшенной модели семантической сегментации (DeepLabV3+), получившая название Cascade DeepLab Net, разработанная специально для повышения точности в условиях фрагментированных земельных объектов.

Данный метод направлен на точное выделение сельскохозяйственных земель на спутниковых снимках. Модель повышает точность выделения обрабатываемых земель в сложных ландшафтах за счет включения модуля стилевой перекалибровки (SRM), модуля пространственного внимания (SAM) и модуля уточнения (RM). Результаты эксперимента с использованием спутниковых снимков высокого разрешения горных районов Южного Китая показывают, что улучшенная модель достигла общей точности 92,33% и пересечения по объединению 82,51%, что значительно превосходит такие модели, как U-образная сеть (UNet), сеть анализа пирамидальных сцен (PSPNet) и DeepLabV3+. Этот метод повышает эффективность и точность мониторинга сельскохозяйственных земель в горных районах, а также обеспечивает научную основу для разработки политики и управления ресурсами, способствуя охране окружающей среды и устойчивому развитию. Кроме того, данное исследование открывает новые подходы и методы для будущего применения мониторинга обрабатываемых земель в других регионах со сложным рельефом.

Сельскохозяйственные земли необходимы для выживания человека, обеспечивая основу для производства продуктов питания и играя критическую роль в поддержании экологического баланса и содействии устойчивому развитию [1,2]. Однако быстрая глобальная урбанизация и индустриализация усугубили потерю сельскохозяйственных земель из-за опустынивания, расширения городов и чрезмерной эксплуатации [3,4]. Это угрожает продовольственной безопасности и влияет на биоразнообразие, водные ресурсы и климатическую стабильность [5,6]. Эти проблемы особенно серьезны в горных регионах. Горные регионы покрывают около 24% площади суши Земли, обеспечивая проживание примерно 10% населения мира. Несмотря на такие проблемы, как крутой рельеф, эрозия почв и изменение климата, сельскохозяйственные земли в этих регионах имеют решающее значение для сельскохозяйственного производства [7]. Поэтому разработка эффективных и точных методов мониторинга сельскохозяйственных земель в этих районах имеет важное практическое значение.

В отличие от равнинных территорий с регулярными сельскохозяйственными участками, сельскохозяйственные земли в горных районах часто перемежаются лесами, кустарниками и скалами, что приводит к образованию сильно фрагментированных и неправильной формы участков. Этот сложный рельеф и разнообразная экологическая среда затрудняют применение традиционных методов наземного обследования и дистанционного зондирования.

Традиционные методы обследования обычно полагаются на ручные полевые работы, которые требуют много времени, трудоемки и подвержены человеческим ошибкам, что ограничивает возможность быстрого сбора точных данных в больших масштабах [8]. Например, первая национальная инвентаризация земель Китая, охватившая площадь около 9,6 млн км², заняла более десяти лет, с 1984 по 1997 год. В отличие от этого, вторая инвентаризация, в которой использовались технологии дистанционного зондирования, заняла всего два года (2007–2009) [9]. Хотя дистанционное зондирование значительно улучшило ситуацию по сравнению с ручными методами, проблемы остаются, особенно при работе с фрагментированными ландшафтами и участками неправильной формы в горных регионах. Традиционные методы классификации на основе пикселей или объектов часто не работают в таких районах. Методы на основе пикселей игнорируют пространственный контекст, что приводит к таким проблемам, как «один объект, разный спектр» или «разные объекты, одинаковый спектр» [10], в то время как методы на основе объектов зависят от параметров, задаваемых вручную, которые не очень подходят для разнообразного и изменчивого масштаба сельскохозяйственных земель в горных районах [11]. Таким образом, метод, который может точно выделять фрагментированные сельскохозяйственные земли без чрезмерной зависимости от ручного выбора признаков, остается насущной необходимостью.

Недавние достижения в области глубокого обучения значительно расширили возможности анализа изображений дистанционного зондирования, особенно для картографирования земного покрова [12,13], мониторинга стихийных бедствий [14,15] и обнаружения изменений [16,17]. Методы глубокого обучения, в частности сверточные нейронные сети (CNNs) [18], стали ведущим подходом к автоматизированному выделению сельскохозяйственных земель [19]. CNNs могут автоматически изучать и извлекать многоуровневые признаки изображений, такие как края, текстуры и спектральные свойства, часто обеспечивая более дискриминационные результаты, чем признаки, разработанные вручную. Эти методы обладают высокой адаптивностью, подстраиваясь под специфические задачи и данные, что делает их особенно эффективными для выделения сельскохозяйственных земель в различных наборах данных дистанционного зондирования. В настоящее время существует множество классических моделей CNN, таких как FCN [20], UNet [21], ResNet [22] и серия DeepLab [23]. Кроме того, в соответствующих исследованиях эти классические модели CNN были успешно применены для выделения сельскохозяйственных земель на снимках дистанционного зондирования с достижением определенных результатов [8,19].

Однако существующие универсальные модели компьютерного зрения не разработаны специально для спутниковых снимков, и их прямое применение к задаче выделения сельскохозяйственных земель на спутниковых изображениях часто приводит к неудовлетворительным результатам выделения, таким как неверная классификация краев, наличие отверстий и шум [24]. Эти проблемы особенно серьезны в горных районах, где сельскохозяйственные угодья имеют неправильную форму и фрагментированы. Существующие решения этих проблем обычно делятся на две категории: одна включает методы постобработки (такие как расширение, эрозия и сглаживание) для оптимизации морфологии и решения проблемы отверстий [25]; другая включает многозадачные параллельные сетевые структуры, где основная сеть отвечает за идентификацию сельскохозяйственных земель, а вспомогательные сети используются для обнаружения краев, при этом признаки краев объединяются с признаками сельскохозяйственных земель для направления процесса выделения [26,27]. Хотя эти методы успешно применяются на равнинной местности, они по-прежнему сталкиваются с трудностями в сложных горных условиях. Методам постобработки не хватает динамической адаптируемости, и они сильно полагаются на априорные знания, в то время как методы выделения, управляемые краями, зависят от точности определения границ, что трудно достичь в горных районах из-за сложной морфологии земель и размытых границ.

Чтобы решить проблемы выделения сельскохозяйственных земель в сложных горных районах, в этом исследовании предлагается новая каскадная модель глубокой нейронной сети — Cascade DeepLab Net. Эта модель отказывается от методов постобработки и стратегий, основанных на прогнозировании границ сельскохозяйственных земель. Вместо этого она применяет каскадный подход к уточнению, последовательно повышая точность выделения сельскохозяйственных земель путем объединения прогнозируемых результатов и окружающих признаков на основе результатов грубого прогнозирования, в конечном итоге достигая точного выделения. Модель Cascade DeepLab Net инновационно интегрирует модуль стилевой перекалибровки (SRM) и модуль пространственного внимания (SAM) в структуру DeepLabV3+, тем самым повышая общую точность распознавания сельскохозяйственных земель. Кроме того, модель включает модуль уточнения (RM) для дальнейшей оптимизации детальной морфологии результатов. Этот модуль, основанный на грубом прогнозировании, может уточнять выходные данные, комбинируя окружающие признаки и существующие результаты выделения сельскохозяйственных земель, без необходимости ручной настройки параметров или зависимости от информации о границах сельскохозяйственных земель. В определенной степени этот подход устраняет ограничения существующих методов в сложных горных условиях. В данной статье подробно описаны разработка, конкретная реализация и экспериментальная оценка модели, демонстрирующие ее значительные преимущества в условиях фрагментированных сельскохозяйственных угодий в горных районах.

2.1. Район исследования

Это исследование фокусируется на уезде Чжунсянь в муниципалитете Чунцин, Китай. Район исследования расположен в восточной части Чунцина и среднем и верхнем течении реки Янцзы, его координаты: 107°30′–108°06′ в.д. и 30°03′–30°33′ с.ш. Регион характеризуется теплым, влажным горным климатом в субтропической юго-восточной муссонной зоне, что благоприятно для сельского хозяйства (Рисунок 1). Рельеф в основном представлен холмами и низкими горами со значительными перепадами высот, в среднем от 200 до 800 м. Сельскохозяйственные земли в основном расположены в речных долинах, на равнинных участках и пологих склонах, отличаясь фрагментированностью и неправильной формой, характерными для горных регионов. Этот сложный рельеф и фрагментированное распределение земель создают трудности для идентификации земель, но также предоставляют отличную платформу для применения методов глубокого обучения в дистанционном зондировании для идентификации сельскохозяйственных угодий.

Рисунок 1. Карты географического расположения района исследования: (a) расположение района исследования на административной карте Китая; (b) цифровая модель рельефа (DEM) района исследования; (c) снимок дистанционного зондирования района исследования.

2.2. Данные и построение выборки

Из-за высокой стоимости приобретения субметровых мультиспектральных снимков дистанционного зондирования, в этом исследовании было решено использовать снимки высокого разрешения из Google Earth для минимизации расходов на получение данных. Google Earth предоставляет бесплатные, общедоступные снимки высокого разрешения дистанционного зондирования для большей части мира, полученные из различных источников, включая серии Landsat и Sentinel, коммерческий спутник QuickBird и аэрофотосъемку [28]. Снимки в густонаселенных городах или критически важных регионах обновляются часто, как правило, каждые один-три года, в то время как в отдаленных районах обновления происходят реже, в зависимости от источника данных и орбиты спутника. Например, снимки Landsat обновляются каждые 16 дней, в то время как Sentinel-2 обеспечивает обновления каждые пять дней. Коммерческие спутники обеспечивают еще более частое обновление, предоставляя снимки высокого разрешения практически в реальном времени. Учитывая, что большая часть сельскохозяйственных земель в юго-западном Китае расположена в населенных районах, высокое разрешение и частота обновления снимков в этом регионе хорошо соответствуют потребностям данного исследования.

Спутниковые снимки района исследования были получены из Google Earth на 18-м уровне детализации, содержат три канала RGB с пространственным разрешением около 0,54 м, что идеально подходит для выделения сельскохозяйственных земель. Данные были получены с использованием открытой геоинформационной системы QGIS (3.26), QGIS (3.26) можно загрузить по ссылке https://www.qgis.org/download/ (доступ 1 января 2025 г.), а спутниковые снимки были загружены и экспортированы с помощью плагина QuickMapServices (можно загрузить по ссылке https://github.com/nextgis/quickmapservices, доступ 1 января 2025 г.). Из-за облачной и дождливой погоды в этом районе снимки были объединены с использованием нескольких временных рядов с августа 2021 года по август 2022 года. После маркировки и очистки набор данных состоял из 40 листов, каждый размером 1000 × 1000 пикселей. Учитывая аппаратные ограничения, сжатие и кадрирование данных были необходимы. Мы нарезали данные на фрагменты размером 256 × 256 пикселей с коэффициентом перекрытия 0,3. Чтобы обеспечить высокое качество образцов, мы исключили те, которые имели более 80% фона или 100% сельскохозяйственных земель, используя гистограммы для балансировки положительных и отрицательных образцов. Для поддержания разнообразия выборки мы применили методы увеличения данных, такие как переворот, случайное вращение и случайное изменение цвета. В итоге мы получили 23 251 фрагмент выборки, из которых 80% использовались для обучения и 20% для валидации. Некоторые образцы показаны на Рисунке 2.

Рисунок 2. Отображение некоторых образцов.

2.3. Методология

В этом исследовании была предложена сеть Cascade DeepLab Net для повышения точности выделения сельскохозяйственных земель. Структура основана на модели DeepLabV3+ от Google, известной своим эффективным захватом многомасштабной контекстной информации и высокой производительностью. Использование архитектуры кодировщика-декодировщика идеально подходит для задач обработки изображений дистанционного зондирования. Структура сети состоит из трех основных компонентов: кодировщика, декодировщика и уточнителя, как показано на Рисунке 3.

Рисунок 3. Структура Cascade DeepLab Net.

Во-первых, кодировщик использует Xception в качестве магистральной сети для извлечения признаков, за которой следует модуль ASPP (Atrous Spatial Pyramid Pooling) для захвата более богатой многомасштабной информации для более детального извлечения признаков. SRM внутри модуля ASPP улучшает фокусировку сети и интеграцию многомасштабной информации. Во-вторых, модуль декодировщика объединяет признаки высокого и низкого уровня и включает модуль пространственного внимания, позволяющий модели концентрироваться на важных признаках, таких как местоположение и текстура сельскохозяйственных земель. Затем начальная маска результата генерируется с использованием заголовка классификации.

Для дальнейшей оптимизации результатов сегментации мы внедряем RM, предложенный Ченгом в 2020 году на CVPR, для уточнения результатов сегментации. Начальная маска результата объединяется со снимком дистанционного зондирования в качестве входных данных, при этом размер входного канала остается постоянным путем копирования входной маски. На первом каскадном уровне RM уточняет сегментацию, причем один входной канал заменяется линейно увеличенным выходным результатом, и этот процесс повторяется до последнего уровня. Такая конструкция позволяет сети постепенно исправлять ошибки сегментации, сохраняя при этом начальные детали. Многоступенчатая обработка эффективно улучшает выделенную морфологию сельскохозяйственных земель. Кроме того, гибридная функция потерь контролирует процесс выделения, повышая точность и устойчивость модели путем совместного контроля результатов сегментации на разных этапах.

2.3.1. DeepLabV3+

DeepLabV3+ — это передовая модель семантической сегментации, разработанная Google для точной сегментации изображений [29]. Она улучшает DeepLabV3, включая структуру кодировщика-декодировщика для более эффективного захвата пространственной и семантической информации. Кодировщик использует глубокую сверточную нейронную сеть для извлечения признаков и применяет расширенную (atrous) свертку для захвата многомасштабной контекстной информации. Декодировщик достигает высокого разрешения предсказаний путем поэтапного повышения дискретизации и объединения признаков низкого уровня для точного определения границ объектов.

Эффективная семантическая сегментация DeepLabV3+ особенно полезна для выделения сельскохозяйственных земель на спутниковых или аэрофотоснимках. Она идентифицирует и сегментирует границы сельскохозяйственных угодий, используя многомасштабное извлечение признаков и расширенную свертку, сохраняя при этом вычислительную эффективность. Точное повышение дискретизации декодировщика обеспечивает точное отображение границ сельскохозяйственных угодий. Несмотря на свою высокую производительность, DeepLabV3+ имеет недостатки в выделении деталей сельскохозяйственных земель с размытыми границами или сложной формой, что приводит к недостаточной точности в некоторых областях [11]. Это исследование направлено на устранение этих ограничений для повышения эффективности модели в выделении фрагментированных сельскохозяйственных земель. Структура сети показана на Рисунке 4.

Рисунок 4. Структура сети DeepLabV3+.

2.3.2. Модуль стилевой перекалибровки (SRM)

Модуль стилевой перекалибровки (SRM) — это передовой метод нейронных сетей, который улучшает возможности представления признаков сверточных нейронных сетей (CNN) [30]. SRM повышает дискриминационную способность модели путем перекалибровки отклика каждого канала признаков и интеграции информации о стиле в процесс извлечения признаков. В частности, SRM вводит адаптивный механизм для регулировки весов каналов на основе характеристик входных данных, включая глобальное среднее объединение, межканальные корреляции и нелинейные функции активации. Эта динамическая регулировка распределения карт признаков позволяет SRM более эффективно захватывать и использовать критическую информацию из входных изображений, повышая производительность в различных задачах компьютерного зрения. Структура модуля показана на Рисунке 5.

Рисунок 5. Структура модуля стилевой перекалибровки (SRM).

Для выделения сельскохозяйственных земель требуется точно идентифицировать и сегментировать области сельскохозяйственных угодий на снимках дистанционного зондирования, что требует от модели высоких способностей к извлечению признаков и их различению. Благодаря SRM модель адаптивно регулирует веса каналов признаков, чтобы усилить представление признаков, связанных с сельскохозяйственными землями, одновременно подавляя фоновые и шумовые помехи. SRM динамически регулирует распределение карт признаков с помощью глобального среднего объединения, межканальных корреляций и нелинейных функций активации, улучшая агрегацию и обработку многомасштабной информации. Эта адаптивная калибровка повышает гибкость и устойчивость представления признаков, поддерживая высокую точность в сложных условиях. Поэтому включение SRM значительно повышает эффективность выделения сельскохозяйственных земель.

2.3.3. Модуль пространственного внимания (SAM)

Модуль пространственного внимания (SAM) — это широко используемый метод в глубоком обучении, особенно в компьютерном зрении, предназначенный для улучшения извлечения признаков путем присвоения различных весов внимания в пространственном измерении [31]. Основная идея заключается в повышении способности модели распознавать и локализовать целевые объекты путем изучения важности каждой позиции на входной карте признаков, выделяя ключевые области и подавляя нерелевантный фон. SAM обычно использует операции свертки для вычисления оценки важности каждого местоположения на карте признаков, генерируя улучшенную карту признаков путем взвешенного слияния с исходной картой признаков. Этот механизм значительно улучшает производительность и устойчивость модели, а также обеспечивает более интуитивно понятную интерпретацию, делая процесс принятия решений более прозрачным. Исследования показывают, что механизмы пространственного внимания превосходно работают в различных задачах визуального анализа, таких как классификация изображений, обнаружение объектов и сегментация изображений, что подтверждает их эффективность и широкую применимость. Структура модуля показана на Рисунке 6.

Рисунок 6. Структура модуля пространственного внимания (SAM).

Использование SAM для извлечения информации о сельскохозяйственных землях из RGB-снимков дистанционного зондирования очень эффективно. Снимки дистанционного зондирования обычно содержат сложную и богатую деталями информацию о земной поверхности, и отображение сельскохозяйственных угодий может различаться из-за разных условий освещения, растительного покрова, типов почв и других факторов. Внедрение SAM повышает способность модели распознавать признаки сельскохозяйственных земель в разных пространственных местоположениях. В частности, SAM может автоматически изучать и выделять области на изображении, связанные с сельскохозяйственными землями, одновременно подавляя фоновые помехи и другие посторонние области. SAM также решает проблемы вариативности масштаба и сложности рельефа, часто встречающиеся на снимках дистанционного зондирования. Адаптивно регулируя веса внимания, модель может более гибко обрабатывать области сельскохозяйственных угодий разного масштаба и сложный рельеф, что имеет решающее значение для выделения фрагментированных сельскохозяйственных земель в горных районах.

2.3.4. Модуль уточнения (RM)

Модуль уточнения (RM), предложенный на CVPR2020, предназначен для повышения точности сегментации изображений [32]. Его основная концепция заключается в уточнении и оптимизации предварительных результатов сегментации путем слияния признаков из изображения и грубой маски через многомасштабное слияние признаков. RM соединяет изображение с предварительно сгенерированной маской и извлекает многомасштабные признаки с помощью пирамидального объединения. Затем эти признаки объединяются для создания масок сегментации разного разрешения. RM интегрирует эти маски, комбинируя информацию из каждого масштаба, и вносит предварительные коррекции слияния для получения уточненной маски. Структура модуля показана на Рисунке 7.

Рисунок 7. Структура модуля уточнения (RM), принимающего на вход сегментацию трех уровней для уточнения сегментации с разными шагами выходного сигнала (OS) в разных ветвях.

Внедрение RM имеет ключевое значение для задачи выделения сельскохозяйственных земель. Морфология и края сельскохозяйственных угодий имеют первостепенное значение, особенно в горных и фрагментированных районах, где формы земель неправильны, а края размыты. Традиционные методы сегментации с трудом справляются с такой сложностью. RM значительно повышает точность распознавания морфологии и краев сельскохозяйственных земель благодаря многомасштабному слиянию и уточнению признаков. Обрабатывая изображение и предварительную маску сегментации на нескольких уровнях, RM захватывает более богатую пространственную и текстурную информацию, повышая точность локализации краев и уменьшая размытость границ.

2.3.5. Метрики оценки

Для оценки производительности модели в задаче выделения сельскохозяйственных земель мы выбрали несколько метрик точности, обычно используемых в семантической сегментации: общую точность (OA), пересечение по объединению (IoU) и F1-меру. OA измеряет глобальную точность классификации пикселей, рассчитываемую как отношение правильно классифицированных пикселей к общему количеству пикселей. Однако в случаях дисбаланса классов одной OA может быть недостаточно. Например, если несельскохозяйственные области значительно превосходят по площади сельскохозяйственные, высокая OA может в основном отражать правильную классификацию несельскохозяйственных областей, игнорируя сельскохозяйственные. Таким образом, для всесторонней оценки производительности модели необходимы дополнительные метрики; IoU количественно определяет перекрытие между предсказанной и фактической сегментацией. Более высокий IoU указывает на лучшее перекрытие между предсказанными и фактическими областями сельскохозяйственных земель, предлагая точную меру точности сегментации модели. Более того, IoU устойчив к дисбалансу данных и обеспечивает объективную оценку производительности, даже когда размеры выборок сельскохозяйственных и несельскохозяйственных земель значительно различаются; F1-мера является средним гармоническим между полнотой и точностью. Точность измеряет долю предсказанных областей сельскохозяйственных земель, которые классифицированы правильно, в то время как полнота показывает долю фактических сельскохозяйственных земель, правильно идентифицированных. В идеале мы хотим, чтобы модель точно идентифицировала все сельскохозяйственные земли (высокая полнота) и минимизировала ошибочную классификацию несельскохозяйственных земель как сельскохозяйственных (высокая точность). F1-мера обеспечивает оптимальный баланс между ними, причем более высокие значения указывают на лучший компромисс между точностью и полнотой. Эти метрики обеспечивают всестороннюю оценку производительности модели, отражая ее точность, надежность и согласованность с разных точек зрения. Формулы для расчета этих метрик следующие:

где TP, FP, FN и TN — количество истинно положительных, ложноположительных, ложноотрицательных и истинно отрицательных результатов соответственно.

2.4. Экспериментальная среда и параметры

Код для этого исследования написан на Python 3.9 и реализован с использованием PyTorch версии 2.1. Аппаратная конфигурация включает графический процессор NVIDIA RTX 4090 с 24 ГБ видеопамяти и центральный процессор Intel Core i9-12900K с 64 ГБ оперативной памяти. Для обучения модели в качестве функции активации был выбран ReLU, веса инициализировались с использованием метода He-Normal, и был применен dropout для уменьшения переобучения. Гиперпараметры поддерживались постоянными на протяжении всего процесса обучения с размером пакета 32, 100 эпохами и 3 входными каналами. Используемая функция потерь — бинарная перекрестная энтропия. Оптимизатором является стохастический градиентный спуск (SGD) с начальной скоростью обучения 0,01, параметром импульса 0,9 и коэффициентом затухания весов 0,005. Для повышения эффективности обучения модели и ускорения сходимости используется стратегия регулировки скорости обучения с помощью полиномиального затухания (Polynomial Decay) с показателем степени 0,9. Кроме того, сравнительные модели реализованы с использованием фреймворка MMSegmentation, который предлагает различные распространенные модели сегментации и алгоритмы для сравнения моделей и оценки производительности.

3.1. Сравнение различных методов: количественный анализ

Чтобы оценить эффективность нашего предложенного метода, мы провели сравнительные эксперименты с широко используемыми методами выделения сельскохозяйственных земель, а именно UNet, PSPNet и DeepLabV3+. UNet использует структуру кодировщика-декодировщика для захвата многомасштабной информации о признаках, что делает ее подходящей для изображений с богатыми деталями. PSPNet захватывает глобальную многомасштабную контекстную информацию через модуль пирамидального объединения, хорошо работая на сложных фонах с изменяющимися размерами объектов. DeepLabV3+ объединяет расширенную свертку со структурой кодировщика-декодировщика, преуспевая в восстановлении деталей и обработке границ. Все модели обучались с одинаковыми параметрами: размер пакета 12, 100 эпох и оптимизатор SGD.

Как показано в Таблице 1, UNet показала наихудшие результаты из четырех методов. DeepLabV3+ немного превзошла UNet и PSPNet благодаря комбинации расширенной свертки и модуля ASPP, что улучшило извлечение признаков, особенно для объектов разного масштаба. Простая структура кодировщика-декодировщика UNet привела к плохому восстановлению деталей, размытым границам и более выраженному «эффекту пикселизации». PSPNet улучшил захват многомасштабной контекстной информации с помощью модуля пирамидального объединения, но все еще испытывал трудности с обработкой деталей. Наш предложенный метод превзошел все другие методы по всем показателям. Этот успех объясняется тем, что модуль ASPP захватывает многомасштабную информацию, SRM улучшает агрегацию и обработку различных масштабов, а модуль пространственного внимания фокусируется на признаках местоположения и текстуры. Кроме того, RM захватывает структурную информацию и информацию о границах разных уровней, связывая несовершенные маски сегментации и адаптивно объединяя многомасштабные признаки, что приводит к значительному улучшению точности сегментации и обработки границ.

Таблица 1. Сравнение точности различных методов.

3.2. Сравнение различных методов: качественный анализ

Чтобы дополнительно оценить эффективность этих четырех методов, мы сравнили их в пяти типичных сценах сельскохозяйственных угодий (Рисунок 8): простая однородная сцена (a); сцена, смешанная с водным объектом (b); сцена с множеством объектов, таких как жилые постройки, дороги и мульча (c); смешение различных стилей обрабатываемых и необрабатываемых земель (d); и фрагментированная, сложная сцена сельскохозяйственных угодий (e).

Рисунок 8. Сравнение результатов выделения различными методами на тестовой территории. (a) иллюстрирует простой однородный ландшафт, (b) изображает сценарий, характеризующийся сосуществованием водных объектов и сельскохозяйственных земель, (c) представляет сложную и разнообразную сцену, (d) демонстрирует мозаику различных сельскохозяйственных укладов, а (e) представляет собой сложную фрагментированную и неоднородную среду.

В группе a, простой однородной сцене, все модели показали хорошую сегментацию, но испытывали трудности с узкими дорогами между полями. UNet продемонстрировала более выраженную «пикселизацию». Наша модель обеспечила полную сегментацию, четкие дороги и минимальную «пикселизацию». В группе b UNet часто пропускала или неправильно классифицировала границы между водными объектами и сельскохозяйственными землями, в то время как PSPNet и DeepLabV3+ немного улучшили обработку границ, но все еще имели неверные классификации. Наша модель точно дифференцировала водные объекты от сельскохозяйственных земель, уменьшая количество неверных классификаций. В группе c, сложных сценах, UNet и PSPNet ошибочно классифицировали несельскохозяйственные земли как сельскохозяйственные. DeepLabV3+ улучшила этот аспект, но все еще имела фрагментированные неверные классификации. Наша модель превосходно проявила себя в детальной точности. В группе d, со смешанными стилями сельскохозяйственных земель, UNet и DeepLabV3+ привели к усилению «пикселизации» и пропуску обнаружения. Наша модель улучшила идентификацию земель и эффективно подавила «пикселизацию». В группе e, очень фрагментированных и сложных сценах, UNet, PSPNet и DeepLabV3+ показали сильную «пикселизацию», неверную классификацию и плохую обработку деталей. Наша модель лучше распознала общую морфологию и детали с четкими краями.

В целом, UNet страдает от размытости и «пикселизации» на границах и деталях из-за своей структуры кодировщика-декодировщика. PSPNet и DeepLabV3+ в некоторой степени смягчают эту проблему с помощью пирамидального объединения и расширенной свертки, но им все еще не хватает детализации. Наша модель улучшает детализацию границ, используя модуль ASPP и SRM. В сложных сценах UNet и PSPNet испытывают трудности с многомасштабным слиянием признаков, что приводит к плохой дифференциации признаков. DeepLabV3+ улучшает многомасштабные признаки с помощью расширенной свертки, но все еще нуждается в лучшей обработке деталей и границ. Наша модель улучшает адаптивность и точность сегментации в сложных сценах за счет внедрения SAM и RM. Различение различных стилей сельскохозяйственных земель, таких как пары и периоды выращивания, требует сильного представления признаков и захвата многомасштабной информации. Наша модель улучшает эту дифференциацию, объединяя признаки высокого и низкого уровня с помощью SAM и SRM. Для фрагментированных и сложных сельскохозяйственных земель решающее значение имеет точный захват структурной информации и информации о границах разных уровней. UNet и PSPNet показывают здесь низкие результаты, в то время как DeepLabV3+ демонстрирует улучшенную производительность. Наша модель уточняет результаты сегментации с помощью RM, эффективно идентифицируя общую морфологию и детали сложных сельскохозяйственных угодий. Таким образом, наша модель обеспечивает лучшую сегментацию и обработку деталей в сложных сценариях, значительно повышая точность и надежность выделения сельскохозяйственных земель в горных районах.

3.3. Валидация механизма улучшения

Для проверки наших улучшений мы провели абляционные эксперименты. Используя DeepLabV3+ в качестве базовой линии, мы сначала добавили SRM на этап кодирования, создав метод D1. Затем мы добавили SAM на этап декодирования D1, получив метод D2. Наконец, мы добавили RM к D2, получив метод, используемый в этом исследовании.

Таблица 2 показывает результаты абляционных экспериментов. Рисунок 9 сравнивает детали результатов выделения от разных модулей. Каждая строка показывает результаты сегментации для определенной области при применении разных модулей. Поскольку во всех экспериментах используется одна и та же магистральная сеть, общие результаты сегментации относительно схожи. Однако производительность различных модулей различается в более сложных областях, таких как размытые края или рассеянный кустарник на сельскохозяйственных землях. Когда SRM добавляется к базовой модели, общая производительность значительно улучшается: OA, IoU и F1-мера увеличиваются на 1,27%, 1,53% и 1,28% соответственно. Как показано на изображениях, SRM помогает подавлять фоновый шум, особенно в сложных условиях, и улучшает разделение между фоном и объектом. Кроме того, SRM улучшает обработку многомасштабной информации, позволяя модели более точно извлекать признаки сельскохозяйственных земель в сложных сценах и адаптироваться к изменениям масштаба. После включения SAM в модель D1 показатели OA, IoU и F1-меры увеличиваются на 0,67%, 0,92% и 0,82% соответственно. Фокусируясь на конкретных признаках местоположения и текстуры, SAM улучшает производительность модели в регионах с более выраженными текстурами, что демонстрируют результаты выделения D2 для региона d на Рисунке 9. Наконец, добавление RM к модели D2 приводит к существенному улучшению общей производительности: показатели OA, IoU и F1-меры возрастают на 3,52%, 3,56% и 3,06% соответственно. RM особенно эффективен в оптимизации деталей, особенно в обработке границ и мелкой фрагментации. Как показано на изображениях, RM хорошо работает в оптимизации обработки границ и мелкой фрагментации и значительно повышает точность сегментации. Он эффективно заполняет детали, которые недостаточно обработаны другими модулями, тем самым повышая общую точность и надежность результатов сегментации.

Рисунок 9. Результаты выделения сельскохозяйственных земель при сравнении различных модулей. (a–d) изображают четыре различных сценария сельскохозяйственных земель, каждый иллюстрирует разную степень фрагментации.

Таблица 2. Результаты валидации эффективности улучшенного метода.

Абляционные эксперименты демонстрируют, что постепенное добавление SRM, SAM и RM значительно повышает производительность модели. Каждый модуль играет ключевую роль в обработке многомасштабной информации, слиянии признаков, обработке деталей и уточнении границ, что приводит к созданию Cascade DeepLab Net, которая превосходит базовую модель DeepLabV3+.

3.4. Эффект оптимизации морфологии фрагментированных сельскохозяйственных земель

Для дальнейшей проверки выдающейся производительности нашей улучшенной модели в оптимизации морфологии фрагментированных сельскохозяйственных земель мы выбрали изображение, которое никогда не участвовало в процессе обучения, в качестве ключевого проверочного образца. На Рисунке 10 представлены результаты выделения, полученные нашей улучшенной моделью, а на Рисунке 11 показано наложение результатов выделения базовой модели (Deeplabv3+) и улучшенной модели (наша). В целом, сравнивая базовую модель с улучшенной и накладывая их результаты выделения, становится очевидным, что улучшенная модель эффективно решает такие проблемы, как фрагментированные участки и размытые края, которые существуют в базовой модели. Тем временем мы дополнительно показываем детали модели в трех регионах (Рисунок 12), где результаты выделения демонстрируют значительные различия, а именно регионы a, b и c.

Рисунок 10. Результаты выделения сельскохозяйственных земель улучшенной моделью. Красная рамка очерчивает область сельскохозяйственных земель, выделенную улучшенной моделью.

Рисунок 11. Наложенное отображение результатов выделения сельскохозяйственных земель базовой модели (DeepLabV3+) и улучшенной модели. В областях a, b и c различия между улучшенной моделью и базовой моделью (DeepLabV3+) заметно очевидны.

Рисунок 12. Детальное представление результатов выделения сельскохозяйственных земель для базовой модели (DeepLabV3+) и улучшенной модели. В областях (a–c) различия между улучшенной моделью и базовой моделью (DeepLabV3+) заметно очевидны. Красная рамка очерчивает область сельскохозяйственных земель, выделенную моделью, желтые кружки выделяют области, где различия особенно заметны.

Как показано на Рисунке 12, регионы a, b и c характеризуются сложным рельефом, где сельскохозяйственные земли перемежаются с лесными угодьями и другими типами земель. В результатах выделения базовой модели (DeeplabV3+) в этих регионах неточные границы сельскохозяйственных земель встречаются довольно часто. Например, на террасных полях в регионе a результат выделения имеет ступенчатый вид; вокруг деревень в регионе b наблюдается смещение в определении сельскохозяйственных земель; а на стыке сельскохозяйственных земель и лесов в регионе c их граница смешивается с границей других типов земель. Эти проблемы в определенной степени повлияли на точность и целостность морфологии сельскохозяйственных земель, что привело к неточной статистике площади сельскохозяйственных угодий и более фрагментированной выделенной морфологии по сравнению с реальной.

В отличие от этого, наш улучшенный метод демонстрирует явные преимущества в этих трех регионах. Для сельскохозяйственных земель на сложном рельефе, таком как террасные поля, результат выделения нашего улучшенного метода (наша модель) имеет более гладкий край, который может точно соответствовать фактической границе и лучше передавать ощущение иерархичности и непрерывности. В регионе b, где деревни и сельскохозяйственные земли перемежаются, этот метод может полностью обнаружить небольшие участки огородов и другие сельскохозяйственные земли, избегая пропусков и делая общую площадь сельскохозяйственных земель ближе к фактическому значению. В зоне пересечения сельскохозяйственных земель и лесов в регионе c улучшенный метод уделяет больше внимания ключевым характерным областям сельскохозяйственных земель, преодолевает растительные помехи, точно разделяет границу между сельскохозяйственными и лесными угодьями, сохраняет связность морфологии узких и длинных сельскохозяйственных угодий, избегает ошибочной идентификации лесных угодий и разрыва узких и длинных сельскохозяйственных угодий, и делает результат выделения площади сельскохозяйственных земель более соответствующим реальной ситуации со значительно сниженным уровнем ошибок.

Таким образом, наш улучшенный метод отлично работает в оптимизации морфологии фрагментированных сельскохозяйственных земель в горных регионах, достигая заметных улучшений в общей точности, морфологической целостности и возможностях обработки деталей.

4.1. Возможная ценность этого исследования

Это исследование было сфокусировано на горном регионе южного Китая, используя спутниковые снимки высокого разрешения для точного выделения информации о сельскохозяйственных землях на сложном рельефе. В отличие от методов сбора данных с помощью БПЛА [33], в этом исследовании используются спутниковые снимки для масштабного выделения земель, что обеспечивает более широкий потенциал применения. Предыдущие исследования повышали точность выделения сельскохозяйственных земель путем разработки функций потерь комбинированного типа с усилением краев и ограничениями, а также внедрения механизмов поляризованного самовнимания [26,34]. Хотя эти методы достигли высокой точности, они в основном применялись на равнинных территориях. В нашем исследовании мы улучшили DeepLabV3+, интегрировав SAM, SRM и каскадный RM, повысив точность модели для выделения сельскохозяйственных земель на сложном рельефе. Используя нашу улучшенную модель со спутниковыми данными высокого разрешения, мы достигли OA 92,33% и IoU 82,51% при выделении сельскохозяйственных земель. Наши результаты по сравнению с результатами других исследований [26,34] показывают незначительные различия в производительности, главным образом из-за уникальных характеристик нашего района исследования. В то время как другие исследования были сосредоточены на равнинах, наша работа направлена на решение проблем сложного рельефа южного горного региона. Несмотря на несколько более низкую точность, наши результаты остаются сопоставимыми и демонстрируют отличную применимость в конкретных сценариях.

4.2. Комбинированные эффекты объема параметров методологии

Как показано в Таблице 3, предложенная в этом исследовании модель Cascade DeepLab Net имеет количество параметров 129,26 млн, что значительно выше, чем у классических архитектур, таких как UNet, PSPNet и DeepLabV3+. Однако, как показано в Таблице 4, основные компоненты — SRM [35] и SAM [36] — остаются легковесными, каждый с менее чем 1 млн параметров, что предполагает, что увеличение параметров в основном происходит за счет RM. Это связано с двумя структурными факторами: во-первых, RM включает независимую магистральную сеть для реконструкции признаков [37]; во-вторых, для улучшения детальной идентификации границ сельскохозяйственных земель мы приняли трехуровневую итеративную архитектуру RM. Хотя такая конструкция увеличивает сложность модели, как показано в Таблице 2 и на Рисунке 11, RM играет решающую роль в обнаружении фрагментированных сельскохозяйственных земель в горных районах [38]. Его внедрение привело к улучшению метрики IoU более чем на 3%, значительно повысив распознавание сельскохозяйственных земель. Это повышение точности особенно важно в мониторинге продовольственной безопасности, где даже улучшение на 3% может представлять десятки тысяч гектаров упущенных из виду сельскохозяйственных угодий. Кроме того, учитывая распространенность фрагментированных мелких участков в горных регионах, увеличение затрат на параметры оправдано практической потребностью в детальном мониторинге сельскохозяйственных земель.

Таблица 3. Количество параметров различных моделей.

Таблица 4. Количество параметров различных модулей.

Однако следует отметить, что SRM/SAM достигают прироста точности почти на 2% с менее чем 1 млн параметров, что выявляет дисбаланс в эффективности параметров внутри модели. Это подчеркивает две ключевые области для оптимизации в будущих исследованиях: (i) сокращение избыточных параметров в RM с использованием легковесных методов, таких как разделяемые по глубине свертки, и (ii) разработка динамического механизма вывода, который регулирует количество итераций RM на основе пространственной сложности изображения. В однородных областях, таких как равнины, например, сокращение вычислительных слоев RM может значительно снизить вычислительную нагрузку. Эти стратегии оптимизации будут в центре внимания следующего этапа наших исследований.

4.3. Ограничения текущего исследования

В этом исследовании основное внимание уделяется выделению сельскохозяйственных земель в горных регионах с использованием снимков дистанционного зондирования высокого разрешения за один временной период. Однако метод сталкивается со значительными проблемами в практическом применении из-за сложности горной экологической среды. В этих районах сельскохозяйственные угодья, кустарники, леса и другие объекты перемежаются, а их спектральные характеристики сходны [39]. Эта проблема особенно остро стоит, когда сельскохозяйственные культуры бурно растут, что затрудняет их отличие от других типов земельного покрова на снимках, полученных в один временной период. Кроме того, распространено смешанное земледелие, когда на одном участке часто выращивается несколько культур [40]. Это приводит к неравномерности спектральных признаков, что еще больше усложняет точность классификации снимков дистанционного зондирования. Использование только снимков за один временной период, особенно в межсезонье, когда фенология культур менее выражена, а спектральные различия минимальны, значительно снижает точность классификации [41]. Поэтому современные методы сильно зависят от времени получения снимков.

Чтобы решить эти проблемы, будущие исследования должны включать многопериодные снимки дистанционного зондирования и интегрировать данные о фенологии сельскохозяйственных культур. Используя спектральные изменения в разные сезоны и на разных стадиях роста культур, можно повысить точность выделения сельскохозяйственных земель. Учитывая частую облачность и дождливые условия в юго-западном Китае, будущие исследования также должны изучить слияние данных из нескольких источников, особенно с использованием данных синтезированной апертуры радара (SAR). Поляризационные характеристики и интерференционная информация SAR могут помочь различать различные типы растительности, тем самым повышая точность выделения сельскохозяйственных земель даже в неблагоприятных погодных условиях.

В этом исследовании мы разработали и оценили модель Cascade DeepLab Net для точного выделения фрагментированных сельскохозяйственных земель в горных районах. Интегрируя модуль стилевой перекалибровки (SRM), модуль пространственного внимания (SAM) и модуль уточнения (RM) в архитектуру DeepLabV3+, наша модель решает ключевые проблемы, такие как неправильная морфология земель, нечеткие границы и фрагментация, характерные для таких территорий. Экспериментальные результаты демонстрируют, что Cascade DeepLab Net превосходит традиционные модели, такие как UNet, PSPNet и DeepLabV3+, как в количественных метриках (общая точность, пересечение по объединению и F1-мера), так и в качественных оценках, достигая общей точности 92,33%, IoU 82,51% и F1-меры 91,77%. Значительное улучшение модели в точности границ и четкости сегментации, а также ее способность справляться со сложными и фрагментированными структурами земель делает ее очень подходящей для применения в дистанционном зондировании для мониторинга сельскохозяйственных земель, особенно в горных районах. Несмотря на свои преимущества, остаются такие проблемы, как зависимость от снимков высокого разрешения и необходимость в многопериодных данных для точного учета фенологии культур. Будущие исследования должны быть направлены на слияние данных из нескольких источников, в частности на включение снимков синтезированной апертуры радара (SAR), для повышения устойчивости модели в различных условиях окружающей среды. Эта работа не только способствует более точному мониторингу земель в горных регионах, но и закладывает основу для дальнейшего развития методов выделения сельскохозяйственных угодий, особенно в областях, где традиционные методы неэффективны.

1. Fan, J.; Wang, L.; Qin, J.; Zhang, F.; Xu, Y. Evaluating cultivated land stability during the growing season based on precipitation in the Horqin Sandy Land, China. J. Environ. Manag. 2020, 276, 111269. [Google Scholar] [CrossRef] [PubMed]

2. Pang, X.; Xie, B.; Lu, R.; Zhang, X.; Xie, J.; Wei, S. Spatial–Temporal Differentiation and Driving Factors of Cultivated Land Use Transition in Sino–Vietnamese Border Areas. Land 2024, 13, 165. [Google Scholar] [CrossRef]

3. Li, M.; Li, J.; Haq, S.U.; Nadeem, M. Agriculture land use transformation: A threat to sustainable food production systems, rural food security, and farmer well-being? PLoS ONE 2024, 19, e0296332. [Google Scholar] [CrossRef] [PubMed]

4. Wang, Y.; Lopez-Carr, D.; Gong, J.; Gao, J. Editorial: Sustainable cultivated land use and management. Front. Environ. Sci. 2023, 11, 1162769. [Google Scholar] [CrossRef]

5. Guo, X.N.; Chen, R.Q.; Li, Q.; Su, W.C.; Liu, M.; Pan, Z.Z. Processes, mechanisms, and impacts of land degradation in the IPBES Thematic Assessment. Acta Ecol. Sin. 2019, 39, 6567–6575. [Google Scholar] [CrossRef]

6. The Intergovernmental Panel on Climate Change. Special Report: Special Report on Climate Change and Land. IPCC Website. 2019. Available online: https://www.ipcc.ch/srccl/ (accessed on 1 January 2025).

7. Liang, X.; Jin, X.; Yang, X.; Xu, W.; Lin, J.; Zhou, Y. Exploring cultivated land evolution in mountainous areas of Southwest China, an empirical study of developments since the 1980s. Land Degrad. Dev. 2021, 32, 546–558. [Google Scholar] [CrossRef]

8. Miao, L.; Li, X.; Zhou, X.; Yao, L.; Deng, Y.; Hang, T.; Zhou, Y.; Yang, H. SNUNet3+: A Full-Scale Connected Siamese Network and a Dataset for Cultivated Land Change Detection in High-Resolution Remote-Sensing Images. IEEE Trans. Geosci. Remote Sens. 2024, 62, 4400818. [Google Scholar] [CrossRef]

9. Chen, X.; Yu, L.; Du, Z.; Liu, Z.; Qi, Y.; Liu, T.; Gong, P. Toward sustainable land use in China: A perspective on China’s national land surveys. Land Use Policy 2022, 123, 106428. [Google Scholar] [CrossRef]

10. Rapinel, S.; Clément, B.; Magnanon, S.; Sellin, V.; Hubert-Moy, L. Identification and mapping of natural vegetation on a coastal site using a Worldview-2 satellite image. J. Environ. Manag. 2014, 144, 236–246. [Google Scholar] [CrossRef] [PubMed]

11. Cao, Q.; Li, M.; Yang, G.; Tao, Q.; Luo, Y.; Wang, R.; Chen, P. Urban Vegetation Classification for Unmanned Aerial Vehicle Remote Sensing Combining Feature Engineering and Improved DeepLabV3+. Forests 2024, 15, 382. [Google Scholar] [CrossRef]

12. Storie, C.D.; Henry, C.J. Deep learning neural networks for land use land cover mapping. In Proceedings of the IGARSS 2018—2018 IEEE International Geoscience and Remote Sensing Symposium, Valencia, Spain, 22–27 July 2018; pp. 3445–3448. [Google Scholar]

13. Šćepanović, S.; Antropov, O.; Laurila, P.; Rauste, Y.; Ignatenko, V.; Praks, J. Wide-area land cover mapping with Sentinel-1 imagery using deep learning semantic segmentation models. IEEE J. Sel. Top. Appl. Earth Obs. Remote Sens. 2021, 14, 10357–10374. [Google Scholar] [CrossRef]

14. Wiguna, S.; Adriano, B.; Mas, E.; Koshimura, S. Evaluation of deep learning models for building damage mapping in emergency response settings. IEEE J. Sel. Top. Appl. Earth Obs. Remote Sens. 2024, 17, 5651–5667. [Google Scholar] [CrossRef]

15. Cheng, G.; Wang, Z.; Huang, C.; Yang, Y.; Hu, J.; Yan, X.; Tan, Y.; Liao, L.; Zhou, X.; Li, Y. Advances in Deep Learning Recognition of Landslides Based on Remote Sensing Images. Remote Sens. 2024, 16, 1787. [Google Scholar] [CrossRef]

16. Dahiya, N.; Singh, G.; Gupta, D.K.; Kalogeropoulos, K.; Detsikas, S.E.; Petropoulos, G.P.; Singh, S.; Sood, V. A novel Deep Learning Change Detection approach for estimating Spatiotemporal Crop Field Variations from Sentinel-2 imagery. Remote Sens. Appl. Soc. Environ. 2024, 35, 101259. [Google Scholar] [CrossRef]

17. Huang, Y.; Li, X.; Du, Z.; Shen, H. Spatiotemporal enhancement and interlevel fusion network for remote sensing images change detection. IEEE Trans. Geosci. Remote Sens. 2024, 62, 5609414. [Google Scholar] [CrossRef]

18. Lecun, Y.; Bottou, L.; Bengio, Y.; Haffner, P. Gradient-based learning applied to document recognition. Proc. IEEE 1998, 86, 2278–2324. [Google Scholar] [CrossRef]

19. Liu, Z.; Li, N.; Wang, L.; Zhu, J.; Qin, F. A multi-angle comprehensive solution based on deep learning to extract cultivated land information from high-resolution remote sensing images. Ecol. Indic. 2022, 141, 108961. [Google Scholar] [CrossRef]

20. Long, J.; Shelhamer, E.; Darrell, T. Fully convolutional networks for semantic segmentation. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Boston, MA, USA, 7–12 June 2015; pp. 3431–3440. [Google Scholar]

21. Ronneberger, O.; Fischer, P.; Brox, T. U-net: Convolutional networks for biomedical image segmentation. In Medical Image Computing and Computer-Assisted Intervention—MICCAI 2015: 18th International Conference, Munich, Germany, 5–9 October 2015, Proceedings, Part III; Springer: Cham, Switzerland, 2015; pp. 234–241. [Google Scholar]

22. He, K.; Zhang, X.; Ren, S.; Sun, J. Deep residual learning for image recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition, Las Vegas, NV, USA, 27–30 June 2016; pp. 770–778. [Google Scholar]

23. Chen, L.-C.; Papandreou, G.; Kokkinos, I.; Murphy, K.; Yuille, A.L. Deeplab: Semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected crfs. IEEE Trans. Pattern Anal. Mach. Intell. 2017, 40, 834–848. [Google Scholar] [CrossRef] [PubMed]

24. Zhang, X.; Huang, J.; Ning, T. Progress and Prospect of Cultivated Land Extraction from High-Resolution Remote Sensing Images. Geomat. Inf. Sci. Wuhan Univ. 2023, 48, 1582–1590. [Google Scholar]

25. Li, Z.; Chen, S.; Meng, X.; Zhu, R.; Lu, J.; Cao, L.; Lu, P. Full Convolution Neural Network Combined with Contextual Feature Representation for Cropland Extraction from High-Resolution Remote Sensing Images. Remote Sens. 2022, 14, 2157. [Google Scholar] [CrossRef]

26. Dong, Z.; Li, J.; Zhang, J.; Yu, J.; An, S. Cultivated land extraction from high-resolution remote sensing images based on BECU-Net model with edge enhancement. Natl. Remote Sens. Bull. 2023, 27, 2847–2859. [Google Scholar] [CrossRef]

27. Xu, Y.; Zhu, Z.; Guo, M.; Huang, Y. Multiscale Edge-Guided Network for Accurate Cultivated Land Parcel Boundary Extraction From Remote Sensing Images. IEEE Trans. Geosci. Remote Sens. 2024, 62, 4501020. [Google Scholar] [CrossRef]

28. Liang, J.; Gong, J.; Li, W. Applications and impacts of Google Earth: A decadal review (2006–2016). ISPRS J. Photogramm. Remote Sens. 2018, 146, 91–107. [Google Scholar] [CrossRef]

29. Chen, L.-C.; Zhu, Y.; Papandreou, G.; Schroff, F.; Adam, H. Encoder-decoder with atrous separable convolution for semantic image segmentation. In Proceedings of the European Conference on Computer Vision (ECCV), Munich, Germany, 8–14 September 2018; pp. 801–818. [Google Scholar]

30. Lee, H.; Kim, H.-E.; Nam, H. Srm: A style-based recalibration module for convolutional neural networks. In Proceedings of the IEEE/CVF International Conference on Computer Vision, Seoul, Republic of Korea, 27 October–2 November 2019; pp. 1854–1862. [Google Scholar]

31. Woo, S.; Park, J.; Lee, J.-Y.; Kweon, I.S. Cbam: Convolutional block attention module. In Proceedings of the European Conference on Computer Vision (ECCV), Munich, Germany, 8–14 September 2018; pp. 3–19. [Google Scholar]

32. Cheng, H.K.; Chung, J.; Tai, Y.-W.; Tang, C.-K. Cascadepsp: Toward class-agnostic and very high-resolution segmentation via global and local refinement. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, 14–19 June 2020; pp. 8890–8899. [Google Scholar]

33. Lu, H.; Fu, X.; Liu, C.; Li, L.-G.; He, Y.-X.; Li, N.-W. Cultivated land information extraction in UAV imagery based on deep convolutional neural network and transfer learning. J. Mt. Sci. 2017, 14, 731–741. [Google Scholar] [CrossRef]

34. Li, Q.; Zhang, D.; Pan, Y.; Dai, J. High-resolution cropland extraction in Shandong province using MPSPNet and UNet network. Natl. Remote Sens. Bull. 2023, 27, 471–491. [Google Scholar] [CrossRef]

35. Shi, X.Q.; Li, P.; Wu, H.; Chen, Q.D.; Zhu, H.Y. A lightweight image splicing tampering localization method based on MobileNetV2 and SRM. IET Image Process. 2023, 17, 1883–1892. [Google Scholar] [CrossRef]

36. Liu, Y.; Zhang, X.Y.; Bian, J.W.; Zhang, L.; Cheng, M.M. SAMNet: Stereoscopically Attentive Multi-Scale Network for Lightweight Salient Object Detection. IEEE Trans. Image Process. 2021, 30, 3804–3814. [Google Scholar] [CrossRef]

37. Zhai, Y.J.; Fan, D.P.; Yang, J.F.; Borji, A.; Shao, L.; Han, J.W.; Wang, L. Bifurcated Backbone Strategy for RGB-D Salient Object Detection. IEEE Trans. Image Process. 2021, 30, 8727–8742. [Google Scholar] [CrossRef]

38. Chen, G.J.; Chen, H.Z.; Cui, T.; Li, H.H. SFMRNet: Specific Feature Fusion and Multibranch Feature Refinement Network for Land Use Classification. IEEE J. Sel. Top. Appl. Earth Observ. Remote Sens. 2024, 17, 16206–16221. [Google Scholar] [CrossRef]

39. Naboureh, A.; Li, A.N.; Bian, J.H.; Lei, G.B.; Amani, M. A Hybrid Data Balancing Method for Classification of Imbalanced Training Data within Google Earth Engine: Case Studies from Mountainous Regions. Remote Sens. 2020, 12, 3301. [Google Scholar] [CrossRef]

40. Zhang, J.C.; He, Y.H.; Yuan, L.; Liu, P.; Zhou, X.F.; Huang, Y.B. Machine Learning-Based Spectral Library for Crop Classification and Status Monitoring. Agronomy 2019, 9, 496. [Google Scholar] [CrossRef]

41. Longchamps, L.; Philpot, W. Full-Season Crop Phenology Monitoring Using Two-Dimensional Normalized Difference Pairs. Remote Sens. 2023, 15, 5565. [Google Scholar] [CrossRef]

Li M, Wang R, Dai A, Yuan W, Yang G, Xie L, Zhao W, Zhao L. Cascade DeepLab Net: A Method for Accurate Extraction of Fragmented Cultivated Land in Mountainous Areas Based on a Cascaded Network. Agriculture. 2025; 15(3):348. https://doi.org/10.3390/agriculture15030348

Перевод статьи « Cascade DeepLab Net: A Method for Accurate Extraction of Fragmented Cultivated Land in Mountainous Areas Based on a Cascaded Network» авторов Li M, Wang R, Dai A, Yuan W, Yang G, Xie L, Zhao W, Zhao L., оригинал доступен по ссылке. Лицензия: CC BY. Изменения: переведено на русский язык