Author Produced

Die Integration der Fernerkundung mit Artenverteilung Modelle; Mapping Tamariske Invasions Verwenden der Software für Assisted Habitat-Modellierung (SAHM)

Environment
 

Cite this Article

Copy Citation | Download Citations

West, A. M., Evangelista, P. H., Jarnevich, C. S., Young, N. E., Stohlgren, T. J., Talbert, C., Talbert, M., Morisette, J., Anderson, R. Integrating Remote Sensing with Species Distribution Models; Mapping Tamarisk Invasions Using the Software for Assisted Habitat Modeling (SAHM). J. Vis. Exp. (116), e54578, doi:10.3791/54578 (2016).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Die Früherkennung von invasiven Pflanzenarten ist von entscheidender Bedeutung für die Bewirtschaftung der natürlichen Ressourcen und der Schutz von Ökosystemprozessen. Die Verwendung von Satellitenfernerkundung zur Kartierung der Verteilung von invasiven Pflanzen ist immer häufiger, aber konventionelle Bildbearbeitungssoftware und Klassifikationsmethoden wurden unzuverlässig erwiesen. In dieser Studie haben wir die Verwendung von fünf Arten Verteilungsmodell Techniken fit mit Satellitenfernerkundungsdaten zur Karte invasive Tamariske (Tamarix spp.) Entlang des Arkansas River im Südosten Colorado testen und zu bewerten. Die Modelle getestet enthalten verstärkt Regressionsbäume (BRT), Zufallswald (RF), multivariate Regressions adaptive Splines (MARS), generalisierte lineare Modell (GLM) und Maxent. Diese Analysen wurden unter Verwendung einer neu entwickelten Software-Paket die Software für Assisted Habitat-Modellierung (SAHM) genannt durchgeführt. Alle Modelle wurden mit 499 Anwesenheit Punkte trainiert, 10.000 Pseudo Abwesenheit Punkte und Prädiktorvariablen acquired vom Landsat 5 Thematic Mapper (TM) Sensor über einen Zeitraum von acht Monaten Tamariske von einheimischen Ufervegetation mit Nachweis von phänologische Unterschiede zu unterscheiden. Aus den Landsat Szenen, haben wir einzelne Bänder und berechnet Normalized Difference Vegetation Index (NDVI), Soil-Adjusted Vegetation Index (SAVI) und tasseled capped Transformationen. Alle fünf Modelle aktuellen Tamariske Verteilung auf die Landschaft identifiziert erfolgreich auf Basis von Schwellen unabhängig und Schwellen abhängige Bewertungsmetriken mit unabhängigen Standortdaten. Zur Berücksichtigung modellspezifische Unterschiede produzierten wir ein Ensemble von allen fünf Modellen mit Karte Ausgang markieren Bereiche der Übereinstimmung und Bereiche der Unsicherheit. Unsere Ergebnisse zeigen die Nützlichkeit von Arten Verteilungsmodelle in Fernerkundungsdaten zu analysieren und die Nützlichkeit von Ensemble-Mapping und präsentieren die Fähigkeit von SAHM in Vorverarbeitung und mehrere komplexe Modelle ausgeführt wird.

Introduction

Riparian und Feuchtgebiete im gesamten Südwesten der Vereinigten Staaten werden durch die Invasion der Tamariske bedroht (Tamarix spp.), Eine nicht-native Strauch aus Eurasien in den 1 1800er Jahren eingeführt. Tamariske hat viele physiologische Mechanismen, die die Gattung erlauben Wasserressourcen zu nutzen, out-Wettbewerb einheimischen Arten und verändern Ökosystem - Prozesse 1-2. Mapping Tamariske Verteilungen für Umweltauswirkungen der Bewertung und der Formulierung von effektiven Bekämpfungsstrategien sind hohe Prioritäten für Ressourcen-Manager. Obwohl Bodenuntersuchungen regelmäßig eingesetzt bleiben, sind sie für extrem große Flächen unpraktisch aufgrund der damit verbundenen Kosten der Arbeit, Zeit und Logistik.

Satellitenfernerkundung hat eine wichtige gespielt, aber begrenzten Rolle bei der Erkennung und Kartierung von Tamarisken parasitäre Erkrankungen. Herkömmliche Klassifizierung analysiert und Fernerkundung Software haben wenig Erfolg 3-5 hatte. Mehrere neuere Studienhaben erforscht Ansätze nicht-traditionellen Erkundungsdaten 1,6 unter Verwendung von Remote - invasiven Pflanzen zu erkennen. Tamariske, wie viele invasive Pflanzen, zeigt phänologischen Variation in der gesamten Vegetationsperiode, die von einheimischen riparian Spezies Phänologie unterscheidet. In einigen Bereichen, zum Beispiel Tamariske Blatt-out ist vor einigen einheimischen Anlieger Pflanzen und Tamariske behält seine Blätter länger als andere einheimische Arten. Durch die Verwendung von abgeleiteten Spektralbänder und spektralen Indizes aus einer Zeitreihe von Satellitendaten in der gesamten Vegetationszeit, können wir Tamariske aus einheimischen Pflanzen auf der Grundlage dieser phänologische Unterschiede 1,6 unterscheiden. Aufbauend auf der Arbeit von Evangelista et al. 2009 1, die in dieser Studie einbezogen wir einzelne Bänder 1-7 aus einer Zeitreihe von Landsat 5 Thematic Mapper (TM) Satellitenbilder und normalisierte Differenz Vegetationsindex (NDVI) abgeleitet, Bodenbereinigte Vegetationsindex (SAVI) und Quastenmütze Transformationen von diesen Bands. Normierte difference Vegetationsindex (NDVI) ist eines der am häufigsten verwendeten spektralen Indizes für die Schätzung Vegetation Biomasse, Überschirmungsgrad und Blattflächenindizes 8-9 und ist eine nichtlineare Transformation des Verhältnisses zwischen der sichtbaren (rot) und Near- Infrarotbanden 10. Bodenbereinigte Vegetationsindex (SAVI) ein modifiziertes NDVI verwendet , um die Auswirkungen von Boden Hintergrund auf Vegetationsindizes 11 zu minimieren. Tasseled Kappe Transformationen werden gewichtet Komposite der sechs Landsatbänder in drei orthogonalen Bands, die Boden Helligkeit messen (Quastenmütze, Band 1), Vegetation Grünheit (Quastenmütze, Band 2) und Boden / Vegetation Nässe (Quastenmütze, Band 3) und werden oft zu unterscheiden Vegetationszusammensetzung, Altersklasse und Struktur 12-14 verwendet. Wir haben die in Crist berichtet Koeffizienten (1985) 15 für alle tasseled Kappe Transformationen.

In dieser Studie testen wir fünf Arten Verteilungsmodelle mit einer Zeitreihe von Spektralbändern und Gemüseetation Indizes abgeleitet von Landsat 5 TM Tamariske entlang der unteren Arkansas River im Südosten von Colorado, USA abzubilden. Der Arkansas River, Spanning 2.364 km (1.469 Meilen), ist der zweitgrößte Zufluss des Missouri-Mississippi-System. Sein Einzugsgebiet umfasst 435.123 km 2 (168.002 mi 2) mit Quellgebiet in den Colorado Rocky Mountains. Von seinem Ursprung auf 2965 m, fällt die Arkansas deutlich in der Höhe, Nivellierung in der Nähe von Pueblo, CO, und schlängelt sich durch landwirtschaftliche Flächen und mit kurzem Gras Prärie. Der Fluss unterliegt saisonalen Überschwemmungen und ist für die kommunale und landwirtschaftliche Wassernutzung in Rocky Ford, La Junta, und Lamar verlassen, bevor sie in Kansas weiter, Oklahoma, und Arkansas, wo er den Mississippi fließt. Tamariske wurde erstmals im Jahr 1913 in der Nähe der heutigen Stadt von Lamar 16 auf dem Arkansas River von R. Niedrach beobachtet. Heute ist es wurde geschätzt , dass Tamariske erstreckt sich über mehr als 100 km 2 zwischen Pueblo und dem Kansas Zustand line, mit einem zusätzlichen 60 km 2 entlang der Zuflüsse des Arkansas River 17. Das Untersuchungsgebiet umfasst Bewässerungsgräben, Feuchtgebiete, landwirtschaftliche Flächen und die Einmündungen von mehreren Zuflüssen; alle mit verschiedenen Graden von tamarisk Befalls. Haltung und Landwirtschaft sind die primäre Land nutzt neben den Anlieger Korridore weitgehend von Luzerne aus, Heu, Mais und Winterweizen.

Verbreitungsmodelle setzen auf georeferenzierten Vorkommen (dh Breite, Länge) Beziehungen "zwischen einer Spezies Vorkommen zu identifizieren und ihre Umgebung 18. Die Umweltdaten können mehrere Fernerkundung und anderen räumlichen Schichten umfassen. Die fünf Arten Verteilungsmodelle , die wir getestet sind verstärkt Regressionsbäume (BRT) 19, Random Forests (RF) 20, multivariate Regressions adaptive Splines (MARS) 21, einen verallgemeinerten linearen Modell (GLM) 22 und Maxent 23. Diese fünf model Algorithmen gehören zu den am häufigsten für die Verbreitung von Arten Modellierung eingesetzt, und eine Reihe von Studien gezeigt haben , ihre Wirksamkeit 24-25. Wir nutzten die Software für Assisted Habitat - Modellierung (SAHM) v. 2.0 Module die fünf Modelle auszuführen, die in VisTrails V.2.2.2 26 Visualisierung und Verarbeitung Software enthalten sind. Es gibt mehrere Vorteile bei der Verwendung für eine vergleichende SAHM Modellierung. Neben der Formalisierung und lenkbar Aufnahme von Modellierungsverfahren ermöglicht SAHM Benutzer mit mehreren Arten Verteilungsmodell Algorithmen arbeiten, die einzeln, haben unterschiedliche Schnittstellen, Software und Dateiformatierung 27. SAHM produziert konsistente Schwelle unabhängig und Schwellenabhängigen Bewertungsmetriken Modell Leistung zu bewerten. Eine davon ist die Fläche unter der Receiver Operating Characteristic Curve (AUC), eine Schwelle unabhängige Metrik , die Fähigkeit eines Modells 28 Anwesenheit von Hintergrund zu unterscheiden auswertet. Eine AUC value von 0,5 oder weniger zeigt, Modellvorhersagen sind nicht besser oder schlechter als zufällig; Werte zwischen 0,5 und 0.70 zeigen eine schlechte Leistung; und Werte von 0,70 bis 1,0 zu erhöhen zeigen zunehmend höhere Leistung. Eine andere Metrik Prozent korrekt klassifiziert (PCC), eine Schwelle abhängige Metrik, die Sensitivität und Spezifität wiegt basierend auf einer benutzerdefinierten Schwelle Metrik; Sensitivität misst den Prozentsatz der beobachteten Präsenzen klassifiziert als geeignet und Spezifität der Anteil der Hintergrundquellen eingestuft als ungeeignet misst. Noch eine andere Metrik ist wahre Fähigkeit Statistik (TSS = Sensitivität + Spezifität - 1), die als Besonderheit mehr Gewicht auf Modellsensitivität platziert, mit Werten zwischen -1 und 1 , wo Werte> 0 besseres Modell Leistung zeigen als Chance 29.

So ordnen Tamariske mit Modellausgabe, konstruierten wir die Schwelle binär mithilfe von Klassifizierungen, die Sensitivität und Spezifität entzerrt das p zu definierenräsenz oder Abwesenheit von Tamarisken. Diese einzelnen Modell abgeleitet Karten wurden dann ein Ensemble Karte 30 zu schaffen summiert. Ensemble Karten kombinieren, um die Vorhersagen der einzelnen Arten Verteilungsmodelle eine klassifizierte Karte zu erzeugen, die den Tarifvertrag der getesteten Modelle zählt. Zum Beispiel zeigt ein Ensemble Zellenwert eines, dass nur ein Modell, das als Zelle geeigneten Lebensraum eingestuft, während ein Wert von fünf zeigt an, dass alle fünf Modelle die Zelle als geeigneten Lebensraum eingestuft. Ein Vorteil dieses Ansatzes ist, dass Ensemble Karten ergeben eine niedrigere mittlere Fehler als jedes einzelne Modell. Es ermöglicht auch getestet Anwender die Leistung jedes Modell visuell vergleichen. Unser Gesamtziel war eine detaillierte Beschreibung dieser Verfahren zu schaffen, das zugeschnitten werden kann auf dem Gebiet der aktuellen Verteilung der Arten zu modellieren.

Protocol

1. Datenerfassung im Feld

  1. Man leite Felddaten für Tamariske von einem Vektor Polygon - Datensatz durch die Tamarisken Koalition in einer landesweiten Umfrage in 2005 und 2006 17 gesammelt.
    HINWEIS: Die Daten, die durch eine intensive Bodenuntersuchung erhalten wurden, in denen Feldtechniker alle Tamariske entlang des Arkansas River mit Global Positioning Systems (GPS) und Luftaufnahmen abgebildet steht.
  2. Innerhalb dieser Polygone erzeugen 499 zufällige Punkte (dh Präsenzen) , um die Modelle zu trainieren. Legen Sie zwei Sätze von Einschränkungen für die zufällige Punkte: (1) ist jeder Punkt erforderlich> 30 m von jeder Polygonkante sein, um sicherzustellen, dass es innerhalb der Tamariske ist in einem TM Auflösung Landsat 5 stehen; und (2) jeder Punkt ist erforderlich, 60 m von jedem benachbarten Punkt ≥ werden, eine stabile Verteilung über die Studie Website, um sicherzustellen, und die räumliche Autokorrelation zu minimieren.
  3. Kompilieren Felddaten in einer MS-Excel-Datei in drei Spalten mit den Überschriften der Bezeichnung "Antwort", "X" und "Y", in dem die Antwortwerte sind (1) für Präsenz, UTM easting für X und UTM northing für Y. Speichern Sie diese Datei im CSV - Format für den Einsatz in SAHM (FieldData Modul).
  4. Generieren Sie zusätzliche 100 zufällige Punkte innerhalb der Tamariske Koalition Tamariske Polygone und weitere 100 zufälligen Punkten außerhalb der Polygone als unabhängige Testdaten Modellergebnisse zu bewerten. Speichern Sie diese Datei im CSV - Format für den Einsatz in SAHM (FieldData Modul).

2. Prädiktorvariablen

  1. Download von Landsat 5 Oberflächenreflexion L4-5 TM Bilder (Pfad 32, Reihe 34) von der US Geological Survey Global Visualization-Viewer / EarthExplorer (http://earthexplorer.usgs.gov/). Die Szenen sind das Ausmaß der im Jahr 2005 Colorado Tamariske Coalition abgetastet und 2006 17. Die Monate für die Modelle, wählen Sie Szenen verwendet , zu bestimmen , die weitgehend wolkenfrei sind (dh <10% Wolkendecke) und representative Monaten gedacht, um unterscheidbar Tamariske Phänologie haben; diese waren Oktober 2004 April 2005 Mai 2005 Juni 2005 Juli 2005 September 2005 April 2006 Mai 2006 Juni 2006 Juli 2006 August 2006 September 2006 bis November 2006.
  2. Laden Sie die Fernerkundung Indizes Ableitungstool aus
    https://github.com/rander38/Remote-Sensing-Indices-Derivation-Tool.
  3. Führen Sie das Python-Skript in dem Werkzeug, entweder GDAL oder ArcPy Version; GDAL wird empfohlen.
  4. Wählen Sie den entsprechenden Satellitensensor, der gewünschten Indizes, und stellen Sie den Eingangsbilddatei und die Ausgabeordner , in dem Dateien gespeichert werden (Abbildung 1). Wir exportierten die einzelnen Bands und verwendet, um den NDVI, SAVI und Tasseled Cap Helligkeit, Unreife und Nässe Indizes von jedem der Szenen Landsat TM abgeleitet. Beachten Sie, dass alle Indizes geändert oder hinzugefügt werden können, indem die Sensors_Formulas_RSIDT.ini Datei zu verändern.

Abbildung 1 Abbildung 1. Remote Sensing Indizes Ableitungstool - GUI.

  1. Führen Sie das Tool, und überprüfen Sie die Ausgabedateien visuell in ArcMap v. 10.0 (ESRI, Redlands, CA) oder einer anderen geografischen Informationssystem-Software.

3. Software für Assisted Habitat-Modellierung (SAHM) (Abbildung 2)

Abbildung 1
Abbildung 2. Die gesamte SAHM Workflow umfasst Eingangsdaten, Vorverarbeitung, vorläufiges Modell Analyse und Entscheidung, Korrelat Modelle und Ausgaberoutinen.

  1. Für Lauf SAHM, erste Download-Dateien (einschließlich VisTrails) von der US Geological Survey Website unter https://my.usgs.gov/catalog/RAM/SAHM. Lesen Sie in der Bedienungsanleitung auf der gleichen Website für detaillierte Anweisungen zum Herunterladen und SAHM installieren. Beachten Sie, dass die Website auch ein SAHM tutoria hatl und Daten für weitere Anweisungen.
  2. Um die Tamariske Artenverteilung Modelle zu entwickeln, verwenden Sie die SAHM_tutorial_2.0.vt - Datei , die (in der SAHM Beispiele Ordner) mit dem Paket - Download kommt. Innerhalb der Geschichte Ansicht den unabhängigen Stellen Workflow. Die anderen Workflow-Beispiele können auf Studienziele ausgewählt und sind abhängig sein; Beschreibungen werden mit jeweils. Wählen Sie Pipeline.
  3. Stellen Sie den Ausgabeordner, indem Sie Pakete gehen und dann SAHM> Change Session Folder. Während des gesamten Workflow - Entwicklungsprozess, detaillierte Beschreibungen der einzelnen Schritte und Optionen können durch Auswahl der Registerkarte Dokumentation befindet sich auf der rechten Seite des SAHM - Viewer - Bildschirm gefunden werden. Alle Module in den folgenden aufgeführten Methoden können sich auf der linken Seite des SAHM Fenster unter dem SAHM Registerkarte gefunden werden.
  4. Als nächstes direkte SAHM auf die Felddaten, die sein wird,verwendet, um Arten Verteilungsmodelle zu trainieren.
    1. Klicken Sie auf das TemplateLayer Modul. Wechseln Sie zu dem Raster, das als Maske verwendet wird, und die Projektion, Zellgröße und Umfang der Analysen zu definieren.
    2. Klicken Sie auf das FieldData Modul auf der linken Seite des Workflows. Suchen Sie nach .csv (dh training.csv) Datei von Felddaten (Vorhandensein Punkte oder Anwesenheit und Abwesenheit Punkte) im Bereich Datenmodul.
    3. Klicken Sie auf das PredictorListFile Modul und durchsuchen Sie Dateiliste in .csv (zB Datei den vollständigen Pfad zu allen Prädiktoren enthalten , in der die Verwendung modell- zu Bedienungsanleitung entnehmen).
  5. Als nächstes Vorverarbeitungsschritte durchzuführen.
    1. Klicken Sie auf das FieldDataQuery Modul und füllen in Reaktion Spalte mit Spaltenüberschrift für die Antwort (dh die Spaltennamen in der FieldData.csv), X und Y - Spalten.
    2. Klicken Sie auf das MDSBuilder Modul. Stellen Sie die backgroundPointField bis 10.000.
      HINWEIS: Wenn Sie Anwesenheit und Abwesenheit Daten für die Spezies verwenden modelliert wird, müssen Sie nicht die backgroundPointField ändern müssen; Sie würden diese Orte mit einer Antwort (0) im Bereich data.csv umfassen. Es ist optional eine backgroundProbSurf zu setzen , wenn Sie Hintergrund - Punkt - Auswahl in einem Bereich zu beschränken möchten , indem Sie mit Werten zu einer Raster - Oberfläche zeigt von 0 bis 100 reichen (diese Werte repräsentieren die Wahrscheinlichkeit , dass eine zufällig generierte Punkt beibehalten werden sollte es innerhalb eines Sturzes bestimmte Zelle). Für diese Studie eine backgroundProbSurf mit Werten von 100 innerhalb einer 5,000 m Puffer des Arkansas River verwenden und 0 für Bereiche außerhalb dieses Puffers (bezogen auf die Gesamtfläche , die von der Vereinigung tamarisk gesampelt).
  6. Als nächstes geben die Artenverteilung Modellierungsalgorithmen verwendet werden.
    1. Beachten Sie, dass die BoostedRegressionTree, GLM, MARS, und RandomForest Module sind bereits in den unabhängigen Standorten Workflow einrichten. Fügen Sie den MAXENT Modul an den Workflow alle fünf Modelle zu testen. Verbinden Sie es mit dem CovariateCorrelationAndSelection Modul.
      HINWEIS: Beginnen Sie mit den Standardeinstellungen für alle Modelle; diese können anhand von Studienziele geändert werden (siehe Modell-Dokumentation für weitere Details).
    2. Fügen Sie ein ModelOutputViewer Modul und verbinden Sie es mit dem MAXENT - Modul; ändern Spalte 5 und Zeile 1. Die ModelOutputViewer erzeugt eine Tabelle , die für Modellergebnis Vergleiche verwendet werden können.
    3. Klicken Sie auf das output Modul und einen Unterordner Namen eingeben.
  7. Als Nächstes fügen Sie ein Modul, das ein Ensemble von Modellausgaben erzeugt. Dieses Modul erzeugt zwei Ausgangskarten; eine mit der durchschnittlichen kontinuierliche Wahrscheinlichkeits aller Ausgänge enthalten und eine zweite mit der Zählung der Anzahl von Modellen mit einem positiven binary Wahrscheinlichkeit.
    1. In den Workflow ein EnsembleBuilder Modul. Es ist optional eine Schwelle Metric zu setzen; für diese Studie, wählen AUC und den Schwellenwert auf dem Standardwert von 0,75 zu verlassen. Dies wird, dass nur Modelle mit einem AUC-Wert größer als oder gleich 0,75 sicherzustellen, sind in den ensemble Karte Ausgänge enthalten. Schließen Sie den BoostedRegressionTree, GLM, MARS, Random und MAXENT Module an den EnsembleBuilder.
  8. Als nächstes richten die Modelle zu den unabhängigen Testdaten.
    1. Klicken Sie auf das andere FieldData Modul (rechte Seite des Workflows) und navigieren Sie zu der CSV - Datei , die Modellvalidierung Daten enthält. Dies sind die 200 An- und Abwesenheit Punkte erzeugt in Schritt 1.4 des Protokolls.
    2. Klicken Sie auf das FieldDataQuery Modul und stellen Sie sicher , dass die Antwort, x und y Spalten entsprechen den Spalten in die Felddaten .csv.
    3. Fügen Sie ein ApplyModel Modul und verbinden Sie es mit dem MAXENT Modul. Fügen Sie ein ModelOutputViewer Modul und schließen Sie es an diesem ApplyModel-Modul; Ändern Sie die Spalte 5 und die Zeile 1. Wählen Sie im Menü wählen Sie Packages -> SAHM -> Ändern Verarbeitungsmodus. Da wollen Sie mehr als ein Modell zu laufen, einzelne Modelle der Reihe nach wählen (n - 1 Kerne pro Stück). Dadurch wird die Ausführungszeit der Modelle zu beschleunigen, indem die Vorteile von mehreren Rechnerkerne nehmen.
  9. Als nächstes führen die Artenverteilung Modelle.
    1. Speichern Sie die Datei .vt und klicken Sie dann auf Ausführen.
    2. Wenn das CovariateCorrelationAndSelection Widget (Abbildung 3) erscheint, de-wählen jedes korrelierte Variablenpaar , wo der Korrelationskoeffizient | r | Erklärt ≥ 0,7 (basierend auf% Deviance von einem univariaten allgemeinen ized additive Modell in auf der linken Seite dieses Widgets (Abbildung 3) und informierte ökologische Entscheidungen gesehen; in dieser Studie für jeden Monat, um die Auswahl von mindestens einer Kovariate priorisieren phänologischen Variation in Tamariske zu erfassen). Die Anzahl der Stellplätze im Sichtfenster können in einer Reihe durch die Eingabe geändert werden (die Standardeinstellung ist 8) , und klicken Sie auf Aktualisieren.
    3. Nach Kovariable Auswahl der Finalisierung wählen am unteren Rand des CovariateCorrelationAndSelection Widget (Abbildung 3) OK. Für diese Studie wurden die folgenden neun Variablen beibehalten: July_30_2006_Brightness, June_09_2005_SAVI, Sept_16_2006_SAVI, May_24_2005_B4, Oct_28_2004_NDVI, April_22_2005_Brightness, April_09_2006_SAVI, Aug_31_2006_B4 und Nov_19_2006_SAVI. Die Art Verteilungsmodelle ausführen wird nach der Auswahl auf OK.

jpg "/>
Abbildung 3. Kovariatenwerte Korrelation und Auswahl SAHM - Schnittstelle.

  1. Ergebnisse ausgegeben.
    HINWEIS: Nachdem die Modelle abgeschlossen haben, ein VisTrails Kalkulationstabelle erscheint für Modellvergleich (Abbildung 4)
    1. Vergleichen Sie die AUC-Plots, Textausgaben, Wirkungs-Kurven, Kalibrierung, Konfusionsmatrix, Residuen und Wirkungs-Kurven über Modelle.
      HINWEIS: Die Ausgabe von SAHM Modelle sind mit einem CovariateCorrelationOutputMDS, Konfusionsmatrix, Residuenzeichnung, Kalibrierungsplot, Modellevaluierung Grundstück, variable Bedeutung Plot, eine Antwort-Kurven-Ordner, einen erweiterten Ausgabeordner, bin Karte, Chaos Karte, MoD Karte, prob Karte, Rest Karte und eine output.txt; finden Sie in der SAHM Bedienungsanleitung für weitere Beschreibung.

Abbildung 4
Abbildung 4. VisTrails Tabellen können verwendet werden , Modellausgabe zu bewerten. Das istdie AUC Modellvergleich für die Trainingsdaten; von links jeweils die Modelle sind BRT, GLM, MARS, RF, und Maxent, nach rechts.

Representative Results

Statistische Auswertungen von BRT, RF, MARS, GLM und Maxent basierend auf dem unabhängigen Test-Datensatz angezeigt alle fünf Modelle bei der Aufdeckung von Tamarisken relativ gut; es gab kaum einen Unterschied zwischen den Schwellen unabhängig und Schwellen abhängige Bewertungsmetriken unter Modelle. AUC - Werte waren> 0,88 Prozent korrekt klassifizierten Werte lagen bei > 77%, Sensitivität und Spezifität waren> 0,77 und TSS waren> 0,54 (Tabelle 1). Ein Ensemble von binären Modellausgaben ergab viel Mustervereinbarung in Gebieten entlang der Arkansas River (Abbildung 5). Die MESS (multivariate Umwelt Ähnlichkeit Oberfläche) Karte Ausgänge für jedes Modell die zur Verfügung stehende Umgebung des Untersuchungsgebiets angegeben wurde gut abgetastet (Abbildung 6), weiter unser Vertrauen in das Ensemble Ansatz zu erhöhen.

Wege "> Modell AUC PCC Empfindlichkeit Spezifität TSS BRT 0,91 85 0,85 0,85 0,70 RF 0,92 85 0,85 0,85 0,70 MARS 0,90 82 0,82 0,82 0,64 GLM 0,88 77 0,77 0,77 0,54 Maxent 0,92 84 0,83 0,84 0,67

Tabelle 1. Schwelle unabhängig (AUC) und der Schwellenwert abhängig (PCC, Sensitivität, Spezifität und TSS) Bewertungsmetriken für BRT, RF, MARS, GLM und Maxent Modelle passen zu einem unabhängigen Test Datensatz von Tamarisken Anwesenheit und Abwesenheit.

Abbildung 5
Abbildung 5. Ensemble Ergebnisse kombiniert BRT, GLM, MARS, RF, und Maxent Binärausgang Karten in ArcGIS. Bereiche werden nach der Anzahl der Modelle im Einvernehmen gefärbt, von 0 (keine Farbe) bis 5 (rot). Notieren Sie sich die farbige Fläche in der nordwestlichen Ecke der Vorhersage; diese Linie ist ein Artefakt der Landsat-Bilder; Daher ergibt Modell mit Vorsicht sollte in dieser Region getroffen werden. Bitte hier klicken , um eine größere Version dieser Figur zu sehen.

Figur 6
Abbildung 6. Multivariate Umwelt Ähnlichkeit Fläche (MESS) ausgegeben.target = "_ blank"> Bitte klicken Sie hier, um eine größere Version dieser Figur zu sehen.

Von den neun Prädiktoren verwendet, 30. Juni 2006 Helligkeit war die wichtigste Variable für alle fünf Modelle (Tabelle 2). Dies war die einzige Variable von GLM basierend auf schrittweise Informationskriterium Akaike beibehalten (AIC, das ist die Vorgabe für GLM Modellauswahl in SAHM ist), jedoch ist es wichtig, dieses Modell beinhaltete auch eine quadratische Laufzeit dieser Variablen zu beachten. RF und Maxent alle Variablen standardmäßig beibehalten.

Predictor BRT RF MARS GLM Maxent
30. Juli 2006 Helligkeit 41,60 34.11 76,78 100 67,27
31. August 2006 Band 4 6,35 5,87 5.16 0 2,82
9. Juni 2005 SAVI 13,67 14,09 9.14 0 9.75
22. April 2005 Helligkeit 6.29 6.30 0 0 0,43
28. Oktober 2004 NDVI 5,66 8,25 0 0 2,94

Tabelle 2. Relative Bedeutung von Prädiktoren in jedem Modell.

Discussion

Unsere Ergebnisse zeigen, passend BRT, RF, MARS, GLM und Maxent mit Anwesenheitspunkte für Tamarisken und einer Zeitreihe von Fernerkundungs ​​Landsat Satellitenbilder Daten Tamariske auf die Landschaft zu unterscheiden und ist eine effektive Alternative zu herkömmlichen Single-Szene Klassifikationsmethoden. Es ist klar, aus unseren Ergebnissen, dass der Juni eine besonders wichtige Zeit ist Tamariske in unserem Untersuchungsgebiet zu erfassen; in diesem Bereich ist der wichtigste Prädiktor für Tamariske Auftreten Juni Wetness angegeben basierend auf einem Maxent Modellanpassung mit einer Zeitreihe von Landsat - Bilder dies stimmt mit Evangelista et al. 2009 1 , das war.

Die anderen spektralen Indizes und Bands , die in der BRT, RF, MARS und Maxent Modelle enthalten waren unterscheiden kann weiter Tamariske von Bodensubstrat, andere Laubbäume einschließlich Pappel (Populus spp.) Und Weide (Salix spp.), Oder in der Landwirtschaft bewässert , dass ist in dem unteren gemeinsamenArkansas River Becken. Andere GIS Schichten, wie Topographie, Bodentypen oder Klimadaten könnten auch als Kovariaten und in diesen Modellen enthalten in Betracht gezogen werden, aber wir empfehlen, diese auf ein Minimum zu halten, wenn das Ziel aktuelle Artenverteilung ist in der Landschaft zu erkennen und nicht vorhersagen Potenzial Auftreten oder geeigneten Lebensraum.

Die Modelle getestet für unsere Forschung zur Verfügung gestellt starke analytische Kapazität und mehrere Optionen für die Bewertung der Ergebnisse. Mit all diesen Korrelat Modelle in einem einheitlichen Rahmen, wie SAHM, erlaubt die Formalisierung und lenkbar Aufnahme des Modellierungsprozesses. Vor- und Nachbereitung von Reaktion und Einflussvariablen wurden in SAHM standardisiert, besser und effizienter Modellvergleiche ermöglicht, während Workflows jeden Schritt der Modifikation, Iteration und Replikation zu erleichtern Analysen aufzuzeichnen.

Ensemble-Mapping zielt darauf ab, die Stärken von mehreren Korrelat Modelle zu kombinieren, während die w Minimierungeakness von einem Modell 30. Wir glauben, dass dies der Fall in unserer Studie war; Allerdings warnen wir , dass Modelle , die Underperform (dh unter-Vorhersage oder übervorhersagen) kann die Gesamtergebnisse schwächen. Die begrenzte Verwendung von Ensemble-Mapping in der Literatur hat positive Ergebnisse hatte, aber die meisten dieser Ansätze haben versucht, "vorhersagen" Spezies Vorkommen und nicht als "zu erkennen." Darüber hinaus ermöglicht Ensemble Zuordnung für eine visuelle Beurteilung der Unsicherheit unter den verschiedenen Modellierungsmethoden, Ebenen der Mustervereinbarung zu identifizieren. Meistens ist es die Wahl der Modellierungsmethode (zB GLM gegen BRT) , die auf Modellergebnisse eher als andere Entscheidungen in den Modellierungsprozess wie Standortdatenunsicherheit 31 größten messbaren Wirkung hat. Obwohl wir glauben , dass unsere besten Tamariske Karte ist , wo alle fünf Modelle einverstanden sind, weitere Tests und verschiedene Methoden der Ensemble - Mapping verwendet wird empfohlen (zB durch AUC gewichtet) 32 </ Sup>, und am besten durch unabhängige Feldbeobachtungen bestätigt. Zusammenfassend können diese Verfahren leicht die Verteilung von anderen Spezies unter Verwendung von Umgebungsvariablen für einen bestimmten Untersuchungsgebiet in SAHM abgeleitet zu modellieren zugeschnitten werden.

Materials

Name Company Catalog Number Comments
Earth Explorer USGS http://earthexplorer.usgs.gov Open Access: Yes
Remote Sensing Indices Derivation Tool github https://github.com/rander38/Remote-Sensing-Indices-Derivation-Tool Open Access: Yes
Software for Assisted Habitat Modeling USGS https://my.usgs.gov/catalog/RAM/SAHM Open Access: Yes
ArcGIS v.10.3  Esri https://www.arcgis.com/features/ Open Access: No

DOWNLOAD MATERIALS LIST

References

  1. Evangelista, P. H., Stohlgren, T. J., Morisette, J. T., Kumar, S. Mapping invasive tamarisk (Tamarix): a comparison of single-scene and time-series analyses of remotely sensed data. Remote Sensing. 1, 519-533 (2009).
  2. DiTomaso, J. M. Impact, biology, and ecology of saltcedar (Tamarix spp.) in the southwestern United States. Weed Technology. 12, 326-336 (1998).
  3. Evangelista, P., Kumar, S., Stohlgren, T., Crall, A., Newman, G. Modeling above-ground biomass of Tamarisk ramosissima in the Arkansas River Basin of Southeastern Colorado, USA. Western North American Naturalist. 67, (4), 503-509 (2007).
  4. Hirano, A., Madden, M., Welch, R. Hyperspectral image data for mapping wetland vegetation. Wetlands. 23, (2), 436-448 (2003).
  5. Ge, S., Carruthers, R., Gong, P., Herrera, A. Texture analysis for mapping Tamarix pariviflora using aerial photographs along Cache Creek, California. Environmental Monitoring and Assessment. 114, 65-83 (2006).
  6. Hamada, Y., Stow, D. A., Coulter, L. L., Jafolla, J. C., Hendricks, L. W. Detecting tamarisk species (Tamarisk spp.) in riparian habitats of Southern California using high spatial resolution hyperspectral imagery. Remote Sensing of Environment. 109, 237-248 (2007).
  7. York, P., Evangelista, P., Kumar, S., Graham, J., Flather, C., Stohlgren, T. A Habitat Overlap Analysis derived from Maxent for Tamarisk and the Southwestern Willow Flycatcher. Frontiers of Earth Science. 5, (2), 120-129 (2011).
  8. Myneni, R. B., Ramakrishna, R., Nemani, R., Running, S. W. Estimation of global leaf area index and absorbed par using radiative transfer models. Geoscience and Remote Sensing. 35, (6), 1380-1393 (1997).
  9. Todd, S. W., Hoffer, R. M., Milchunas, D. G. Biomass estimation on grazed and ungrazed rangelands using spectral indices. International Journal of Remote Sensing. 19, (3), 427-438 (1998).
  10. Rouse, J. W., Haas, R. H., Schell, J. A., Deering, D. W. Monitoring vegetation systems in the Great Plains with ERTS. Proceedings of the Third Earth Resources Technology Satellite-1 Symposium. (1974).
  11. Huete, A. R. A Soil-Adjusted Vegetation Index (SAVI). Remote Sensing of Environment. 25, 295-309 (1988).
  12. Kauth, R. J., Thomas, G. S. The tasselled cap - a graphic description of the spectral-temporal development of agricultural crops as seen in Landsat. Proceedings of the Symposium on Machine Processing of Remotely Sensed Data. LARS, Purdue University. West Lafayette, Indiana. 41-51 (1976).
  13. Cohen, W. B., Spies, T. A., Fiorella, M. Estimating the age and structure of forests in a multi-ownership landscape of western Oregon, USA. International Journal of Remote Sensing. 16, 721-746 (1995).
  14. Jin, S., Sader, S. Comparison of time series tasselled cap wetness and the normalized difference moisture index in detecting forest disturbances. Remote Sensing of Environment. 94, (3), 364-372 (2005).
  15. Crist, E. P. A TM Tasseled Cap equivalent transformation for reflectance factor data. Remote Sensing of Environment. 17, (3), 301-306 (1985).
  16. Lindauer, I. E. A comparison of the plant communities of the South Platte and Arkansas River drainages in eastern Colorado. The Southwestern Naturalist. 28, (3), 249-259 (1983).
  17. Riparian Restoration: Assessment of alternative technologies for tamarisk control, biomass reduction and revegetation. Tamarisk Coalition. Available from: http://www.tamariskcoalition.org (2008).
  18. Guisan, A., Zimmerman, N. Predictive habitat distribution models in ecology. Ecological Modeling. 135, 147-186 (2000).
  19. Friedman, J. H., Hastie, T., Tibshirani, R. Additive logistic regression: a statistical view of boosting. Annals of Statistics. 28, (2), 337-407 (2000).
  20. Breiman, L. Random forests. Machine Learning. 45, (1), 5-32 (2001).
  21. Friedman, J. H. Multivariate adaptive regression splines. Annals of Statistics. 19, (1), 1-141 (1991).
  22. McCullagh, P., Nelder, J. A. Generalized Linear Models, 2nd ed. Chapman and Hall. London. (1989).
  23. Phillips, S. J., Anderson, R. P., Schapire, R. E. Maximum entropy modeling of species geographic distributions. Ecological Modelling. 190, (3-4), 231-259 (2006).
  24. Araujo, M. B., New, M. Ensemble forecasting of species distributions. Trends in Ecology and Evolution. 22, 42-47 (2007).
  25. Elith, J., Graham, C. H. Do they? How do they? Why do they differ? On finding reasons for differing performances of species distribution models. Ecography. 32, 66-77 (2009).
  26. Freire, J., Silva, C., Callahan, S., Santos, E., Schedegger, C. Managing rapidly-evolving scientific workflows. International Provenance and Annotation Workshop (IPAW). Moreau, L., Foster, I. Springer. 10-18 (2006).
  27. Morisette, J. T., Jarnevich, C. S., Holcombe, T. R., Talbert, C. B., Ignizio, D., Talbert, M. K., et al. VisTrails SAHM: visualization and workflow management for species habitat modeling. Ecography. 36, (2), 129-135 (2013).
  28. Fielding, A. H., Bell, J. F. A review of methods for the assessment of prediction errors in conservation presence/absence models. Environmental Conservation. 24, 38-49 (1997).
  29. Allouche, O., Tsoar, A., Kadmon, R. Assessing the accuracy of species distribution models: prevalence, kappa and the true skill statistic (TSS). Journal of Applied Ecology. 43, (6), 1223-1232 (2006).
  30. Stohlgren, T. J., Ma, P., Kumar, S., Rocca, M., Morisette, J., Jarnevich, C. S. Ensemble habitat mapping of invasive plant species. Risk Analysis. 30, 224-235 (2010).
  31. Dormann, C. F., Purschke, O., Marquez, J. R. G., Lautenbach, S., Schrader, B. Components of uncertainty in species distribution analysis: A case study of the great grey shrike. Ecology. 89, 3371-3386 (2008).
  32. Marmion, M., Parviainen, M., Luoto, M., Heikkinen, R. K., Thuiller, W. Evaluation of consensus methods in predictive species distribution modelling. Diversity and Distributions. 15, 59-69 (2009).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics