Skip To Content

Geographisch gewichtete Regression

Geographisch gewichtete RegressionFührt eine geographisch gewichtete Regression (GWR) durch. Dies ist eine lokale Form der linearen Regression zur Modellierung räumlich variierender Beziehungen.

Workflow-Diagramm

Workflow-Diagramm "Geographisch gewichtete Regression"

Durchführen von Analysen mit GeoAnalytics Tools

Mit GeoAnalytics Tools durchgeführte Analysen werden mittels verteilter Verarbeitung auf mehreren ArcGIS GeoAnalytics Server-Computern und Kernen durchgeführt. GeoAnalytics Tools und Standard-Feature-Analysewerkzeuge in ArcGIS Enterprise verfügen über verschiedene Parameter und Funktionen. Weitere Informationen zu diesen Unterschieden finden Sie unter Unterschiede zwischen Feature-Analysewerkzeugen.

Beispiele

  • Ist die Beziehung zwischen Bildungsabschluss und Einkommen im gesamten Untersuchungsgebiet konsistent?
  • Was sind die Hauptvariablen, die eine hohe Waldbrandhäufigkeit erklären?
  • In welchen Bezirken erzielen Kinder gute Ergebnisse bei Leistungstests? Welche Eigenschaften scheinen verknüpft zu sein? Wo sind die einzelnen Eigenschaften am wichtigsten?

Verwendungshinweise

Dieses Werkzeug führt eine geographisch gewichtete Regression (GWR) durch, eine lokale Form von Regression zur Modellierung räumlich variierender Beziehungen. Das GWR-Werkzeug erstellt ein lokales Modell der Variable oder des Prozesses, die bzw. den Sie verstehen oder vorhersagen möchten, indem eine Regressionsgleichung an jedes Feature im Dataset angepasst wird. Das Werkzeug Geographisch gewichtete Regression (GWR) erstellt diese separaten Gleichungen durch Einbeziehung der abhängigen und erklärenden Variablen von Features in der Nachbarschaft der einzelnen Ziel-Features. Form und Ausdehnung jeder analysierten Nachbarschaft basieren auf den Eingaben für den Parameter Festlegen, wie die Nachbarschaft bestimmt wird.

Das Werkzeug Geographisch gewichtete Regression (GWR) erzeugt zudem Ausgabe-Features und Diagnosewerte. Ausgabe-Feature-Classes werden automatisch zur Karte hinzugefügt, wobei ein Rendering-Schema auf Modellresiduen angewendet wird. Eine vollständige Erklärung jeder Ausgabe wird nachfolgend bereitgestellt.

Es ist üblich, die Daten global mit dem Werkzeug Generalisierte lineare Regression zu erkunden, bevor Sie die Daten lokal mit dem GWR-Werkzeug erkunden.

Die Parameter Das zu modellierende Feld auswählen und Die erklärenden Felder auswählen sollten numerische Felder mit unterschiedlichen Werten sind. Es sollte global und lokal eine Variation in diesen Werten geben. Verwenden Sie deshalb keine erklärenden "Dummy"-Variablen, um die verschiedenen räumlichen Ordnungen in Ihrem GWR-Modell darzustellen (z. B. Zuweisen des Wertes 1 zu Zählbezirken außerhalb des Stadtkerns, wenn allen anderen der Wert 0 zugewiesen wird). Da beim GWR-Werkzeug die erklärenden Variablenkoeffizienten variieren können, sind diese erklärenden Variablen für räumliche Ordnungen unnötig. Wenn sie einbezogen werden, können sie Probleme aufgrund von lokaler Multikollinearität verursachen.

In globalen Regressionsmodellen wie Generalisierte lineare Regression sind die Ergebnisse unzuverlässig, wenn zwei oder mehr Variablen Multikollinearität aufweisen (wenn zwei oder mehr Variablen redundant sind oder das Gleiche aussagen). Das GWR-Werkzeug erstellt eine lokale Regressionsgleichung für jedes Feature im Dataset. Wenn die Werte für eine bestimmte erklärende Variable zur räumlichen Cluster-Bildung neigen, liegen wahrscheinlich Probleme mit lokaler Multikollinearität vor. Das Feld für Bedingungswerte (COND_ADG) in der Ausgabe-Feature-Class gibt an, wann Ergebnisse aufgrund von lokaler Multikollinearität instabil sind. Betrachten Sie im Allgemeinen Ergebnisse für Features mit einem Bedingungswert größer als 30, gleich null oder (für Shapefiles) gleich -1.7976931348623158e+308 skeptisch.

Bei Verwendung von Nominal- oder Kategoriedaten in einem GWR-Modell ist Vorsicht angebracht. Wenn Kategorien zur räumlichen Cluster-Bildung neigen, treten sehr wahrscheinlich Probleme aufgrund von lokaler Multikollinearität auf. Der in der Ausgabe des GWR-Werkzeugs enthaltene Bedingungswert gibt an, wann lokale Kollinearität ein Problem darstellt (ein Bedingungswert kleiner als null (0), größer als 30 oder gleich NULL). Bei einer starken lokalen Multikollinearität sind die Ergebnisse instabil.

Bei einem falsch angegebenen Regressionsmodell handelt es sich um ein Modell, in dem eine wichtige erklärende Variable fehlt. Die statistisch signifikante räumliche Autokorrelation in den Regressionsresiduen oder die unerwartete räumliche Variation unter den Koeffizienten einer oder mehrerer erklärender Variablen weist darauf hin, dass das Modell falsch angegeben ist. Ermitteln Sie mit allen verfügbaren Analysemethoden (zum Beispiel die Untersuchung von GLR-Residuen und GWR-Koeffizientenvariationen) welche wichtigen Variablen fehlen, damit sie in das Modell aufgenommen werden können.

Hinterfragen Sie stets, ob es sinnvoll ist, dass eine erklärende Variable nicht stationär ist. Nehmen Sie beispielsweise an, Sie modellieren die Verbreitung einer bestimmten Pflanzenart als Funktion mehrerer Variablen einschließlich ASPECT. Wenn Sie feststellen, dass sich der Koeffizient für die Variable ASPECT über das Untersuchungsgebiet hinweg ändert, weist dies darauf hin, dass eine wichtige erklärende Variable fehlt (zum Beispiel die Verbreitung einer konkurrierenden Vegetationsart). Treffen Sie alle möglichen Maßnahmen, damit alle wichtigen erklärenden Variablen in Ihrem Regressionsmodell enthalten sind.

Schwerwiegende Probleme beim Modellentwurf oder Fehler mit der Meldung, dass die Anzahl an Nachbarn in lokalen Gleichungen nicht ausreicht, weisen oft auf globale oder lokale Multikollinearität hin. Um die Problemursache zu ermitteln, führen Sie ein globales Modell mit Generalisierte lineare Regression aus, und untersuchen Sie den VIF-Wert für jede erklärende Variable. Wenn einige der VIF-Werte sehr groß sind (z. B. größer als 7,5), verhindert die globale Multikollinearität die Berechnung mit dem GWR-Werkzeug. Jedoch ist wahrscheinlich eher eine lokale Multikollinearität das Hauptproblem. Versuchen Sie, eine thematische Karte für jede erklärende Variable zu erstellen. Wenn die Karte räumliche Cluster-Bildung von identischen Werten erkennen lässt, entfernen Sie diese Variablen aus dem Modell oder kombinieren Sie diese Variablen mit anderen erklärenden Variablen, um die Wertvariation zu erhöhen. Wenn Sie beispielsweise Immobilienwerte modellieren und für Schlafzimmer wie auch Badezimmer über Variablen verfügen, ist es möglicherweise sinnvoll, diese zu kombinieren, um die Wertvariation zu erhöhen oder sie als kombinierte Größe darzustellen. Vermeiden Sie beim Erstellen von GWR-Modellen die Verwendung der folgenden Variablen: Dummy-Variablen für räumliche Ordnungen, Kategorievariablen bzw. nominale Variablen für räumliche Cluster-Bildung oder Variablen mit sehr wenigen möglichen Werten.

Geographisch gewichtete Regression (GWR) ist ein lineares Modell, für das die gleichen Anforderungen wie für Generalisierte lineare Regression gelten. Prüfen Sie die in Funktionsweise des Werkzeugs "Geographisch gewichtete Regression" erläuterte Diagnose sorgfältig, um sicherzustellen, dass Ihr GWR-Modell ordnungsgemäß festgelegt ist. Der Abschnitt Wie Regressionsmodelle ungültig werden im Dokument Grundlagen zur Regressionsanalyse bietet ebenfalls Informationen, um die Richtigkeit Ihres Modells sicherzustellen.

Die Parameter "Abhängige Variable" und "Erklärende Variable" sollten numerische Felder sein, die eine Vielzahl von Werten enthalten. Dieses Werkzeug kann keine Berechnung vornehmen, wenn die Variablen alle dieselben Werte aufweisen (wenn beispielsweise alle Werte für ein Feld 9,0 betragen).

Features mit Vorhersage- oder erklärenden Feldern, die mindestens einen NULL-Wert oder eine leere Zeichenfolge aufweisen, werden aus der Ausgabe ausgeschlossen. Sie können die Werte bei Bedarf über die Option Feld berechnen ändern.

Sie sollten die in Ihren Regressionsresiduen vorhandenen zu hohen und zu niedrigen Vorhersagen visuell überprüfen, um festzustellen, ob sie Aufschluss über potenzielle fehlende Variablen in Ihrem Regressionsmodell geben.

Wenn Schnittpunkt, geschätzte Koeffizienten, vorhergesagte Werte, Residuen und Bedingungswerte NULL sind, weist dies möglicherweise auf eine schlechte Modellanpassung hin. Dies kann bei einem oder mehreren Features im Modell der Fall sein und folgende Gründe haben:

  • Not enough neighbors. Features mit weniger als zwei Nachbarn weisen keine Modellanpassung auf.
  • Multikollinearität im Modell

In den oben genannten Fällen sollte das Modell durch Überprüfen der Ausgabediagnosewerte bewertet und ggf. mit verschiedenen Parametern und Koeffizienten neu angepasst werden.

Ausgaben

Das Werkzeug "Geographisch gewichtete Regression" erzeugt Ausgaben. Eine Zusammenfassung des GWR-Modells ist neben statistischen Zusammenfassungen auf der Elementseite des Portals und als Ressource im Layer verfügbar. Klicken Sie zum Aufrufen der Ergebnisübersicht im resultierenden Layer in Map Viewer auf Ergebnisse anzeigen Ergebnisse anzeigen. Das Werkzeug generiert einen Ausgabe-Layer. Die Ausgabe-Features werden automatisch zu Map Viewer hinzugefügt, wobei ein Hot/Cold-Rendering-Schema auf Modellresiduen angewendet wird. Die generierten Diagnosen hängen vom Modelltyp der Eingabe-Features ab und werden nachfolgend beschrieben.

Kontinuierlich (Gauß)

Interpretieren von Meldungen und Diagnosen

  • AICc: AICc wendet bei kleineren Stichproben eine Verzerrungskorrektur auf AIC-Werte an. Der AICc-Wert nähert sich mit zunehmender Anzahl der Features in der Eingabe dem AIC-Wert an.
  • R-Squared: Der R-Squared-Wert ist ein Messwert für die Qualität der Übereinstimmung. Der Wert variiert von 0.0 bis 1.0, wobei höhere Werte vorzuziehen sind. Er kann als Anteil der abhängigen Variablenvarianz durch das Regressionsmodell interpretiert werden. Der Nenner für die Berechnung von R-Squared ist die Summe von abhängigen Variablenwerten im Quadrat. Durch Hinzufügen einer zusätzlichen erklärenden Variable zum Modell wird nicht der Nenner, sondern der Zähler geändert; dadurch entsteht der Eindruck, dass die Modelleignung verbessert wird, was aber möglicherweise nicht der Fall ist. Siehe Adjusted R-Squared unten.

Beschränkungen

Die GeoAnalytics-Implementierung des Werkzeugs "Geographisch gewichtete Regression" unterliegt folgenden Beschränkungen:

  • Sie können weder einen anderen Layer vorhersagen noch Raster-Koeffizienten-Layer erstellen.
  • Das Modellieren von binären (logistischen) Variablen oder der Variablen Anzahl (Poisson) ist nicht möglich.
  • Die Nachbarschaftssuche kann nicht mit Golden Search oder manuellen Intervallen definiert werden.

Beispiel für ArcGIS API for Python

Das Werkzeug "Generalisierte gewichtete Regression" ist über ArcGIS API for Python verfügbar.

In diesem Beispiel werden Umsätze von Geschäften im ganzen Land gesucht.

# Import the required ArcGIS API for Python modules import arcgis from arcgis.gis import GIS
# Connect to your ArcGIS Enterprise portal and check that GeoAnalytics is supported portal = GIS("https://myportal.domain.com/portal", "gis_publisher", "my_password", verify_cert=False) if not portal.geoanalytics.is_supported():
    print("Quitting, GeoAnalytics is not supported")    exit(1)   
# Search for and list the big data file shares in your portal search_result = portal.content.search("", "Big Data File Share")
# Look through search results for the big data file share of interest bd_layer = next(x for x in search_result if x.title == "bigDataFileShares_Sales_2018")
# Run the tool GWR gwr_result = arcgis.geoanalytics.analyze_patterns.gwr(input_layer = bd_layer,     explanatory_variables = "population, customers",
    dependent_variable = "total_sales"
    model_type = "Continuous",    neighborhood_type = "NumberOfNeighbors",    neighborhood_selection_method = "UserDefined",    number_of_neighbors = "100",    local_weighting_scheme = "BiSquare",    output_trained_name = "GWR_results")
# If you are running Python in a Jupyter Notebook, visualize the results processed_map = portal.map() processed_map.add_layer(gwr_result) processed_map

Ähnliche Werkzeuge

Verwenden Sie das ArcGIS GeoAnalytics Server-Werkzeug "Geographisch gewichtete Regression" zur Modellierung räumlich variierender Beziehungen. Andere Werkzeuge können bei ähnlichen, aber leicht abweichenden Problemstellungen hilfreich sein.

Map Viewer-Analysewerkzeuge

Mit dem ArcGIS GeoAnalytics Server-Werkzeug Generalisierte lineare Regression können Sie generalisierte lineare Modelle und Vorhersagen erstellen.

Mit dem ArcGIS GeoAnalytics Server-Werkzeug Forest-basierte Klassifizierung und Regression können Sie Modelle und Vorhersagen erstellen.

ArcGIS Desktop-Analysewerkzeuge

Um dieses Werkzeug in ArcGIS Pro auszuführen, muss auf Ihrem aktiven Portal Enterprise 10.8 oder höher ausgeführt werden. Sie müssen sich mit einem Konto anmelden, dem Berechtigungen zum Durchführen von GeoAnalytics-Feature-Analysen zugewiesen sind.

Ähnliche Regressionsoperationen können Sie in ArcGIS Pro mit dem Geoverarbeitungswerkzeug Geographisch gewichtete Regression durchführen, das Teil der Toolbox "Räumliche Statistiken" ist.

Erstellen Sie Modelle und Vorhersagen in ArcGIS Pro mit einer Adaption des "Random Forest"-Algorithmus von Leo Breiman, dem Geoverarbeitungswerkzeug Forest-basierte Klassifizierung und Regression, das Teil der Toolbox "Räumliche Statistiken" ist.