Ziel des Projekts
Mit Fernerkundungsdaten (Luftbilder, Satellitendaten etc.) können große Teile der Erdoberfläche in immer kürzeren zeitlichen Abständen immer genauer erfasst und thematisch vielfältiger abgebildet werden. Daher besitzen Fernerkundungsdaten ein großes Analysepotenzial und sind somit für die amtliche Statistik als zusätzliche Datenquelle von besonderem Interesse. Die Datenmengen in der Fernerkundung sind mittlerweile sehr umfangreich, sodass für ihre Verarbeitung neue Auswertungsverfahren benötigt werden.
Moderne KI-Verfahren aus dem Bereich des Deep Learning bieten dafür vielversprechende Lösungsansätze. Diese Algorithmen erkennen heutzutage Muster in Bilddaten, die früher nur dem menschlichen Auge vorbehalten waren.
Hier setzt das Eurostat-Projekt „Deep Solaris“ an. Es wurde untersucht, ob sich Solarenergieanlagen mithilfe von Deep Learning-Verfahren automatisiert auf Luft- und Satellitenbildern erkennen lassen. Diese Informationen sind von besonderem Interesse, da die Verbreitung von Solaranlagen ein wichtiger Nachhaltigkeitsindikator im Zeichen der Energiewende ist. Entsprechende Daten liegen jedoch für den europäischen Raum nicht flächendeckend vor.
In Kooperation mit dem Statistischen Bundesamt (Destatis), dem Nationalen Statistikamt Belgien (Statbel), dem Nationalen Statistikamt der Niederlande (CBS) sowie dem niederländischen Institut „Business Intelligence & Smart Services“ (BISS) wurde an einer grenzübergreifenden Lösung zur Bilderkennung von Solarenergieanlagen gearbeitet. Die Aufgabe vom Statistischen Landesamt Nordrhein-Westfalen (IT.NRW) bestand darin, die vom CBS und BISS entwickelten Deep Learning-Modelle für ausgewählte Regionen in Nordrhein-Westfalen zu validieren.
Methodisches Vorgehen
Deep Learning ist ein Ansatz aus dem Bereich des maschinellen Lernens. Er beruht auf mehrschichtigen künstlichen neuronalen Netzen (KNN), die in der Lage sind, Cluster zu bilden und z. B. Objekte auf Bildern aufgrund von Mustern zu klassifizieren. Aufgebaut sind KNNs in mehreren „Schichten“. Zwischen der ersten (Eingabeschicht) und der letzten Schicht (Ausgabeschicht) befinden sich mehrere „verborgene Schichten“ (Abb. 1).
IT.NRW
Abb.1: Aufbau eines künstlichen neuronalen Netzes
Jede der verborgenen Schichten besteht aus mehreren künstlichen Neuronen. Erkannte und gelernte Merkmale werden gewichtet und von Schicht zu Schicht weitergeleitet, bis auch komplexe Strukturen und Muster erkannt werden.
In der Bilderkennung haben sich vor allem Faltungsnetzwerke, sogenannte Convolutional Neural Networks (Gefaltetes Neuronales Netzwerk, kurz: CNN) etabliert, die auch im Projekt „Automatisiertes Erkennen von Baustellen anhand von Luftbildern und neuronalen Netzen“ angewandt werden. Wie andere neuronale Netze besteht ein CNN ebenfalls aus einer Eingabeschicht, einer Ausgabeschicht und zahlreichen verborgenen Schichten dazwischen. Die einzelnen Neuronen sind jedoch in den sogenannten „Faltungsschichten“ nicht mehr mit allen Neuronen der vorherigen Schicht verbunden. Zudem werden Gewichte von mehreren Neuronen gemeinsam genutzt. Hierdurch kann die Anzahl der benötigten Parameter stark reduziert werden, weshalb sich CNNs für große Eingabedaten, wie dies bei Bilddaten der Fall ist, gut eignen.
Für das Projekt „Deep Solaris“ wurden mehrere CNNs modelliert (VGG16, InceptionV3, InceptionResNetV2, DenseNet und Xception) und mit Bilddaten aus den Niederlanden, den USA und Nordrhein-Westfalen trainiert und getestet. Die Performanz der Modelle wurde anschließend mit Bilddaten aus einer der jeweils anderen Regionen überprüft.
Ergebnisse
Bereits zu Beginn des Projektes wurde die Idee, frei zugängliche und kommerzielle Satellitenbilder zur Detektion von Solaranlagen zu nutzen, verworfen. Zu geringe Bodenauflösungen bzw. nicht flächendeckende Verfügbarkeiten machen sie ungeeignet für das Vorhaben. Die Erprobung der Modelle erfolgte deshalb ausschließlich anhand von Luftbildern.
Alle Modelle wurden hinsichtlich ihrer erreichten Fehlerrate und Genauigkeit ausgewertet und schrittweise optimiert. Bei den meisten Modellen erwies sich die Anzahl der fälschlich als positiv klassifizierten Bildkacheln als problematisch (vgl. Abb. 2: Falsch-positiv).
IT.NRW
Abb. 2: Beispielhafte Darstellung der Klassifikationsergebnisse für NRW (Quelle: Geobasisdaten der Kommunen und des Landes NRW © Geobasis NRW. Keine offizielle Standardversion).
Während die Bildkacheln ohne Solaranlagen meist korrekt als solche klassifiziert wurden, fiel die Quote der korrekt klassifizierten Bildkacheln mit Solaranlagen in der Regel schlechter aus. Auch eines der besten Modelle, auf Basis eines VGG16 Netzwerkes, klassifizierte im Validierungslauf Bildkacheln mit Solaranlagen nur zu 85 Prozent korrekt (Testlauf: 94 Prozent).
Bei der Anwendung des Modells auf andere Regionen oder Länder entstehen demnach noch viele fehlerhafte Zuordnungen. Maschinelles Erkennen von Solaranlagen aus Luftbildern ist jedoch grundsätzlich möglich. Lediglich eine vollautomatisierte Lösung kann der aktuelle Ansatz derzeit noch nicht bieten.
Datengrundlage
- Solaranlagenstandorte in NRW (Eigner: Landesamt für Natur, Umwelt und Verbraucherschutz NRW (LANUV))
- Digitale Orthophotos aus NRW mit einer Bodenauflösung von 10 cm (DOP10) bzw. 20 cm (DOP20) (Eigner: Geobasis NRW, Geobasisdaten der Kommunen und des Landes NRW)
- Digitale Orthophotos aus den Niederlanden mit einer Bodenauflösung von 10 bzw. 25 cm
- Digitale Orthophotos aus Kalifornien, USA mit einer Bodenauflösung von 30 cm
Laufzeit
2. Quartal 2018 bis 4. Quartal 2019
Kooperationen
- Nationales Statistikamt der Niederlande (Statistics Netherlands) – Projektleitung
- Statistisches Bundesamt (Destatis)
- Nationales Statistikamt Belgien (Statistics Belgium)
- Niederländisches Institut „Business Intelligence & Smart Services“ (BISS) – Konsortium von drei Universitäten (Universität Maastricht, Open Universität und Zuyd Hogeschool)