IT.NRW als Statistisches Landesamt präsentiert in dieser Rubrik neue digitale Daten und Methoden, die unter dem Begriff der experimentellen Statistik zusammengefasst werden.
© Siarhei-AdobeStock
Die Digitalisierung schreitet in großen Schritten voran und eröffnet uns, dem Statistischen Landesamt Nordrhein-Westfalen, neue Wege bei der Datenerhebung, Analyse und Veröffentlichung. Das Feld der experimentellen Statistik untersucht das Potenzial neuer Daten(quellen) und Methoden, die bislang nicht standardmäßig in der amtlichen Statistik genutzt werden. Diese können perspektivisch dazu beitragen, sowohl die Qualität als auch die Aktualität der Statistiken zu erhöhen und gleichzeitig die Auskunftgebenden bei der Erfüllung ihrer Berichtspflicht zu entlasten. Zudem erproben wir beispielsweise den Einsatz neuer Methoden zur Auswertung und Veröffentlichung von kleinräumigen Daten unterhalb der Gemeindeebene.
Es wird zwischen der Gewinnung bzw. Nutzung neuer Daten(quellen) – den sogenannten experimentellen Daten – und der Erprobung alternativer bzw. neuer statistischer Methoden – den sogenannten experimentellen Methoden – unterschieden:
Experimentelle Daten stammen nicht aus den klassischen Erhebungswegen der amtlichen Statistik, sondern aus anderen Quellen wie z. B. Satelliten- oder Luftbildern, Web Scraping oder dem Bereich Big Data.
Experimentelle Methoden sind in der amtlichen Statistik bisher nicht verwendete statistische Verfahren, die alternative Auswertungsmöglichkeiten für vorhandene Statistiken bieten können. Hierzu zählen Verfahren des maschinellen Lernens oder künstlicher Intelligenz sowie Methoden, die unter Wahrung der Geheimhaltung die Veröffentlichung von kleinräumigen Daten ermöglichen.
Anhand von anschaulichen Projektbeschreibungen stellen wir Ihnen auf dieser Seite innovative Praxisbeispiele aus beiden Bereichen der experimentellen Statistik vor, an denen das Statistische Landesamt Nordrhein-Westfalen beteiligt ist. Die Ergebnisse der Projekte werden fortlaufend aktualisiert.
Die Methode der Kerndichteschätzung wird als alternatives Verfahren zur Geheimhaltung von georeferenzierten amtlich-statistischen Daten erprobt.
Eignen sich Deep Learning-Verfahren dazu, anhand von Fernerkundungsdaten Solarenergieanlagen zu identifizieren? Gibt es Algorithmen, die auch grenzübergreifend funktionieren?
Auf Basis der georeferenzierten Daten des statistischen Unternehmensregisters NRWs werden hohe räumliche Konzentrationen von Beschäftigten der Textil- und Bekleidungsindustrie identifiziert.
Auf Basis eigens berechneter Erreichbarkeitszonen werden Entfernungen (Distanzen, Fahrzeiten) von Kindertagesstätten für Regionen mit verschiedenem Urbanisierungsgrad in NRW dargestellt.
Mithilfe von künstlichen neuronalen Netzen sollen Baustellen anhand von Luftbildern identifiziert werden.
Die Small Area-Methode erlaubt auch bei geringen Stichprobenumfängen verlässliche Schätzungen auf kleinräumiger Ebene, indem zusätzlich externe Datenquellen verwendet werden.