Big Data Analytics

Die Forschungsgruppe befasst sich mit den Möglichkeiten von Big-Data-Analysen: von der Generierung neuer Datensätze über die Kombination bereits bestehender Datensätze bis hin zur Anwendung von Big-Data-Methoden.


Heutzutage steht eine Fülle neuer Daten zur Verfügung, die unter anderem durch Sensoren, das Internet der Dinge und die Nutzung sozialer Plattformen entstehen. Im Zuge des immer schnelleren Anstiegs des Datenaufkommens werden immer häufiger Big-Data-Analysen angewandt, weil sich damit bisher nicht dagewesene Potenziale in vielen Bereichen der Wirtschaft ausschöpfen lassen. Doch um diese Daten zu generieren und sinnvoll zu verwerten, bedarf es spezieller Technologien, Ansätze und Systeme. Die Forschungsgruppe Big Data Analytics beschäftigt sich mit den verschiedenen Aspekten von Big Data mit einem Fokus auf volkswirtschaftliche Fragen.

Schwerpunkte

  • Verarbeitung strukturierter und unstrukturierter Daten, die mit neuen Methoden und Technologien generiert werden – hierzu gehören Internetsuchanfragen, Inhalte von Webseiten (Stellen- und Auftragsausschreibungen, Zeitungen, Preise) sowie Informationen aus Social Media
  • Anwendung von Big-Data-Methoden wie Machine Learning mit Deep Learning, Data Mining, Natural Language Processing, Zeitreihenanalyse etc. vor dem Hintergrund volkswirtschaftlicher Fragestellungen
  • Anwendung von Big Data in der Konjunkturforschung
  • Ergänzung der amtlichen Statistik, beispielsweise in Bezug auf den Arbeitsmarkt
  • Datenökonomie inklusive der kontextabhängigen ökonomischen Analyse des Rechts

 

Beispiel aktueller Forschungsarbeiten

Die Forschungsgruppe nutzt verschiedene Analysemethoden und -ansätze. Big Data Methoden können prinzipiell bei allen relevanten ökonomischen Fragestellungen zum Einsatz kommen. Ein Beispiel stellt die auf Textanalyse basierende Netzwerkanalyse, hier exemplarisch mit Blick auf die deutschen Akteure in der Covid-19-Forschung, dar.

Die Erhebung regionaler Preisdaten mittels Web-Scraping ist ein weiteres Projekt der Forschungsgruppe. Beispielhaft werden hier die Preise für Heizöl auf Postleitzahlebene im März 2021 gezeigt.

Die Analyse von Social-Media-Texten gehört ebenso zum Methoden-Portfolio der Forschungsgruppe. Bei dem folgenden Anwendungsbeispiel handelt es sich um eine Tonalitätsanalyse von Tweets zum Thema Künstliche Intelligenz in den Jahren 2018 und 2019.

Auftragsprojekte

DEMAND – Data Economics and Management of Data-driven Business

Ziel des Projekts war es, Unternehmen dabei zu unterstützen, ihre eigenen Daten als Ressource zu erkennen und zu erschließen. Dazu wurde unter anderem ein Reifegradmodell zum unternehmerischen Status quo hinsichtlich der Nutzung und Bewertung von Daten entwickelt und im Rahmen einer Benchmark-Plattform den Unternehmen bereitgestellt.

Gemeinschaftsprojekt des IW mit Fraunhofer ISST, thyssenkrupp, ADVANEO und BREUER Nachrichtentechnik; Auftraggeber: Bundesministerium für Wirtschaft und Energie; 2018-2019.Weitere Informationen und alle Publikationen zu dem Projekt finden sich hier:

Analyse von Stellenanzeigen

Ziel des Projekts war es, die Effekte der Digitalisierung auf spezifische Berufsprofile zu bestimmen. Zum Aufbau einer Datenbasis wurden Millionen Volltexte aus Stellenausschreibungen der Bundesagentur für Arbeit ausgewertet. Die Datenbasis ermöglichte über den Abgleich der bisherigen Anforderungen mit den aktuell gefragten Kompetenzen berufsspezifische Analysen der Berufsprofile.

Auftraggeber: Fraunhofer IAO; 2019.

Identifikation von beruflichen Übergangspfaden

Transformationsprozesse lösen Anpassungsbedarf bei den Kompetenzen von Beschäftigten aus. Dies kann auf der einen Seite dazu führen, dass bestimmte Berufe und die in ihnen verankerten Kompetenzen vermehrt nachgefragt werden, andere hingegen weniger. Eine solche Situation ist im Strukturwandel üblich, bedeutet aber in Zeiten bedeutender und rascher Technologieänderungen eine große Herausforderung für Unternehmen und Mitarbeiter. In diesem Projekt wurde ein methodischer Ansatz entwickelt, mit dessen Hilfe berufliche Übergangspfade in einem Industriezweig identifiziert werden können. Schwerpunkt dieser Studie waren die Möglichkeiten von Big Data Analysen unter der Verwendung von Volltexten von Stellenanzeigen.

Auftraggeber: Bertelsmann; 2020.

Entwicklung und Messung der Digitalisierung der Wirtschaft am Standort Deutschland

Ziel des Projekts ist die Messung der Digitalisierung der Wirtschaft in Deutschland. Die Messung erfolgt durch die Bildung eines Index, der auf diversen Indikatoren basiert, welche die Digitalisierung in Form von datenbasierten Prozessen, Produkten und Dienstleistungen adäquat adressieren. Der Index wird jährlich aktualisiert. Die Arbeitsergebnisse sollen als Spiegel und Motor des laufenden Digitalisierungsprozesses dienen und damit sowohl der Wirtschaft als auch der Politik einen fundierten Orientierungsrahmen für ihre Entscheidungen bieten.

Gemeinschaftsprojekt mit dem ZEW, dem DIW, der IW Consult und FIR; Auftraggeber: Bundesministerium für Wirtschaft und Energie; 2019-2022.

KI-Monitor

Der KI Monitor misst den Status quo sowie die Entwicklung von KI in Deutschland und entwirft darauf basierende politische Handlungsempfehlungen. Dabei nimmt er die zentralen Bereiche ins Visier, die die Entwicklung von KI beeinflussen und die auch selbst von ihr betroffen sind: die Rahmenbedingungen, die Wirtschaft und die Gesellschaft. Für jeden dieser drei Bereiche werden mehrere Indikatoren erhoben und ausgewertet, welche nach einer Aggregation einen Gesamtwert ergeben, der den Status quo der KI-Nutzung in deutschen Unternehmen beschreibt.

Auftraggeber: Bundesverband Digitale Wirtschaft; 2019-2021.

Investitionen und Exporte: Big Data in der makroökonomischen Analyse

Prognose von Ausrüstungsinvestitionen, Bauinvestitionen, Exporten mit unkonventionellen Datenquellen und Methoden

Ziel des Projekts ist die Untersuchung des Potenzials von unkonventionellen Datenquellen zur Verbesserung der Informationen am aktuellen Rand und der Prognose von Exporten, Anlageinvestitionen und Bauinvestitionen. Auf Basis von ökonomischer Theorie und empirischen Datenquellen werden zu den drei Zielgrößen im Internet geeignete, in der Regel massive, also sehr große und oftmals unstrukturierte Datensätze (Big Data) identifiziert. Anschließend wird der Informationsgehalt der innovativen Datensätze für die Entwicklung der Ausrüstungsinvestitionen, Bauinvestitionen und Exporte empirisch untersucht.

Gemeinschaftsprojekt mit dem RWI, Dortmund Center für datenbasierte Medien-Analyse (DoCMA) und der Ruhr-University Bochum; Auftraggeber: Bundesministerium für Wirtschaft und Energie; 2019-2021.

Regionale Preisindices: Big Data in der makroökonomischen Analyse

Vergleich von regionalen Preisniveaus unter Verwendung von unkonventionellen Datenquellen

In diesem Projekt wird untersucht, inwiefern Preisdaten aus dem Internet oder aus anderen geeigneten Datenquellen die Messung von regionalen Preisniveaus ermöglichen. Ziel ist die Herstellung einer Vergleichbarkeit der unterschiedlichen Preisniveaus in den Regionen. Für die Bestimmung regionaler Preise wird das Wägungsschema des Statistischen Bundesamts zugrunde gelegt, das für die Berechnung der Inflationsrate Anwendung findet. Entsprechend diesem Schema werden Preise aus unkonventionellen Datenquellen erhoben und regionale Preisniveaus berechnet.

Gemeinschaftsprojekt mit dem Bundesinstitut für Bau-, Stadt- und Raumforschung; Auftraggeber: Bundesministerium für Wirtschaft und Energie; 2020-2022.

Aktuelle Publikationen finden Sie auf den Seiten der jeweiligen Mitarbeiter.

Beirat

Die Forschungsgruppe Big Data Analytics wird kontinuierlich von einem Beirat begleitet. Diesem Gremium gehören Personen aus der Wissenschaft sowie der freien Wirtschaft an, um die Forschungsgruppe zielgerichtet zu entwickeln.

Ständige Mitglieder des Beirats sind:

  • Prof. Michael Hüther (Direktor, Institut der deutschen Wirtschaft)
  • Dr. Hans-Peter Klös (Leiter Wissenschaft, Institut der deutschen Wirtschaft)
  • Dr. Karl Lichtblau (Geschäftsführer, IW Consult)
  • Christin Schäfer (Geschäftsführerin, acs plus und Mitglied der Datenethikkommission der Bundesregierung)
Henry Goecke

Dr. Henry Goecke

Leiter der Forschungsgruppe Big Data Analytics

Tel0221 4981-770

Mailgoecke@iwkoeln.de

Zur Profilseite
Marc Scheufen

Dr. Marc Scheufen

Economist in der Forschungsgruppe Big Data Analytics

Tel0221 4981-742

Mailscheufen@iwkoeln.de

@MarcScheufen

Zur Profilseite
Jan Marten Wendt

Jan Marten Wendt

Data Scientist in der Forschungsgruppe Big-Data-Analytics

Tel0221 4981-686

Mailwendt@iwkoeln.de

Zur Profilseite