1. Home
  2. Studien
  3. Machine-Learning-Verfahren: Identifikation von empirischen Unternehmenscharakteristika
Manuel Fritsch / Dr. Henry Goecke / Andreas Kulpa IW-Report Nr. 35 24. September 2018 Machine-Learning-Verfahren: Identifikation von empirischen Unternehmenscharakteristika

Dieser Projektabschlussbericht fasst die Ergebnisse des gemeinsamen Projektes der DATAlovers AG, dem Institut der deutschen Wirtschaft und der IW Consult zusammen. Das Konsortium hat sich zusammengeschlossen um zu evaluieren, inwieweit Machine Learning Ansätze in Kombination mit den Inhalten von Unternehmensinternetseiten als primäre Informationsquelle für die wissenschaftliche Forschung angewendet werden können.

PDF herunterladen
Identifikation von empirischen Unternehmenscharakteristika
Manuel Fritsch / Dr. Henry Goecke / Andreas Kulpa IW-Report Nr. 35 24. September 2018

Machine-Learning-Verfahren: Identifikation von empirischen Unternehmenscharakteristika

IW Report

PDF herunterladen

Teilen Sie diesen Artikel:

oder kopieren Sie den folgenden Link:

Der Link wurde zu Ihrer Zwischenablage hinzugefügt!

Institut der deutschen Wirtschaft (IW) Institut der deutschen Wirtschaft (IW)

Dieser Projektabschlussbericht fasst die Ergebnisse des gemeinsamen Projektes der DATAlovers AG, dem Institut der deutschen Wirtschaft und der IW Consult zusammen. Das Konsortium hat sich zusammengeschlossen um zu evaluieren, inwieweit Machine Learning Ansätze in Kombination mit den Inhalten von Unternehmensinternetseiten als primäre Informationsquelle für die wissenschaftliche Forschung angewendet werden können.

Die grundlegende Aufgabenstellung des Projektes besteht darin zu klären, ob die Kombination aus den neuen Methoden des maschinellen Lernens und den Texten von Internetseiten bei der Identifikation von unternehmerischen Zwillingen wissenschaftlichen Ansprüchen genügt. Hierbei sollen validierte Informationen zu einer vergleichsweise kleinen Zahl an Unternehmen auf die Gesamtheit der Unternehmen übertragen werden. Bei einem Erfolg des Ansatzes würde dies bedeuten, dass mit einer kostengünstigen Methode Ergebnisse für alle deutschen Unternehmen gewonnen werden können. Durch diese „quasi-Vollerhebung“ würden sich viele weitere Anwendungsmöglichkeiten für ein Forschungsinstitut eröffnen.

Die Aufgabenteilung in diesem Projekt gestaltet sich wie folgt: Das Institut der deutschen Wirtschaft und die IW Consult liefern die originären Informationen der Unternehmen und übernehmen die Quantifizierung der Ergebnisse. DATAlovers bringt als originäre Daten die Texte der Internetseiten aller deutschen Unternehmen mit ein, trainiert mit der gesamten Datenmenge einen Algorithmus und bestimmt die Prognosen des Algorithmus.

Allgemein stellt die beschriebene Aufgabe ein Klassifizierungsproblem dar: Mit Hilfe einer großen Datenmenge soll für jedes deutsche Unternehmen entschieden werden, ob es zu einer spezifischen Gruppe gehört oder nicht. Für derartige Fragestellungen bietet sich die Verwendung von Machine Learning Methoden an. Da die Zielgrößen (die jeweiligen Gruppen) bekannt sind, ist die Klasse des überwachten maschinellen Lernens (im Gegensatz zum unüberwachten maschinellen Lernen) anzuwenden. Hierzu gehören beispielsweise die Methoden Logistic Regression, Random Forest, Support Vector Machine oder Decision Tree (vgl. ausführlicher dazu Brownlee, 2016; Provost/Fawcett, 2013).

Diese Ansätze werden vermehrt in der aktuellen Forschung und in der Statistik eingesetzt. Beispielsweise werden die Methoden von Feuerhake/Dumpert (2016) bei der Klassifizierung von Unternehmen in die deutsche Handwerksstatistik verwendet. Dumpert et al. (2016) verwenden diese Ansätze, um Unternehmen in den sogenannten Dritten Unternehmenssektor einzusortieren, bei Finke et al. (2017) erfolgt eine Zuordnung der Müttereigenschaft bei Frauen und Dumpert/Beck (2017) verwenden diese Methoden zur Klassifikation der Staatsangehörigkeit bei Personen. Des Weiteren werden aktuell Machine Learning Algorithmen verwendet, um Datensätze miteinander zu verknüpfen (z. B. Schild et. al., 2017). Damit lässt sich dieses Projekt, von der Methode her, den aktuellen Ansätzen in der amtlichen Statistik zuordnen.

PDF herunterladen
Identifikation von empirischen Unternehmenscharakteristika
Manuel Fritsch / Dr. Henry Goecke / Andreas Kulpa IW-Report Nr. 35 24. September 2018

Manuel Fritsch / Dr. Henry Goecke / Andreas Kulpa: Identifikation von empirischen Unternehmenscharakteristika mittels Machine Learning Verfahren

IW Report

PDF herunterladen

Institut der deutschen Wirtschaft (IW) Institut der deutschen Wirtschaft (IW)

Teilen Sie diesen Artikel:

oder kopieren Sie den folgenden Link:

Der Link wurde zu Ihrer Zwischenablage hinzugefügt!

Mehr zum Thema

Artikel lesen
Große KI-Modelle als Basis für Forschung und wirtschaftliche Entwicklung
Joerg Bienert / Hans-Peter Klös IW-Kurzbericht Nr. 58 5. Juli 2022

Große KI-Modelle als Basis für Forschung und wirtschaftliche Entwicklung

Unternehmen und Forschungseinrichtungen in den USA und China haben seit 2020 bahnbrechende Ergebnisse mit sogenannten großen KI-Modellen erzielt. Große Sprachmodelle wie z.B. GPT-3 erlauben bisher nicht realisierbare Anwendungen, vor allem in den Bereichen der ...

IW

Artikel lesen
Michael Hüther / Matthias Diermeier in Ernest Gnan / Christoph Schneider / Claudia Stowasser (Hg.) Schwerpunkt Außenwirtschaft 2021/2022 Externe Veröffentlichung 4. Juli 2022

Globalisation under pressure?: How current megatrends shape the patters of international trade, capital flows and technology diffusion

Deglobalisation, digitalisation, decarbonisation, and demographic change have already left their mark on the global economy. In the future the multiple transformations that the international patterns of specialisation undergo are likely to accelerate as the ...

IW

Mehr zum Thema

Inhaltselement mit der ID 8880