Machine learning under concept drift for industrial data using Python

Allgaier, Johannes (2019) Machine learning under concept drift for industrial data using Python. Masters thesis, Institute of Databases and Informations Systems.

[thumbnail of Thesis_Allgaier_875655.pdf] PDF - Repository staff only - Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader
Download (17MB) | Request a copy

Abstract

Künstliche Intelligenz und Machine Learning sind Begriffe, welche in den letzten Jahren nicht zuletzt aufgrund rasant wachsender Rechnerleistungen immer mehr in den Fokus von Industrie und Forschung gerückt sind. Dabei ist für die Industrie vor allem der Informationsgewinn aus Daten von Interesse. Die Validität der Analyse aus historischen Daten ist jedoch in einer sich immer schneller wandelnden Welt fraglich. Die Vorhersagen von Maschinen aus nicht aktuellen Daten können obsolet sein, weil sich deren Kontext geändert hat. Diese Arbeit befasst sich daher mit dem maschinellen Lernen unter Concept Drift. Die Analyse wird mit zwei realen Datensätzen aus der Industrie, unter Simulation eines verteilten Systems, durchgeführt. Es werden dazu verschiedene Regressoren (Polynomregression, Decision Trees, Random Forests und Neuronale Netze) implementiert und die Vorhersagegenauigkeit untereinander verglichen. Bei den Regressoren werden die Einstellungsparameter sowie die Vorhersage- und Trainingszeit variiert. Das Ergebnis zeigt, dass die polynomialen Regressoren den Random Forests, Regression Trees und neuronalen Netzen in der Vorhersagegenauigkeit und Agilität unterlegen sind. Die Vorhersagegenauigkeit nimmt für alle Regressoren ab, wenn die Vorhersagedauer erhöht wird. Random Forests sind gegenüber Regression Trees weniger ausreißerempfindlich. Es lässt sich aus den Ergebnissen nicht erschlieÿen, dass ein Forest genauere Vorhersagen macht als ein Regression Tree, obwohl der Forest als Ensemble agiert. Machine Learning erfährt in den vergangenen Jahren zurecht vermehrt Beachtung in der Forschung und Industrie. Random Forests sind ein effizientes Instrument zur Erfassung von Daten mit unbekannter Verteilung und zur Schätzung von unbekannten Parametern und somit eine echte Alternative zu klassischen Regressionen und neuronalen Netzen.

Item Type: Thesis (Masters)
Subjects: DBIS Research > Master and Phd-Thesis
Divisions: Faculty of Engineering, Electronics and Computer Science > Institute of Databases and Informations Systems
Faculty of Engineering, Electronics and Computer Science > Institute of Databases and Informations Systems > DBIS Research and Teaching > DBIS Research > Master and Phd-Thesis
Depositing User: Herr Burkhard Hoppenstedt
Date Deposited: 17 Sep 2019 14:29
Last Modified: 17 Sep 2019 14:29
URI: http://dbis.eprints.uni-ulm.de/id/eprint/1815

Actions (login required)

View Item
View Item