Das weite Feld der Methoden des Machine Learnings lässt sich vor allem durch zwei Worte beschreiben – komplex und theoretisch. Für viele Businessanwender, die keinen Hintergrund in der Statistik oder dem Software Engineering besitzen, erscheint die Implementierung daher zunächst wie ein Puzzle eines wolkenlosen, blauen Himmels. Tausend Fragen stellen sich: „Wo lassen sich die größten Effizienzsteigerungen realisieren?“, „Was wird für den Einsatz benötigt?“, „Woher kommt die Expertise zur Umsetzung?“…
Die Hilfestellung durch einen kompetenten Berater, welcher sich mit den Problemen von Unternehmen und gleichzeitig der Umsetzung von KI-Applikationen auskennt, ist daher unerlässlich.

In den kommenden beiden Beiträgen soll es darum gehen, welche Schritte für die Umsetzung eines Machine Learning-Projekts notwendig sind und was ein guter Berater dabei leisten kann. Die Problemstellung soll dafür in drei Teilfelder gegliedert werden. In diesem Beitrag dreht sich alles um die ersten beiden Teilfelder „Anwendungsfälle finden“ und „Den passenden Algorithmus auswählen“. Der kommende Beitrag wird dem Teilfeld „Das richtige Sammeln und Aufbereiten von Daten“ gewidmet sein.

Anwendungsfälle finden

Bei der Suche nach potenziellen Anwendungsgebieten im eigenen Unternehmen, sollte man zunächst die Stärken des Machine Learnings im Hinterkopf behalten. Überall dort, wo basierend auf großen Menge von Daten -die entweder vorhanden ist, oder gesammelt werden kann- Entscheidungen getroffen werden müssen, spielen die meisten Algorithmen ihre Stärken aus. Soll der Algorithmus dann optimale Ergebnisse erzielen, muss das Problem zudem auf eine für den Algorithmus verständliche Ebene heruntergebrochen werden. Damit ist gemeint, dass die meisten Methoden nicht dazu gedacht sind offene Fragestellungen zu beantworten, sondern aus gegebenen Datensätzen Muster oder Zusammenhänge zu finden. Klassische Beispiele sind die Suche nach Mustern in Kunden-, oder Auslastungsdaten, oder auch die Vorhersage von Entwicklungen in Zeitreihen wie Lieferdaten und Produktionszyklen.
In unserer Beratungsfunktion beginnen wir dabei zunächst mit der Analyse von Prozessen auf Mandantenseite. Im Fokus stehen für uns Prozesse, die mit einem hohen Datenaufkommen verbunden sind, oder für welche öffentlich zugängliche Daten bereitstehen. Oftmals ist es zudem sinnvoll bestehende Datenbanken von Mandanten zu sichten und im Hinblick auf allgemein bekannte Verfahren Use Cases zu entwickeln. Dadurch können tote Datenbestände zu wichtigen Werttreibern werden, die Prozesse maßgeblich unterstützen.

Den passenden Algorithmus wählen

Die Suche nach einem anwendungsgerechten Machine Learning-Verfahren ist neben der passenden Problemstellung die Grundlage für den Einsatz im eigenen Unternehmen. Wurde die Aufgabe für den Algorithmus definiert und die vorhandene Datenbasis gesichtet, stellt der Algorithmus selbst das Bindeglied von der Vorbereitung zum Ergebnis dar. Um ein grundlegendes Gefühl dafür zu entwickeln, in welcher Situation was für eine Gattung von Algorithmen einzusetzen ist, wurden die drei verschiedenen Funktionsweisen im letzten Blogbeitrag vorgestellt. Weiß man nun also Bescheid, ob eine Methode des überwachten, oder des unüberwachten Lernens verwendet werden soll -verstärkendes Lernen wird bisher kaum von Businessanwendern eingesetzt-, geht es darum sich innerhalb der Klasse für ein passendes Verfahren zu entscheiden. Für Berater und Verantwortliche im Unternehmen ist es zu diesem Zeitpunkt nicht nur wichtig durch Erfahrung die passenden Methoden zu herauszuarbeiten. Vielmehr ist Erfahrung im Hinblick auf die Modifikation von bestehenden Verfahren und eine sinnvolle Performancemessung gefragt.
Auf dieser Grundlage können mehrere Verfahren, zunächst im Hinblick auf einfache Performancemaße, an den Daten getestet werden. Erreichen ein oder mehrere Verfahren zufriedenstellende Genauigkeiten, kann im nächsten Schritt die Umsetzung der Verfahren geprüft werden. Die Integration in bereits bestehende technische Lösungen stellt oftmals das kleinere Problem dar, vielmehr sollte analysiert werden, wie robust das Verfahren ist, wenn sich äußere Umstände ändern, oder ob es Lösungen gibt, mit denen sich der Algorithmus dauerhaft an neue Daten anpassen kann. Beispielhaft könnte man darüber nachdenken, dass die Einordnung von Kunden in verschiedene Interessensgebiete mit der Zeit ungenauer wird, sollte sich das Produktsortiment, oder die Kundengruppen ändern.
Im letzten Schritt dreht sich dann alles um die technische Integration der Verfahren in bestehende, oder neue IT-System. Durch die heute vorhanden zahlreichen, kostenlosen Module für gängige Programmiersprachen, wie TensorFlow oder SciKit Learn, stellt dieser Schritt oft das geringste Problem dar und kann oftmals von kompetenten Beratern selbst übernommen werden.

Ausblick

Nachdem dieser Beitrag die grobe Umsetzung von Machine Learning Projekten im eigenen Unternehmen behandelt hat, soll der kommende Beitrag das Sammeln und Aufbereiten von Daten genauer behandeln. Ein wichtiger Begriff, der in diesem Zusammenhang eingeführt werden soll ist das Feature Engineering, das maßgeblich zur Vereinfachung und zum Erfolg von Machine Learning Anwendungen beiträgt.