Wenn das Lernen in die Tiefe taucht – Deep Learning

Eine grundlegende Fähigkeit um Wissen zu generieren, ist die Fähigkeit zur Bildung hierarchischer Konzepte. Allgemeine, noch wenig differenzierte Begriffe schließen speziellere, differenzierte Kategorien mit ein. Auf diesem basalen Lernprinzip basiert das sogenannte Deep Learning. Mit diesem Begriff wird in der Data Science eine besondere Variante maschinellen Lernens bezeichnet, die auf einem mehrschichtigen neuronalen Verarbeitungsnetz basieren.
Diese Lernplattformen sind besonders geeignet für das Lösen von „unscharfen“ Problemen, also Problemen, die nicht hinreichend formalisiert sind und für die daher auch kein Set von Merkmalen zur Einordnung eines zu lernenden Inhaltes vorgeben ist. Deep Learning beschreibt somit nicht nur das Prinzip einer lernenden, sondern einer selbstlernenden Maschine.

Künstliche neuronale Netze

Deep Learning arbeitet dabei durch ein mehrschichtiges künstliches neuronales Netzwerk. Ein neuronales Netzwerk ist ein dem biologischen Gehirn nachempfundenes, durch leistungsfähige Computer simuliertes Netzwerk künstlicher Neuronen. In der Biologie sind die Neuronen die Nervenzellen des Gehirns, die auf eingehende elektrische Signale ab einer gewissen Intensität reagieren und diese moduliert wieder abgeben können. Diese Neuronen sind für sich genommen nur in der Lage, auf eine einzige Unterscheidung zu reagieren, z. B. Helligkeitsunterschiede. Durch Verknüpfung hunderttausender solcher künstlicher Neuronen entstehen jedoch Netzwerke, die auf unterschiedliche Unterscheidungen reagieren können.
Im Deep Learning sind nun mehrere neuronale Netzwerke hierarchisch in Schichten so angeordnet, dass die nachfolgende Schicht jeweils ihre Informationen von der über ihr liegenden Schicht erhält. Somit stehen der nachfolgenden Schicht auch die Unterscheidungen zur Verfügung, die in der vorausgegangenen Schicht getroffen wurden. Wird einem neuronalen Netzwerk beispielsweise die Aufgabe gegeben, auf beliebigen Bildern Tiere zu erkennen, muss das Programm durch das Abarbeiten unzähliger Bilder nacheinander immer komplexere Unterscheidungen entwickeln, angefangen von der Grundvoraussetzung überhaupt erst einmal Gegenstände auf Bildern erkennen zu lernen.
Die einzelnen Schichten des Netzwerkes übernehmen dabei einzelne, aufeinander aufbauende Aufgaben. Die erste Schicht erkennt beispielsweise Kontraste, die zweite Linien ausgehend von diesen Kontrasten und so weiter bis Formen und schließlich Tiere erkannt werden können. Sichtbar für die menschlichen Beobachter sind dabei nur jeweils die erste, die Input-Schicht und die letzte, die Output-Schicht. Das Geschehen dazwischen liegt in der Tiefe der übereinander geschichteten Neuronennetze verborgen.
Deep Learning macht sich zur Entwicklung von Orientierungswissen die Kontextualisierung von Informationen zu Nutze: Bestimmte Wörter, beispielsweise die Namen von Hauptstädten, kommen in der Regel nur in einer begrenzten Anzahl von Kontexten vor. Diese Kontexte, für die Maschine Muster in den Datensätzen, können von den künstlichen neuronalen Netzen besonders gut erkannt werden.

Deep Learning in der Predictive Analytics

Diese Fähigkeit zur Mustererkennung in Datensätzen wird unter anderem in den Predictive Analytics genutzt. In diesem Anwendungsbereich des Data Minings werden aus bestehenden Mustern in riesigen Datenmengen (Big Data) Prognosen über die zukünftige Entwicklung von Prozessen und Systemen erstellt. Die Einsatzbereiche von Predictive Analystics erstrecken sich von der Kriminalitätsbekämpfung bis zur Vorhersage von Kaufentscheidungen der Kunden anhand bestimmter Informationen über sie. Betriebswirtschaftlich von Bedeutung kann das neuronale Lernen auch im Process Mining werden, wenn es darum geht, aus Datenspuren Geschäftsprozesse zu rekonstruieren und zu analysieren.

Die „Königsklasse“ maschinellen Lernens stellt dabei das sogenannte unüberwachte Lernen dar. In dieser Variante künstlicher Lernverfahren muss das neuronale Netzwerk ohne vorgegebene Hilfestellungen jeglicher Art auskommen. Alle Orientierungskategorien müssen vom Netzwerk durch das Verarbeiten riesiger Datensätze selbst erschlossen werden.

Zusammenfassend formuliert, beschreibt Deep Learning ein maschinelles Lernverfahren der Data Analytics, bei dem durch künstliche neuronale Netze aus zunehmend ausdifferenzierten Unterscheidungen Konzepte gebildet werden.