Was ist Machine Learning?

Dieser Beitrag gibt einen Einstieg in die Technologie und Konzepte des Machine Learnings, einem der wichtigsten Pfeiler aller Künstlicher Intelligenz heutiger Generation. Erklärt in einfachen Worten für nicht-Informatiker, bietet der Beitrag Ihnen Orientierung um Themenfeld und hilft Ihnen, die Bedeutung des Machine Learning für Ihren Unternehmenserfolg besser zu verstehen.

Wenn Sie sich schon einmal mit künstlicher Intelligenz (KI) befasst haben, sind Sie sicher auch über den Begriff „maschinelles Lernen“ gestolpert. Doch was bedeutet das genau? Und was ist daran so wichtig? Im Folgenden beleuchten wir die Einzelheiten dieses Datenverarbeitungsprozesses und zeigen Ihnen, wie Sie ihn gewinnbringend für Ihr Unternehmen nutzen können.

Komplexe Themen wie die Funktionsweise neuronaler Netze im Rahmen des Deep Learning sind schwer zu erfassen. Vor allem, wenn Sie über keinen technischen Hintergrund verfügen. Deshalb beschreiben wir das Konzept eines maschinellen Lernmodells in überschaubaren, leicht verständlichen Schritten.

Was genau ist Machine Learning?

Maschinelles Lernen ist ein Teilbereich der künstlichen Intelligenz (KI). Hierbei geht es um die Analyse von Computeralgorithmen und die Suche nach Mustern in diesen Daten. Beim maschinellen Lernen trainieren Datenwissenschaftler Maschinen, um relevante Datensätze zu durchsuchen und bestimmte Probleme zu lösen.

An einem durchschnittlichen Tag verwendet ein Verbraucher die verschiedensten maschinellen Lernsysteme. Dies kann eine einfache Anwendung sein wie das Einschalten eines Staubsaugerroboters. Oder eine komplexe Aufgabe, wie die Aufforderung an Siri, ein „Café in meiner Nähe“ zu suchen. Hierbei werden im Hintergrund Millionen von Webseiten analysiert. Das maschinelle Lernen kann uns bei allem Möglichen unterstützen. Von der Programmierung eines selbstfahrenden Autos bis hin zu Hinweisen, welche Themen Autoren für ihren nächsten Artikel wählen sollten. Doch auch wenn maschinelles Lernen neu und modern erscheint: Es basiert auf der wissenschaftlichen Arbeit von mehreren Hundert Jahren.

Wann hat das maschinelle Lernen begonnen?

Die ersten Ansätze des maschinellen Lernens gehen auf das Jahr 1763 zurück. In diesem Jahr verfasste Thomas Bayes einen Aufsatz, den Adrien-Marie LeGrande 1812 zum Bayes-Theorem weiterentwickelte. Dieses Theorem beschreibt die Wahrscheinlichkeit von Ergebnissen auf der Grundlage von Vorkenntnissen über relevante Bedingungen. Somit war der Grundstein für maschinelles Lernen gelegt. Das Theorem quantifiziert, wie Sie auf der Grundlage großer Datenmuster Vorhersagen treffen können.

Nach dem Zweiten Weltkrieg wandte Alan Turing, der als Vater der Informatik gilt, dieses Prinzip im Zusammenhang mit Maschinen an. In einem Vortrag von 1947 beschrieb er eine „Maschine, die aus Erfahrung lernen kann“. Drei Jahre später entwickelte er seine eigene lernende Maschine, einen Vorläufer unseres modernen Computers. Im Jahr 1952 schrieb Arthur Samuel das erste Lernprogramm für IBM, welches ein Schachspiel beinhaltete, und prägte 1959 den Begriff „maschinelles Lernen“.

Andere Informatiker trugen in den 1950er und 1960er Jahren ebenfalls zum Maschinellen Lernen bei. Sie entwickelten Maschinen, die weitere Spiele wie Tic-Tac-Toe spielen konnten oder solche, die Landkarten lesen konnten. Die heutigen Modelle des maschinellen Lernens haben sich so massiv weiterentwickelt, dass sie dank neuronaler Netze ähnlich wie das menschliche Gehirn funktionieren. So können sie Muster im menschlichen Verhalten vorhersagen, wie z.B. die Erkennung von Stimmen und Gesichtern. Auch die 

Gesichtserkennung nutzt überwachte maschinelle Lerntechnologien.

Was ist der Unterschied zwischen KI und maschinellem Lernen?

Der Vater der künstlichen Intelligenz, John McCarthy, definiert KI als „die Wissenschaft und Technik der Herstellung intelligenter Maschinen, insbesondere intelligenter Computerprogramme„. Für McCarthy bezog sich „künstlich“ auf Computer und „Intelligenz“ auf die Fähigkeit, Ziele zu erreichen. Somit kann KI auch als Funktionalität betrachtet werden, wie Computer Menschen beim Erreichen eines bestimmten Ziels unterstützen.

Das maschinelle Lernen vertieft dieses Konzept noch weiter. Es ist ein Teilbereich der KI, der es Computern ermöglicht, aus Daten und Mustern zu lernen, ohne dass sie explizit dafür programmiert wurden. Die Maschinen können also durch die Analyse von Mustern in Datensätzen eigenständig lernen. Durch diese Beobachtung von Daten sind sie in der Lage, Vorhersagen zu treffen. Dank dieser Automatisierung können Unternehmen, die maschinelles Lernen einsetzen, die menschliche Produktivität deutlich steigern.

Was sind Beispiele für maschinelles Lernen?

Eins der besten Beispiele für maschinelle Lerntechniken sind die Algorithmen von Google. Google hat seine Maschinen darauf trainiert, die riesigen Mengen von Webseiten im Internet zu durchsuchen und dabei Muster zu erkennen. Die Algorithmen des maschinellen Lernens verarbeiten dabei auch natürliche Sprache. So können nicht nur Schlüsselwörter, sondern auch der Zusammenhang von Artikeln erfasst werden. Dank dieser Fortschritte ist es wahrscheinlicher, dass Ihre Suchergebnisse auch wirklich relevante Informationen erhalten.

Einige der Algorithmen bieten eine Personalisierung, z.B. mit Standortverfolgung. Suchen Sie z. B. nach einer „Pizzeria in meiner Nähe“, wurde der Algorithmus darauf trainiert, Kartenmuster und Standorte zu berücksichtigen. So kann er den richtigen Ort vorhersagen, an den er den Nutzer schicken soll. Ein anderes Beispiel für maschinelle Lernmechanismen ist die automatische Spracherkennung, die dazu beiträgt, das Internet der Sprache voranzutreiben.

Gibt es verschiedene Arten des maschinellen Lernens?

Maschinelles Lernen ist nur so gut wie Ihre Daten. Abhängig von Ihren Daten und Ihren Zielen können Sie maschinelles Lernen in drei allgemeine Kategorien unterteilen: Überwachtes Lernen, unüberwachtes Lernen und bestärkendes Lernen.

Überwachtes Lernen sagt Muster in bekannten Daten voraus. Unüberwachtes Lernen findet versteckte Muster oder Cluster in unbekannten Daten. Beim bestärkenden Lernen treffen Maschinen Entscheidungen auf der Grundlage dynamischer Daten.

Überwachtes Lernen

Überwachtes maschinelles Lernen verwendet Datensätze, die mit eindeutigen Eingabe- und Ausgabevariablen versehen sind. Maschinen verwenden diese Daten, um die Ausgabe neuer Daten vorherzusagen, meist mit Hilfe sogenannter Support-Vektor-Maschinen zur Klassifizierung, Regressionsanalyse und Identifizierung von Ausreißern. Da Sie festlegen, in welcher Form die Daten ausgegeben werden sollen, geben Sie bei diesem Modell die Eingabe- und Ausgabevariablen vor.

Eine beliebte Anwendung des überwachten Lernens ist die Gesichtserkennung. Apple oder Facebook haben Maschinen darauf trainiert, Millionen von Gesichtern zu analysieren. Wenn Sie ein neues Foto machen, können die Maschinen daher in der Regel die Identität der Personen korrekt vorhersagen.

Unüberwachtes Lernen

Arbeiten Sie hingegen nicht mit eindeutigen Daten, ist unüberwachtes maschinelles Lernen möglicherweise besser für die Validierung Ihrer Datensätze. Beim unüberwachten Lernen werden Algorithmen des maschinellen Lernens eingesetzt, um unmarkierte Datencluster zu berücksichtigen.

Ein Beispiel für unüberwachtes Lernen sind Empfehlungen bei Online-Shopping, Filmen oder Musik. Zwar können Algorithmen (noch) nicht immer perfekt einschätzen, was ihre Kunden sehen oder hören wollen. Doch große Muster in den Daten helfen ihnen, ähnlich Ergebnisse zu berücksichtigen. So sieht ein Star Wars-Liebhaber womöglich auch gerne die Serie Mandalorian, aber keinen Jane Austen-Film. Auch beim Online-Shopping oder in den sozialen Medien erhalten Sie dank des unüberwachten Lernens personalisierte Produktempfehlungen.

Bestärkendes Lernen

Bestärkendes Lernen ist ein dynamischer Prozess, bei dem Maschinen nach dem Trial-and-Error-Prinzip trainiert werden. Datenwissenschaftler setzen es ein, wenn sie eine Entscheidung benötigen und mehrere Optionen zur Auswahl haben. Ein Anwendungsbeispiel für Bestärkendes Lernen ist ein Staubsaugerroboter. Sobald er auf ein Hindernis stößt, kann er je nach Umgebung aus mehreren verschiedenen Richtungen wählen. Der Datensatz, also die Raumaufteilung, kann sich dabei ständig ändern. Daher muss die Maschine ihre Richtung ständig anpassen.

Ein weiteres Beispiel ist das Projekt Learning to Run von deepsense.ai in Zusammenarbeit mit der Stanford University. Hierfür wurde eine Maschine entwickelt, die alle Bewegungsnuancen eines Läufers einstudierte. Die Maschinen mussten dabei einer Abfolge von dynamischen Ereignissen folgen, um die Bewegungen des Läufers zu erzeugen.

Neuronale Netzwerke und Deep Learning

Neuronale Netzwerke beim maschinellen Lernen imitieren die Verbindungen im menschlichen Gehirn. Nun haben Sie einen Überblick über die drei grundlegenden Untergruppen des maschinellen Lernens. Eine weitere Gruppe ist das halbüberwachte Lernen, eine Mischung aus überwachtem und unüberwachtem Lernen. Eine der am meisten diskutierten Anwendungen des maschinellen Lernens ist jedoch das Deep Learning. Da dieser Artikel jedoch als allgemeine Einführung in die Thematik des maschinellen Lernens gedacht ist, werden hier nur ein paar Grundlagen zum Thema Deep Learning behandelt.

Deep Learning gilt als skalierbares maschinelles Lernen, da es nicht so sehr von menschlichen Eingriffen abhängig ist und große Datensätze bewältigen kann. Es ist eine Art überwachter maschineller Lernalgorithmus, der aus neuronalen Netzwerken besteht, die dem menschlichen Gehirn ähneln. Neuronale Netzwerke bilden die Struktur der Deep Learning-Algorithmen, wobei der „tiefe“ Teil des Deep Machine Learning von den neuronalen Netzwerkschichten stammt.

Diese neuronalen Netze, oder künstlichen neuronalen Netze, sind eine Form des Bestärkenden Lernens. Wie andere Formen des maschinellen Lernens empfangen sie Daten, erkennen Muster und sagen die Ausgaben für ähnliche Daten voraus. Sie haben eine ähnliche Formation wie die Neuronen im menschlichen Gehirn. Eine Schicht, die Daten empfängt, eine Schicht für die Ausgabe der Daten und mehrere verbundene, aber versteckte Schichten, in denen die Berechnungen stattfinden. Da Deep Learning-Algorithmen umfangreiche Datenmengen ohne menschliches Zutun verarbeiten können, wird diese Technologie beständig weiterentwickelt.

Was sind die Schritte des maschinellen Lernens?

Unabhängig davon, welche Art maschineller Lernalgorithmen Sie verwenden: Sie durchlaufen bei der Lösung eines Problems immer die folgenden sieben Schritte.

1.         Sammeln Sie Ihre Daten.

2.         Bereiten Sie Ihre Daten auf.

3.         Wählen Sie das passende Modell aus.

4.         Trainieren Sie das Modell.

5.         Analysieren Sie das Ergebnis.

6.         Justieren Sie die Parameter.

7.         Wenden Sie Ihr maschinelles Lernen auf reale Projekte an.

1. Sammeln Sie Ihre Daten.

Zunächst müssen Sie sich fragen, was Sie Ihrer Maschine überhaupt beibringen wollen und was Ihre Datenpunkte sind. Im Anschluss müssen Sie Ihre Beispieldaten bereinigen; denn nur so weiß die Maschine, was relevant ist. Haben Sie schlechte Ausgangsdaten, werden Sie auch kein gutes Ergebnis erzielen. Wollen Sie Ihre Maschine z. B. darauf trainieren, den Unterschied zwischen Pferden und Kühen zu erkennen, benötigen Sie viele Bilder beider Tierarten. Denn die Maschine ist nur so gut wie die Eingabedaten.

2. Bereiten Sie Ihre Daten auf.

Im Anschluss müssen Sie Ihre Daten so aufbereiten, dass die Maschine auch versteht, was sie zu tun hat. Machen Sie einen Dublettenabgleich und schaffen Sie eine ausgewogene Datenbasis. Mit anderen Worten: Mit 1.000 Pferdebildern und nur zwei Kuhbildern können Sie Ihre Maschine nicht optimal trainieren.

3. Wählen Sie das passende Modell aus.

Welches Modell ist für Ihre Problemstellung geeignet? Deep Learning oder Gefaltete Neuronale Netzwerke? Eine logistische Regression oder eine Bayes’sche Klassifikation? Es hängt von Ihnen und Ihrem Problem ab, welches Modell des maschinellen Lernens Sie anwenden müssen. Bei komplexeren Datenanwendungen könnten Sie mit unüberwachtem Lernen beginnen, bevor Sie zu einem überwachten Lernmodell übergehen. Da Sie das bestmögliche Ergebnis erzielen möchten, kann das Experimentieren mit verschiedenen Algorithmen die beste Wirkung erzielen.

4. Trainieren Sie das Modell.

In diesem Schritt wertet Ihre Maschine die Daten aus, um Muster zu erkennen und Vorhersagen zu treffen. Teilen Sie Ihren Datensatz in kleinere Prüfsätze und verschiedene Parameter auf, um die Ergebnisse zu verbessern.

5. Analysieren Sie das Ergebnis.

Wie genau wertet die Maschine Ihre Eingaben aus? Wie lauten Ihre Ausgabewerte? Um das herauszufinden, sollten Sie die Performance Ihres Modells mit weiteren Daten testen, um die Ergebnisse zu messen. Wenn Ihre Ergebnisse zu weniger als 90% genau sind, müssen Sie Ihr Modell möglicherweise noch einmal überarbeiten.

6. Justieren Sie die Parameter

Ist Ihr Ergebnis ungenau, trainieren Sie Ihre Maschine mit neuen Parametern und testen die Modellgenauigkeit erneut. Wie können Sie mit den Ihnen vorhandenen Daten bessere Ergebnisse erzielen?

7. Wenden Sie Ihr maschinelles Lernen auf reale Projekte an

Herzlichen Glückwunsch! Wenn Ihr Modell funktioniert, können Sie es nun an realen Daten testen.

rellify und maschinelles Lernen

Von der Themenauswahl bis zum Schreiben von Artikeln: Heute setzen bereits viele Content Marketing Tools KI ein. Aber auch wenn künstliche Intelligenz Entscheidungsprozesse steuert, ist die menschliche Komponente ebenso wichtig wie die Datenqualität.

Genau deshalb ist der maschinelle Lernprozess von rellify so revolutionär. Anstatt generische Websitedaten aus dem gesamten Internet zu verwenden, recherchieren unsere Experten Ihr Unternehmen, Ihre Branche und die Angebote Ihrer Mitbewerber anhand maschinell ausgewählter Daten, die einzigartig für Ihr Unternehmen sind. Rellify nutzt dann einen Deep-Learning-Prozess, um exklusive neuronale Netzwerke zu erstellen, die auf Ihre Unternehmenskommunikation zugeschnitten werden. So stellen wir sicher, dass Sie die bestmöglichen Inhalte entwickeln, um Ihre Ziele zu erreichen. 

Sprechen Sie uns an für mehr Informationen.