OpenText-Startseite.
Technische Themen

Was ist maschinelles Lernen?

Illustration von IT-Elementen mit Schwerpunkt auf einem Fragezeichen

Übersicht

Maschinelles Lernen ist ein Teilbereich der künstlichen Intelligenz, der sich auf die Entwicklung von Systemen konzentriert, die aus historischen Daten lernen, Muster erkennen und logische Entscheidungen mit wenig oder gar keinem menschlichen Eingriff treffen können. Es handelt sich um eine Datenanalysemethode, die den Aufbau von Analysemodellen durch die Verwendung von Daten automatisiert, die verschiedene Formen digitaler Informationen wie Zahlen, Wörter, Klicks und Bilder umfassen.

Anwendungen für maschinelles Lernen lernen aus den Eingabedaten und verbessern kontinuierlich die Genauigkeit der Ausgaben durch automatische Optimierungsmethoden. Die Qualität eines maschinellen Lernmodells hängt von zwei wesentlichen Aspekten ab:

  1. Die Qualität der Eingabedaten. Eine gängige Redewendung bei der Entwicklung von Algorithmen für maschinelles Lernen lautet "Garbage in, garbage out". Das heißt, wenn Sie minderwertige oder unsaubere Daten eingeben, wird das Ergebnis Ihres Modells weitgehend ungenau sein.
  2. Die Wahl des Modells selbst. Im Bereich des maschinellen Lernens gibt es eine Fülle von Algorithmen, die ein Datenwissenschaftler wählen kann, und die alle ihren eigenen spezifischen Nutzen haben. Es ist wichtig, für jeden Anwendungsfall den richtigen Algorithmus zu wählen. Neuronale Netze sind ein Algorithmustyp, um den wegen seiner hohen Genauigkeit und Vielseitigkeit ein großer Hype entstanden ist. Bei geringen Datenmengen ist die Wahl eines einfacheren Modells jedoch oft besser.

Je besser das maschinelle Lernmodell ist, desto genauer kann es Merkmale und Muster in den Daten finden. Das wiederum bedeutet, dass ihre Entscheidungen und Vorhersagen umso präziser sein werden.

OpenText ArcSight Intelligence für CrowdStrike

Beispielloser Schutz, der maschinelles Lernen und Endgerätesicherheit mit erstklassiger Bedrohungssuche als Service kombiniert.

Mehr erfahren

Maschinelles Lernen

Warum ist maschinelles Lernen wichtig?

Warum maschinelles Lernen? Das maschinelle Lernen gewinnt immer mehr an Bedeutung, da die Datenmengen immer größer und vielfältiger werden, Rechenleistung verfügbar und erschwinglich ist und Hochgeschwindigkeits-Internet verfügbar ist. Diese Faktoren der digitalen Transformation ermöglichen es, schnell und automatisch Modelle zu entwickeln, mit denen außergewöhnlich große und komplexe Datensätze schnell und genau analysiert werden können.

Es gibt eine Vielzahl von Anwendungsfällen, in denen maschinelles Lernen eingesetzt werden kann, um Kosten zu senken, Risiken zu mindern und die allgemeine Lebensqualität zu verbessern, z. B. bei der Empfehlung von Produkten/Dienstleistungen, der Erkennung von Verletzungen der Cybersicherheit und der Ermöglichung selbstfahrender Autos. Mit dem verbesserten Zugang zu Daten und Rechenleistung wird das maschinelle Lernen jeden Tag allgegenwärtiger und wird bald in viele Bereiche des menschlichen Lebens integriert werden.


Wie funktioniert das maschinelle Lernen?

Bei der Erstellung eines Modells für maschinelles Lernen sind vier wichtige Schritte zu beachten.

  1. Auswahl und Vorbereitung eines Trainingsdatensatzes

    Bei den Trainingsdaten handelt es sich um Informationen, die für die Daten repräsentativ sind, die die Anwendung für maschinelles Lernen aufnimmt, um die Modellparameter abzustimmen. Trainingsdaten sind manchmal gekennzeichnet, d. h. sie wurden markiert, um Klassifizierungen oder erwartete Werte zu nennen, die der maschinelle Lernmodus vorhersagen soll. Andere Trainingsdaten können unbeschriftet sein, so dass das Modell selbstständig Merkmale extrahieren und Cluster zuordnen muss.

    Für die Beschriftung sollten die Daten in eine Trainings- und eine Testgruppe unterteilt werden. Ersteres dient dazu, das Modell zu trainieren, letzteres dazu, die Wirksamkeit des Modells zu bewerten und Wege zu seiner Verbesserung zu finden.

  2. Wählen Sie einen Algorithmus, der auf den Trainingsdatensatz angewendet werden soll.

    Welche Art von maschinellem Lernalgorithmus Sie wählen, hängt in erster Linie von einigen Aspekten ab:

    • ob der Anwendungsfall die Vorhersage eines Wertes oder die Klassifizierung ist, bei der beschriftete Trainingsdaten verwendet werden, oder ob der Anwendungsfall Clustering oder Dimensionalitätsreduktion ist, bei dem unbeschriftete Trainingsdaten verwendet werden
    • Wie viele Daten sind im Trainingssatz enthalten?
    • Die Art des Problems, das das Modell zu lösen versucht

    Für Vorhersage- oder Klassifizierungszwecke verwenden Sie in der Regel Regressionsalgorithmen wie die gewöhnliche Kleinstquadratregression oder die logistische Regression. Bei nicht beschrifteten Daten werden Sie sich wahrscheinlich auf Clustering-Algorithmen wie k-means oder Nearest Neighbour verlassen. Einige Algorithmen wie neuronale Netze können so konfiguriert werden, dass sie sowohl für Clustering als auch für Vorhersagen geeignet sind.

  3. Den Algorithmus trainieren, um das Modell zu erstellen

    Beim Training des Algorithmus werden die Modellvariablen und -parameter so eingestellt, dass die entsprechenden Ergebnisse genauer vorhergesagt werden können. Das Training des Algorithmus für maschinelles Lernen erfolgt in der Regel iterativ und verwendet je nach gewähltem Modell eine Vielzahl von Optimierungsmethoden. Diese Optimierungsmethoden erfordern kein menschliches Eingreifen, was einen Teil der Stärke des maschinellen Lernens ausmacht. Die Maschine lernt aus den Daten, die Sie ihr zur Verfügung stellen, mit wenig oder gar keinen spezifischen Anweisungen des Benutzers.

  4. Nutzung und Verbesserung des Modells

    Der letzte Schritt besteht darin, das Modell mit neuen Daten zu füttern, um seine Wirksamkeit und Genauigkeit im Laufe der Zeit zu verbessern. Woher die neuen Informationen kommen sollen, hängt von der Art des zu lösenden Problems ab. So wird beispielsweise ein maschinelles Lernmodell für selbstfahrende Autos reale Informationen über Straßenbedingungen, Objekte und Verkehrsregeln aufnehmen.


Methoden des maschinellen Lernens

Was ist überwachtes maschinelles Lernen?

Algorithmen des überwachten maschinellen Lernens verwenden markierte Daten als Trainingsdaten, bei denen die entsprechenden Ausgaben für die Eingabedaten bekannt sind. Der Algorithmus für maschinelles Lernen nimmt eine Reihe von Eingaben und entsprechende korrekte Ausgaben auf. Der Algorithmus vergleicht seine eigenen vorhergesagten Ergebnisse mit den richtigen Ergebnissen, um die Modellgenauigkeit zu berechnen, und optimiert dann die Modellparameter, um die Genauigkeit zu verbessern.

Das überwachte maschinelle Lernen stützt sich auf Muster, um Werte auf nicht beschrifteten Daten vorherzusagen. Sie wird am häufigsten bei der Automatisierung, bei großen Mengen von Datensätzen oder in Fällen eingesetzt, in denen es zu viele Dateneingaben gibt, als dass Menschen sie effektiv verarbeiten könnten. So kann der Algorithmus beispielsweise Kreditkartentransaktionen erkennen, die wahrscheinlich betrügerisch sind, oder den Versicherungskunden identifizieren, der höchstwahrscheinlich einen Schaden melden wird.

Was ist unüberwachtes maschinelles Lernen?

Unüberwachtes maschinelles Lernen lässt sich am besten auf Daten anwenden, für die es keine strukturierten oder objektiven Antworten gibt. Es gibt keine Vorbestimmung der richtigen Ausgabe für eine bestimmte Eingabe. Stattdessen muss der Algorithmus die Eingabe verstehen und die entsprechende Entscheidung treffen. Ziel ist es, die Informationen zu untersuchen und eine Struktur darin zu erkennen.

Unüberwachtes maschinelles Lernen funktioniert gut bei transaktionsbezogenen Informationen. So kann der Algorithmus beispielsweise Kundensegmente identifizieren, die ähnliche Eigenschaften besitzen. Die Kunden innerhalb dieser Segmente können dann mit ähnlichen Marketingkampagnen angesprochen werden. Zu den beliebten Techniken des unüberwachten Lernens gehören das Nearest-Neighbor-Mapping, selbstorganisierende Karten, Singular Value Decomposition und k-means Clustering. Die Algorithmen werden anschließend verwendet, um Themen zu segmentieren, Ausreißer zu identifizieren und Artikel zu empfehlen.


Was ist der Unterschied zwischen überwachtem und unüberwachtem maschinellen Lernen?

Aspekt

Überwachtes Lernen

Unüberwachtes Lernen

Prozess

Eingabe- und Ausgabevariablen werden zum Trainieren des Modells bereitgestellt.

Zum Trainieren des Modells werden nur Eingabedaten bereitgestellt. Es werden keine Ausgabedaten verwendet.

Eingabedaten

Verwendet beschriftete Daten.

Verwendet nicht beschriftete Daten.

Unterstützte Algorithmen

Unterstützt Regressionsalgorithmen, instanzbasierte Algorithmen, Klassifizierungsalgorithmen, neuronale Netze und Entscheidungsbäume.

Unterstützt Clustering-Algorithmen, Assoziationsalgorithmen und neuronale Netze.

Komplexität

Einfacher.

Komplexer.

Subjektivität

Zielsetzung.

Subjektiv.

Anzahl der Klassen

Die Anzahl der Klassen ist bekannt.

Die Anzahl der Klassen ist nicht bekannt.

Hauptnachteil

Die Klassifizierung großer Datenmengen mit überwachtem Lernen ist schwierig.

Die Wahl der Anzahl von Clustern kann subjektiv sein.

Primäres Ziel

Trainieren Sie das Modell so, dass es die Ausgabe vorhersagen kann, wenn es neue Eingaben erhält.

Finden Sie nützliche Erkenntnisse und verborgene Muster.


Was kann maschinelles Lernen leisten: Maschinelles Lernen in der realen Welt

Die Funktion des maschinellen Lernens gibt es zwar schon seit Jahrzehnten, aber erst in jüngster Zeit hat die Fähigkeit, komplexe mathematische Berechnungen unter Einbeziehung großer Datenmengen anzuwenden und automatisch zu berechnen, zu einer noch nie dagewesenen Raffinesse geführt. Der Anwendungsbereich des maschinellen Lernens ist heute sehr breit gefächert und reicht von AIOps in Unternehmen bis zum Online-Handel. Einige Beispiele aus der Praxis für die Möglichkeiten des maschinellen Lernens sind die folgenden:

  • Cybersicherheit unter Verwendung von Verhaltensanalysen zur Ermittlung verdächtiger oder anormaler Ereignisse, die auf Insider-Bedrohungen, APTs oder Zero-Day-Angriffe hindeuten können.
  • Selbstfahrende Autoprojekte wie Waymo (eine Tochtergesellschaft von Alphabet Inc.) und Teslas Autopilot , das eine Stufe unter den eigentlichen selbstfahrenden Autos liegt.
  • Digitale Assistenten wie Siri, Alexa und Google Assistant, die als Reaktion auf unsere Sprachbefehle das Internet nach Informationen durchsuchen.
  • Auf den Nutzer zugeschnittene Empfehlungen, die von Algorithmen des maschinellen Lernens auf Websites und Apps wie Netflix, Amazon und YouTube gesteuert werden.
  • Lösungen für Betrugserkennung und Cyber-Resilienz, die Daten aus mehreren Systemen zusammenführen, Kunden mit hohem Risikoverhalten aufspüren und Muster verdächtiger Aktivitäten erkennen. Diese Lösungen können überwachtes und unüberwachtes maschinelles Lernen nutzen, um Transaktionen für Finanzorganisationen als betrügerisch oder legitim zu klassifizieren. Deshalb kann ein Verbraucher von seinem Kreditkartenunternehmen eine SMS erhalten, in der er sich vergewissern kann, ob ein ungewöhnlicher Kauf unter Verwendung seiner Finanzdaten rechtmäßig ist. Das maschinelle Lernen ist im Bereich der Betrugsbekämpfung so weit fortgeschritten, dass viele Kreditkartenunternehmen damit werben, dass sie den Verbrauchern keinen Schaden zufügen, wenn betrügerische Transaktionen nicht von den Algorithmen des Finanzunternehmens erkannt werden.
  • Die Bilderkennung hat erhebliche Fortschritte gemacht und kann zuverlässig zur Gesichtserkennung, zum Lesen der Handschrift auf hinterlegten Schecks, zur Verkehrsüberwachung und zum Zählen der Anzahl der Personen in einem Raum eingesetzt werden.
  • Spam-Filter, die unerwünschte E-Mails erkennen und aus dem Posteingang blockieren.
  • Versorgungsunternehmen, die Sensordaten analysieren, um Wege zur Effizienzsteigerung und Kostensenkung zu finden.
  • Tragbare medizinische Geräte, die in Echtzeit wertvolle Daten zur kontinuierlichen Beurteilung des Gesundheitszustands von Patienten erfassen.
  • Taxi-Apps bewerten die Verkehrslage in Echtzeit und empfehlen die effizienteste Route.
  • Die Stimmungsanalyse bestimmt den Ton einer Textzeile. Gute Anwendungen für die Stimmungsanalyse sind Twitter, Kundenrezensionen und Umfrageteilnehmer:
    • Twitter: Eine Möglichkeit, Marken zu bewerten, besteht darin, den Tonfall von Tweets zu erkennen, die an eine Person oder ein Unternehmen gerichtet sind. Unternehmen wie Crimson Hexagon und Nuvi liefern diese Informationen in Echtzeit.
    • Kundenrezensionen: Sie können den Tenor von Kundenrezensionen erkennen, um zu beurteilen, wie Ihr Unternehmen abschneidet. Dies ist besonders nützlich, wenn es kein Bewertungssystem gibt, das mit Freitext-Kundenrezensionen gekoppelt ist.
    • Umfragen: Mithilfe der Stimmungsanalyse von Freitextantworten können Sie auf einen Blick erkennen, wie sich die Befragten bei Ihrer Umfrage fühlen. Qualtrics hat dies bei seinen Umfragen implementiert.
  • Bei der Marktsegmentierungsanalyse wird unüberwachtes maschinelles Lernen eingesetzt, um Kunden nach ihren Kaufgewohnheiten zu gruppieren und verschiedene Kundentypen oder Personas zu bestimmen. So können Sie Ihre wertvollsten oder unterversorgten Kunden besser kennenlernen.
  • Es ist einfach, Strg+F zu drücken, um ein Dokument nach exakten Wörtern und Ausdrücken zu durchsuchen, aber wenn Sie den genauen Wortlaut, den Sie suchen, nicht kennen, kann es schwierig sein, Dokumente zu durchsuchen. Das maschinelle Lernen kann Techniken wie Fuzzy-Methoden und Themenmodellierung nutzen, um diesen Prozess zu vereinfachen, indem es Ihnen ermöglicht, Dokumente zu durchsuchen, ohne die genaue Formulierung zu kennen, nach der Sie suchen.

Die Rolle des maschinellen Lernens wird weiter zunehmen

In dem Maße, wie die Datenmengen wachsen, die Rechenleistung zunimmt, die Internet-Bandbreite erweitert wird und Datenwissenschaftler ihr Fachwissen erweitern, wird das maschinelle Lernen die Effizienz bei der Arbeit und zu Hause weiter steigern und verbessern.

Angesichts der ständig zunehmenden Cyber-Bedrohungen, mit denen Unternehmen heute konfrontiert sind, ist maschinelles Lernen erforderlich, um wertvolle Daten zu schützen und Hacker von internen Netzwerken fernzuhalten. Unsere führende UEBA SecOps-Software, ArcSight Intelligence, nutzt maschinelles Lernen, um Anomalien zu erkennen, die auf böswillige Aktionen hindeuten könnten. Es hat eine nachweisliche Erfolgsbilanz bei der Erkennung von Insider-Bedrohungen, Zero-Day-Angriffen und sogar aggressiven Red-Team-Angriffen.

Wie können wir behilflich sein?

Fußnoten