Die besten Algorithmen für maschinelles Lernen lernen und verbessern sich, wenn sie mit zusätzlichen Daten konfrontiert werden. Die "lernende" Komponente von ML bezieht sich darauf, wie diese Algorithmen ihre Datenverarbeitungsmethoden im Laufe der Zeit ändern. Ein ML-Algorithmus ist also ein Programm, das seine Einstellungen ändern kann. Es kann dies auf der Grundlage früherer Leistungen bei der Erstellung von Vorhersagen über einen Datensatz tun. Übersetzt mit www.DeepL.com/Translator (kostenlose Version)
ML-Algorithmen werden entweder als überwacht oder als unüberwacht klassifiziert. Überwachte Lernalgorithmen arbeiten mit Eingabedaten und gewünschten Ausgabedaten durch Kennzeichnung. Unüberwachte Algorithmen hingegen arbeiten mit Daten, die weder klassifiziert noch beschriftet sind. Unüberwachte Algorithmen können zum Beispiel auch unsortierte Daten auf der Grundlage von Ähnlichkeiten und Kontrasten kategorisieren.
Algorithmen des maschinellen Lernens lassen sich in drei verschiedene Typen einteilen:
Algorithmen für überwachtes maschinelles Lernen
Stellen Sie sich vor, Sie sind ein Lehrer, der für eine Klasse verantwortlich ist. Der Lehrer kennt bereits die richtigen Antworten. Aber der Lernprozess endet erst, wenn auch die Schüler die richtigen Antworten kennen. Algorithmen für das überwachte maschinelle Lernen funktionieren unter dieser Prämisse. Der Algorithmus ist der Schüler, der aus einem Trainingsdatensatz lernt. Er erstellt dann Vorhersagen, die vom Lehrer korrigiert werden. Dieser Lernprozess wird so lange wiederholt, bis der Algorithmus das gewünschte Leistungsniveau erreicht hat.
Algorithmen für unüberwachtes maschinelles Lernen
In diesem Szenario gibt es keinen Lehrer für die Klasse. Die armen Schüler müssen es selbst herausfinden. Das bedeutet, dass es keine genaue Antwort auf das Lernen und keinen Tutor für unüberwachte ML-Algorithmen gibt. Der Algorithmus bleibt auch unüberwacht, um die zugrunde liegende Struktur in den Daten zu entdecken. Er muss auch mehr und mehr über die Daten selbst lernen.
Algorithmen für maschinelles Verstärkungslernen
Es handelt sich um hypothetische Schüler. Sie lernen mit der Zeit aus ihren eigenen Fehlern. Verstärkendes maschinelles Lernen Algorithmen lernen die besten Aktionen durch Versuch und Irrtum. Das bedeutet auch, dass der Algorithmus die nächste Aktion durch das Erlernen von Verhaltensweisen bestimmt. Diese basieren auf dem aktuellen Zustand, der die Belohnung in der Zukunft maximieren wird.
Die besten Algorithmen für maschinelles Lernen
Mit Methoden des maschinellen Lernens lassen sich komplizierte reale Datenprobleme lösen. Wir haben nun die verschiedenen Arten von Algorithmen für maschinelles Lernen untersucht. Sehen wir uns nun die besten Algorithmen für maschinelles Lernen an, die von Datenwissenschaftlern eingesetzt werden.
Naïve Bayes Klassifizierungsalgorithmus
Die manuelle Klassifizierung von Datentexten, wie z. B. einer Webseite, einer Zeitung oder einer E-Mail, ist eine Herausforderung. Der Naive Bayes-Klassifizierungsalgorithmus übernimmt diese Aufgabe. Dieses Verfahren funktioniert auf der Grundlage des Bayes-Theorems der Wahrscheinlichkeit. Es ordnet den Elementwert einer Population aus einer der möglichen Kategorien zu.
P(y|X) = \frac{P(X|y) P(y)}{P(X)}
wobei y die Klassenvariable und X ein abhängiger Merkmalsvektor (der Größe n) ist, wobei:
X = (x_1,x_2,x_3,.....,xn)
Die Spam-Filterung von E-Mails ist eine Anwendung des Naïve-Bayes-Klassifizierungsalgorithmus. Dieser Algorithmus findet einen Platz in Google Mail, um festzustellen, ob eine E-Mail Spam ist oder nicht.
K-Mittel-Clustering-Algorithmus
Assume you wish to look up the term "date" on Wikipedia. "Date" might now apply to a certain fruit, a specific day, or even a romantic evening with your sweetheart. Using the K Means Clustering Algorithm, Wikipedia clusters web pages that discuss the same topics.
In general, the K Means Clustering Algorithm employs K clusters to act on a given data set. As a result, the output has K clusters with the input data distributed among them.
Support-Vektor-Maschine-Algorithmus
Für Klassifizierungs- oder Regressionsfragen wird der Support Vector Machine Algorithmus verwendet. Die Daten werden in mehrere Klassen aufgeteilt, indem eine bestimmte Linie (Hyperebene) gefunden wird. Diese Linie unterteilt den Datensatz in mehrere Klassen. Der Support Vector Machine Algorithmus versucht, die Hyperebene zu lokalisieren. Dadurch wird auch der Abstand zwischen den Klassen minimiert. Dies erhöht die Wahrscheinlichkeit, dass die Daten korrekt kategorisiert werden.
Ein Beispiel ist ein Vergleich der Wertentwicklung von Aktien desselben Sektors. Es zeigt, wie der Support Vector Machine Algorithmus funktioniert. Dies hilft Finanzunternehmen bei der Verwaltung von Investitionsentscheidungen.
Das IF-THEN-Format wird im Apriori-Algorithmus zur Erstellung von Assoziationsregeln verwendet. Es besagt, dass WENN ein Ereignis A eintritt, dann ist es wahrscheinlich, dass auch Ereignis B eintritt. Zum Beispiel: WENN eine Person ein Auto kauft, MUSS sie auch eine Autoversicherung abschließen. Diese Assoziationsregel wird mit dem Apriori-Algorithmus erstellt. Er untersucht die Personen, die nach dem Kauf eines Autos eine Kfz-Versicherung abgeschlossen haben.
Die Google-Autovervollständigung ist ein Beispiel dafür, wie der Apriori-Algorithmus funktioniert. Wenn Sie einen Begriff in Google eingeben, sucht der Apriori-Algorithmus die zugehörigen Wörter, die nach diesem Wort eingegeben werden, und zeigt sie an.
Linearer Regressionsalgorithmus
Der lineare Regressionsalgorithmus stellt die Beziehung zwischen zwei Variablen dar. Dabei ist eine unabhängig und die andere abhängig. Er zeigt die Auswirkung auf die abhängige Variable, wenn die unabhängige Variable in irgendeiner Weise verändert wird. Die unabhängige Variable wird auch als erklärende Variable bezeichnet. Die abhängige Variable bezieht sich auf den interessierenden Faktor.
Der lineare Regressionsalgorithmus ist eine Risikobewertung im Versicherungssektor. Mit Hilfe der linearen Regressionsanalyse wird die Häufigkeit von Schadensfällen bei Kunden ermittelt. Anschließend wird das erhöhte Risiko mit zunehmendem Alter des Kunden berechnet.
Logistischer Regressionsalgorithmus
Der lineare Regressionsalgorithmus sagt kontinuierliche Werte voraus. Der logistische Regressionsalgorithmus hingegen sagt diskrete Werte voraus. Daher ist die logistische Regression am besten für die binäre Klassifizierung geeignet. Bei der logistischen Regression wird ein Ereignis als 1 klassifiziert, wenn es eintritt, und als 0, wenn es nicht eintritt. Sie prognostiziert die Wahrscheinlichkeit des Auftretens eines bestimmten Ereignisses auf der Grundlage der angegebenen Faktoren.
Algorithmus für Entscheidungsbäume
Angenommen, Sie möchten einen Ort für Ihren Geburtstag auswählen. Infolgedessen beeinflussen viele Faktoren Ihre Entscheidung. Faktoren wie "Ist das Restaurant italienisch?", "Gibt es in dem Restaurant Live-Musik?" "Ist das Restaurant in der Nähe Ihres Hauses?" usw. Jede dieser Fragen kann mit JA oder NEIN beantwortet werden, was Ihre Wahl beeinflusst.
Dies geschieht beim Algorithmus für Entscheidungsbäume. Unter Verwendung einer Baumverzweigungsmethode werden auch hier alle alternativen Ergebnisse einer Entscheidung angezeigt. Außerdem stellen die Kernknoten des Baums Tests zu verschiedenen Eigenschaften dar. Die Zweige des Baumes stellen die Ergebnisse der Tests dar. Die Blattknoten stellen die Wahl dar, die nach der Berechnung aller Attribute getroffen wurde.
Im Bankgeschäft hilft der Entscheidungsbaum-Algorithmus bei der Klassifizierung von Kreditantragstellern. Er stützt sich auch auf die Wahrscheinlichkeit, dass sie mit ihren Kreditzahlungen in Verzug geraten.
Algorithmus von Random Forests
Der Random Forests Algorithmus behebt die Unzulänglichkeiten des Entscheidungsbaum-Algorithmus. Die Genauigkeit des Ergebnisses nimmt mit zunehmender Anzahl der Entscheidungen im Baum ab. Es gibt mehrere Entscheidungsbäume im Random Forests Algorithmus. Diese repräsentieren verschiedene statistische Wahrscheinlichkeiten.
Das CART-Modell kombiniert alle diese Bäume zu einem einzigen Baum. Die endgültige Vorhersage des Algorithmus erhalten wir durch Abfrage der Ergebnisse aller Entscheidungsbäume. Im Automobilsektor sagt dieser Algorithmus den Ausfall eines Autoelements voraus.
K-Nächste-Nachbarn-Algorithmus
Der K-Nächste-Nachbarn-Algorithmus kategorisiert Datenpunkte auf der Grundlage eines ähnlichen Maßes. Dieses Maß kann z. B. die Abstandsfunktion sein. Für jeden neuen Datenpunkt wird eine Vorhersage getroffen. Dabei wird der gesamte Datensatz nach den K vergleichbarsten Vorkommen durchsucht. Anschließend fasst es die Ausgangsvariable für diese K Instanzen zusammen.
Dies könnte der Mittelwert der Ergebnisse in einem Regressionsproblem sein. Oder es kann der Modus in einem Klassifikationsproblem sein. Der K-Nächste-Nachbarn-Algorithmus kann eine große Menge an Speicher oder Platz benötigen, um alle Daten zu speichern. Er berechnet jedoch nur dann, wenn er eine Vorhersage benötigt, also genau zum richtigen Zeitpunkt.
Algorithmus für künstliche neuronale Netze
Neuronen im menschlichen Gehirn sind die Grundlage für unser Gedächtnis und unseren scharfen Verstand. Künstliche neuronale Netze versuchen, die Neuronen des menschlichen Gehirns nachzubilden. Sie tun dies, indem sie miteinander verbundene Knotenpunkte konstruieren. Diese Neuronen erhalten Informationen von einem anderen Neuron. Je nach Bedarf führen sie verschiedene Aktionen aus. Anschließend geben sie die Informationen an ein anderes Neuron als Ausgabe weiter.
Die Erkennung menschlicher Gesichter ist ein Beispiel für künstliche neuronale Netze. Je nach der Anzahl der Fotos in der Datenbank kann dies viele Stunden dauern. Der menschliche Verstand hingegen kann dies schnell erledigen.
Wie wählt man die besten Algorithmen für maschinelles Lernen aus?
Dimensionen der Trainingsdaten
Normalerweise wird vorgeschlagen, eine große Menge an Daten zu sammeln, um glaubwürdige Prognosen zu erstellen. Die Verfügbarkeit von Daten stellt jedoch eine Einschränkung dar. Wenn die Trainingsdaten minimal sind, wählen Sie Methoden mit einer hohen Verzerrung/geringen Varianz. Dies können z. B. lineare Regression, Nave Bayes oder lineare SVM sein.
Ausgabegenauigkeit/Interpretierbarkeit
Die Genauigkeit eines Modells bedeutet, dass es einen Antwortwert vorhersagt, der nahe an dem tatsächlichen Antwortwert für diese Beobachtung liegt. Eine interpretierbare Methode bedeutet, dass jeder einzelne Prädiktor klar verstanden werden kann. Flexible Modelle bieten jedoch mehr Genauigkeit auf Kosten einer geringen Interpretierbarkeit.
Die Verwendung eines Algorithmus hängt von der Zielsetzung des Geschäftsproblems ab. Wenn die Schlussfolgerung das Ziel ist, sind restriktive Modelle zu bevorzugen. Wenn die Genauigkeit das Ziel ist, sind flexible Modelle vorzuziehen. Im Allgemeinen steigt mit der Flexibilität einer Methode auch ihre Interpretierbarkeit.
Trainingszeit oder Geschwindigkeit
Eine höhere Genauigkeit erfordert in der Regel eine längere Trainingszeit. Algorithmen brauchen auch länger, um auf große Mengen von Trainingsdaten zu trainieren. In realen Anwendungen hängt die Wahl des Algorithmus von diesen beiden Aspekten ab.
Der Datensatz kann eine große Anzahl von Merkmalen enthalten, von denen nicht alle nützlich und erwähnenswert sind. Bei bestimmten Datentypen kann die Anzahl der Merkmale ziemlich groß sein. Eine große Anzahl von Merkmalen kann einige Lernalgorithmen behindern. Dadurch wird auch die Trainingszeit unverhältnismäßig lang. Außerdem ist SVM besser für Daten mit einem großen Merkmalsraum, aber wenigen Beobachtungen geeignet.
Schlussfolgerung
Abschließend lässt sich sagen, dass Algorithmen für maschinelles Lernen nur ein Teil des Puzzles sind. Sie müssen sich mit Optimierern, Datenbereinigung, Merkmalsauswahl und Merkmalsnormalisierung befassen. Neben der Auswahl des Algorithmus müssen Sie sich auch mit der Abstimmung der Hyperparameter befassen.
Wenn Sie all dies erledigt und ein Modell erstellt haben, das für Ihre Daten funktioniert, ist es an der Zeit, es zu starten und zu aktualisieren, wenn sich die Bedingungen ändern. Außerdem ist die Verwaltung von Machine-Learning-Modellen in der Produktion eine ganz andere Herausforderung.
Probieren Sie verschiedene Algorithmen aus und vergleichen Sie deren Ergebnisse, um die beste Lösung für Ihre spezielle Tätigkeit zu finden. Ziehen Sie auch die Verwendung von Ensemble-Ansätzen in Betracht, die oft eine höhere Genauigkeit bieten.