🙂 💪🏼 🏅 Python Machine Learning mit interaktiven Jupyter-Demos 📯 🍮 🤚

Bild

Hallo Leser!

Ich habe kürzlich das Repository Homemade Machine Learning gestartet, das Beispiele für gängige Algorithmen und Ansätze des maschinellen Lernens enthält, wie z. B. lineare Regression, logistische Regression, K-Means-Methode und neuronales Netzwerk (mehrschichtiges Perzeptron). Jeder Algorithmus enthält interaktive Demoseiten, die in Jupyter NBViewer-e oder Binder-e gestartet wurden. Somit hat jeder die Möglichkeit, Trainingsdaten und Trainingsparameter zu ändern und das Ergebnis von Training, Visualisierung und Vorhersage des Modells sofort in seinem Browser anzuzeigen, ohne Jupyter lokal zu installieren.

Der Zweck dieses Repositorys ist die Implementierung von Algorithmen ~~fast~~ von Grund auf neu, um ein detaillierteres Verständnis der mathematischen Modelle zu erhalten, die hinter jedem der Algorithmen liegen. Die wichtigsten verwendeten Bibliotheken waren NumPy und Pandas . Diese Bibliotheken werden für effiziente Operationen an Matrizen sowie zum Laden und Parsen von CSV-Daten verwendet. Auf Demoseiten zum Zeichnen von Diagrammen und zum Visualisieren von Trainingsdaten werden auch die Bibliotheken Matplotlib und Plotly verwendet. Bei der logistischen Regression wird die SciPy- Bibliothek verwendet, um die Verlustfunktion zu minimieren. In anderen Fällen wird der Gradientenabstieg in reinem NumPy / Python implementiert. Die Verwendung von Bibliotheken wie PyTorch oder TensorFlow wird aufgrund des Lehrzwecks des Repositorys vermieden.

Im Moment sind die folgenden Algorithmen im Repository implementiert ...

Regression. Lineare Regression.

Bei den mit der Regression verbundenen Problemen versuchen wir, die tatsächliche Anzahl basierend auf eingehenden Daten vorherzusagen. Tatsächlich erstellen wir eine Linie / Ebene / n-dimensionale Ebene entlang der Trainingsdaten, um eine Vorhersage für Eingabedaten treffen zu können, die nicht im Trainingssatz enthalten sind. Dies geschieht zum Beispiel, wenn wir die Kosten einer 2-Zimmer-Wohnung im Zentrum von N im 7. Stock vorhersagen möchten.

∑ Mathematisches Modell - Theorie und Referenzen zur weiteren Lektüre.
✎ Beispielimplementierung in Python .
➤ Demonstration der linearen Regression mit einem Parameter - Vorhersage des "Glücksniveaus" in der Zeichenfolge in Abhängigkeit vom BIP.
➤ Demonstration der linearen Regression mit mehreren Parametern - Vorhersage des „Glücksniveaus“ in einer Zeichenfolge in Abhängigkeit vom BIP und dem Indikator für die Freiheit.
➤ Demonstration nichtlinearer Regression - ein Beispiel für die polynomielle / sinusförmige Erweiterung von Eingabeparametern zur Vorhersage nichtlinearer Abhängigkeiten.

Klassifizierung. Logistische Regression.

Bei Problemen im Zusammenhang mit der Klassifizierung teilen wir die Daten in Abhängigkeit von den Parametern dieser Daten in Klassen auf. Ein Beispiel für eine Klassifizierungsaufgabe ist die Spam-Erkennung. Abhängig vom Text des Briefes (eingehende Daten) ordnen wir jeden Brief einer von zwei Klassen zu ("Spam" oder "kein Spam").

∑ Mathematisches Modell - Theorie und Referenzen zur weiteren Lektüre.
✎ Beispiel für eine Python-Implementierung
➤ Demonstration der logistischen Regression mit linearen Rändern - Klassifizierung der Farben nach Breite und Länge ihrer Blütenblätter.
➤ Demonstration der logistischen Regression mit nichtlinearen Grenzen - Klassifizierung von Mikrochips (funktionsfähig / fehlerhaft) nach zwei Parametern.
➤ Demonstration der logistischen Regression mit vielen Parametern - handschriftliche Ziffernerkennung.

Clustering K-Mittel-Methode.

Bei Clustering-Aufgaben teilen wir unsere Daten in Cluster auf, die uns nicht im Voraus bekannt sind. Diese Algorithmen können zur Marktsegmentierung, Analyse sozialer und nicht nur von Netzwerken verwendet werden.

∑ Mathematisches Modell - Theorie und Referenzen zur weiteren Lektüre.
✎ Beispielimplementierung in Python .
➤ Demonstration der K-Means-Methode - Gruppieren von Farben in Gruppen in Abhängigkeit von der Länge und Breite ihrer Blütenblätter.

Neuronale Netze. Multilayer Perceptron (MLP).

Neuronale Netze sind eher kein Algorithmus, sondern ein "Muster" oder "Rahmen" zum Organisieren verschiedener Algorithmen für maschinelles Lernen in einem System zur weiteren Analyse komplexer Eingabedaten.

∑ Mathematisches Modell - Theorie und Referenzen zur weiteren Lektüre.
✎ Beispielimplementierung in Python .
➤ Demonstration eines mehrschichtigen Perzeptrons - Erkennung handgeschriebener Zahlen.

Suchen Sie mit der Gaußschen Verteilung nach Anomalien

Bei Problemen im Zusammenhang mit der Suche nach Anomalien versuchen wir, die Dateninstanzen zu isolieren, die im Vergleich zu den meisten anderen Instanzen „verdächtig“ aussehen. Zum Beispiel die Definition von atypischen (verdächtigen) Transaktionen per Kreditkarte.

∑ Mathematisches Modell - Theorie und Referenzen zur weiteren Lektüre.

Ich hoffe, Sie finden das Repository nützlich, indem Sie entweder mit Demonstrationen der einzelnen Algorithmen experimentieren oder die dahinter stehenden mathematischen Modelle lesen oder die Implementierungsdetails der einzelnen Algorithmen analysieren.

Erfolgreiche Codierung!

Python Machine Learning mit interaktiven Jupyter-Demos

Regression. Lineare Regression.

Klassifizierung. Logistische Regression.

Clustering K-Mittel-Methode.

Neuronale Netze. Multilayer Perceptron (MLP).

Suchen Sie mit der Gaußschen Verteilung nach Anomalien

More articles: