Beispiele für mehrdimensionale DiagrammeEinführung
Die Visualisierung ist ein wichtiger Bestandteil der Datenanalyse, und die Möglichkeit, mehrere Dimensionen gleichzeitig zu betrachten, erleichtert diese Aufgabe. Im Tutorial zeichnen wir Diagramme mit bis zu 6 Dimensionen.
Plotly ist eine Open-Source-Python-Bibliothek für eine Vielzahl von Visualisierungen, die viel mehr Anpassungsmöglichkeiten bietet als die berühmte Matplotlib und Seaborn . Das Modul wird wie gewohnt installiert - Pip Install Plotly . Wir werden es zum Zeichnen von Grafiken verwenden.
Bereiten wir die Daten vor
Zur Visualisierung verwenden wir einfache Daten zu Fahrzeugen von UCI (University of California, Irvine - ca. übersetzt) , die 26 Merkmale für 205 Fahrzeuge darstellen (26 Spalten für 205 Zeilen). Um sechs Dimensionen zu visualisieren, verwenden wir diese sechs Parameter.
Hier werden nur 4 von 205 Zeilen angezeigt.Laden Sie Daten von PandV mit Pandas herunter.
import pandas as pd data = pd.read_csv("cars.csv")
Nachdem wir uns vorbereitet haben, beginnen wir mit zwei Dimensionen.
Zweidimensionales Streudiagramm
Ein Streudiagramm ist ein sehr einfaches und allgemeines Diagramm. Von den 6 Parametern werden Preis und Leergewicht nachstehend als Y bzw. X verwendet.
# import plotly import plotly.graph_objs as go # figure fig1 = go.Scatter(x=data['curb-weight'], y=data['price'], mode='markers') # layout mylayout = go.Layout(xaxis=dict(title="curb-weight"), yaxis=dict( title="price")) # HTML plotly.offline.plot({"data": [fig1], "layout": mylayout}, auto_open=True)
In Plotly unterscheidet sich der Prozess geringfügig von dem in Matplotlib. Wir müssen ein Layout und eine Abbildung erstellen und diese an die Funktion offline.plot übergeben. Danach wird das Ergebnis in einer HTML-Datei im aktuellen Arbeitsverzeichnis gespeichert. Hier ist ein Screenshot von dem, was passiert. Am Ende des Artikels befindet sich ein Link zum GitHub-Repository mit vorgefertigten interaktiven HTML-Grafiken.
Zweidimensionales Streudiagramm3D-Streudiagramm
Wir können der Z- Achse einen dritten PS- Parameter (PS-Menge) hinzufügen. Plotly bietet eine Scatter3D- Funktion zum Erstellen interaktiver 3D-Diagramme.
3D-GrafikAnstatt den Code hier jedes Mal einzufügen, habe ich ihn dem Repository hinzugefügt.
(Es ist am bequemsten, den relevanten Code in einer angrenzenden Registerkarte parallel zum Lesen anzuzeigen - ca. Transl.)
Hinzufügen einer vierten Dimension
Wir wissen, dass Sie nicht mehr als drei Dimensionen direkt verwenden können, aber es gibt eine Problemumgehung: Wir können die Tiefe emulieren, um höhere Dimensionen mithilfe von Farbe, Größe oder Form zu visualisieren.
Hier verwenden wir zusammen mit den drei vorherigen Merkmalen die Stadtkilometerzahl - city-mpg als vierte Dimension, für die der Markercolor- Parameter der Scatter3D- Funktion verantwortlich ist. Ein hellerer Farbton des Markers bedeutet weniger Kilometerleistung.
Es ist sofort ersichtlich, dass die Laufleistung umso geringer ist, je höher der Preis, die Anzahl der Pferde und die Masse sind.
4D-Grafik mit Schattierungen als 4. DimensionHinzufügen einer fünften Dimension
Die Markergröße kann verwendet werden, um die 5. Dimension zu visualisieren. Wir verwenden die Motorgrößenkennlinie für den Markierungsgrößenparameter der Scatter3D- Funktion.
Beobachtungen: Die Motorgröße hängt mit einigen der vorherigen Parameter zusammen. Je höher der Preis, desto größer der Motor. Sowie: geringere Laufleistung - mehr Motor.
5D-Diagramm mit Markierungswert als fünfte Dimension (Motorgröße)Hinzufügen der sechsten Dimension
Die Form des Markers eignet sich hervorragend zur Visualisierung von Kategorien. Plotly bietet Ihnen eine Auswahl von 10 verschiedenen Formen für 3D-Grafiken (Sternchen, Kreis, Quadrat usw.). Somit können bis zu 10 verschiedene Werte als Formular angezeigt werden.
Wir haben die charakteristische Anzahl von Türen, die ganze Zahlen enthält - die Anzahl von Türen (2 oder 4). Wir wandeln diese Werte in Zahlen um: ein Quadrat für 4 Türen, einen Kreis für 2 Türen. Der Markersymbol- Parameter der Scatter3D- Funktion wird verwendet .
Beobachtungen: Es fühlt sich an, als hätten alle billigsten Autos 4 Türen (Kreise). Wenn Sie den Zeitplan weiter studieren, können Sie weitere Annahmen und Schlussfolgerungen ziehen.
6D-Diagramm mit Markierungsform als sechste Dimension (Anzahl der Türen)Können wir weitere Dimensionen hinzufügen?
Klar können wir! Marker haben mehr Eigenschaften wie Deckkraft und Farbverläufe, die aktiviert werden können. Aber je mehr Dimensionen wir hinzufügen, desto schwieriger ist es, sie alle im Kopf zu behalten.
Quellcode
Python-Code und interaktive Grafiken für alle Formen sind hier auf GitHub verfügbar .