Aus dem Kurs: Machine Learning in der Praxis: Marketing

So erhalten Sie Zugriff auf diesen Kurs

Werden Sie noch heute Mitglied und erhalten Sie Zugriff auf mehr als 23.100 Kurse von Branchenfachleuten.

Pandas-Funktionen zur Untersuchung von Daten

Pandas-Funktionen zur Untersuchung von Daten

Aus dem Kurs: Machine Learning in der Praxis: Marketing

Pandas-Funktionen zur Untersuchung von Daten

Beginnen wir nun, unsere Daten zu verstehen. Für jede Spalte eines Datenrahmens zeigt der Aufruf von Dataframename.Columnname.Unique die Anzahl der eindeutigen Werte für diese Spalte an. Wir können dies für die Spalten CustomerID und InvoiceNumber verwenden, um herauszufinden, wie viele Kunden und Transaktionen unsere Daten enthalten. Die Funktion Describe zeigt deskriptive Statistiken über alle nummerischen Spalten in einem Datenrahmen an. In unserem Fall würde dies neben anderen Spalten auch die Spalte CustomerID umfassen, die für uns nicht interessant ist. Daher habe ich die Funktion describe angewiesen, nur mit den Spalten Quantity und UnitPrice zu arbeiten. Außerdem habe ich die Funktion round mit einem Wert von eingefügt, so dass alle Zahlen auf 3 Dezimalstellen gerundet werden. Ich finde, das macht die Ergebnisse einfacher zu lesen. Es hat sich herausgestellt, dass unsere Daten etwa 4.000 Kunden und 22.000 Transaktionen haben. Sie können die Ausgabe der Funktion describe wie…

Inhalt