Aus dem Kurs: Machine Learning in der Praxis: Marketing

So erhalten Sie Zugriff auf diesen Kurs

Werden Sie noch heute Mitglied und erhalten Sie Zugriff auf mehr als 23.100 Kurse von Branchenfachleuten.

Daten mit Pandas Query abfragen

Daten mit Pandas Query abfragen

Betrachten wir zunächst die Transaktionen in einem UnitPrice Null, auf die wir mit der query Funktion zugreifen können. Wir können die Funktion length auf den Ergebnissen anwenden, um festzustellen, wie viele Transaktionen es gibt. Die Ausführung der Zelle zeigt, dass es sich nur um wenige Zeilen handelt, so dass wir sie wahrscheinlich getrost wischen können. Wenn man sich außerdem die Transaktionen ansieht, bei denen UnitPrice =0 ist, fallen keine Datenprobleme auf, die bereinigt werden müssen. Seltsam ist, dass in einigen Beschreibungen einfach manuell steht. Und darauf werden wir in Kürze zurückkommen. Aber ansonsten mache ich mir hier keine Sorgen um die Datenqualität. Vielleicht haben diese Kunden besondere Vereinbarungen mit den Einzelhändlern, was wir leider nicht wissen. Wir werden diese Zeilen einfach löschen, indem wir wieder die query-Syntax verwenden, um nur die Zeilen zu behalten, in denen UnitPrice größer als Null ist. Diejenigen unter Ihnen, die mehr Erfahrung…

Inhalt