Pandas ist eine Python-Bibliothek, die für ihre leistungsstarke Datenanalyse und Datenmanipulation bekannt ist. Eine häufige Aufgabe bei der Arbeit mit Pandas-Datenframes ist das Filtern von Daten basierend auf bestimmten Kriterien. In diesem Artikel werden wir uns darauf konzentrieren, wie man Pandas-Datenframes nach Spaltenwerten filtert.
Was sind Pandas Dataframes?
Ein Pandas-DataFrame ist eine zweidimensionale Datenstruktur, die eine Tabelle mit Zeilen und Spalten darstellt. Jede Spalte hat einen eindeutigen Namen und jede Zeile hat einen eindeutigen Index. Dataframes werden oft verwendet, um große Mengen von Daten zu organisieren, zu analysieren und zu visualisieren.
Filtern von Datenframes nach Spaltenwerten
Um einen Pandas-DataFrame nach einem bestimmten Spaltenwert zu filtern, können wir die.loc[]- oder.iloc[]-Funktion verwenden. Diese Funktionen ermöglichen es uns, Daten basierend auf Zeilen- und Spaltenindizes oder basierend auf Spaltennamen und -werten auszuwählen.
Beispiel
Angenommen, wir haben einen einfachen Pandas-DataFrame mit den Spalten „Name“, „Alter“ und „Geschlecht“. Wenn wir nur die Zeilen filtern wollen, in denen das Geschlecht „weiblich“ ist, können wir folgenden Code verwenden:
“’python
import pandas as pd
data = {‚Name‘: [‚Anna‘, ‚Max‘, ‚Julia‘, ‚Paul‘], ‚Alter‘: [25, 30, 22, 35], ‚Geschlecht‘: [‚weiblich‘, ‚männlich‘, ‚weiblich‘, ‚männlich‘]}
df = pd.DataFrame(data)
filtered_df = df.loc[df[‚Geschlecht‘] == ‚weiblich‘]
print(filtered_df)
“‘
Python Pandas Tutorial (Part 4): Filtering – Using…
Zusätzliche Filteroptionen
Neben dem Filtern von Daten nach einem bestimmten Spaltenwert können wir auch zusätzliche Bedingungen hinzufügen. Zum Beispiel können wir nach Zeilen filtern, in denen das Geschlecht „weiblich“ ist und das Alter über 25 Jahre liegt. Hier ist ein Beispielcode:
“’python
filtered_df = df.loc[(df[‚Geschlecht‘] == ‚weiblich‘) & (df[‚Alter‘] > 25)]
“‘
Fazit
Das Filtern von Pandas-Datenframes nach Spaltenwerten ist eine häufige und nützliche Aufgabe bei der Datenanalyse. Mit den einfachen Funktionen.loc[] und.iloc[] können wir Daten effizient filtern und relevante Informationen extrahieren. Durch das Verstehen dieser Grundlagen können wir schnell und einfach komplexe Datenstrukturen analysieren und visualisieren.