Ein DataFrame ist eine strukturierte Datenstruktur in Pandas, einem leistungsstarken Python-Paket zur Datenanalyse. DataFrames sind eine effiziente Möglichkeit, Daten zu organisieren und zu analysieren. Oft müssen wir jedoch zu einem DataFrame eine neue Spalte hinzufügen. In diesem Blogartikel zeigen wir Ihnen, wie Sie eine neue Spalte zu einem DataFrame hinzufügen können.
Voraussetzungen
Um die in diesem Artikel beschriebenen Schritte durchführen zu können, sollten Sie Grundkenntnisse in Python und der Pandas-Bibliothek haben. Stellen Sie sicher, dass Sie die neueste Version von Pandas installiert haben. Sie können dies über die Befehlszeile mit dem Befehl pip install pandas
tun.
Beispiel DataFrame
Bevor wir lernen, wie man Spalten zu einem DataFrame hinzufügt, lassen Sie uns zunächst ein Beispiel DataFrame erstellen, mit dem wir arbeiten können. In diesem Beispiel haben wir eine Tabelle mit dem Namen „students“, die Informationen über verschiedene Studenten enthält.
“’python
import pandas as pd
- data = {‚Name‘: [‚Max‘, ‚Lisa‘, ‚Tom‘, ‚Emily‘],
- ‚Alter‘: [20, 19, 21, 18],
- ‚Note‘: [1.7, 2.3, 1.0, 2.0]}
df = pd.DataFrame(data)
print(df)
“‘
Dieser Code erstellt ein DataFrame mit drei Spalten: „Name“, „Alter“ und „Note“. Der DataFrame sieht wie folgt aus:
“‘
Name Alter Note
0 Max 20 1.7
1 Lisa 19 2.3
2 Tom 21 1.0
3 Emily 18 2.0
“‘
Wie man eine neue Spalte hinzufügt
Um eine neue Spalte zu einem DataFrame hinzuzufügen, können wir eine der bereits vorhandenen Spalten verwenden oder eine neue erstellen. Hier sind zwei gängige Methoden, um eine neue Spalte hinzuzufügen:
Methode 1: Verwenden einer bereits vorhandenen Spalte
Angenommen, wir möchten eine neue Spalte „Alter_in_Jahren“ basierend auf der vorhandenen Spalte „Alter“ erstellen. In dieser Spalte möchten wir das Alter jedes Studenten in Jahren speichern. Hier ist der Code, um dies zu erreichen:
“’python
df[‚Alter_in_Jahren‘] = df[‚Alter‘]
“‘
Nach Ausführung dieses Codes wird eine neue Spalte mit dem Namen „Alter_in_Jahren“ zum DataFrame hinzugefügt. Der DataFrame sieht nun wie folgt aus:
“‘
Name Alter Note Alter_in_Jahren
0 Max 20 1.7 20
1 Lisa 19 2.3 19
2 Tom 21 1.0 21
3 Emily 18 2.0 18
“‘
Methode 2: Erstellung einer neuen Spalte
Alternativ können wir auch eine vollständig neue Spalte erstellen. Angenommen, wir möchten eine Spalte „Geschlecht“ erstellen und die Werte „männlich“ und „weiblich“ für jedes Element angeben. Hier ist der Code, um dies zu erreichen:
“’python
df[‚Geschlecht‘] = [‚männlich‘, ‚weiblich‘, ‚männlich‘, ‚weiblich‘]
“‘
Nach Ausführung dieses Codes wird eine neue Spalte mit dem Namen „Geschlecht“ zum DataFrame hinzugefügt. Der DataFrame sieht nun wie folgt aus:
“‘
Name Alter Note Geschlecht
0 Max 20 1.7 männlich
1 Lisa 19 2.3 weiblich
2 Tom 21 1.0 männlich
3 Emily 18 2.0 weiblich
“‘
Pandas verstehen #08 – Spalten zu einem DataFrame hinzufügen
Fazit
Das Hinzufügen einer neuen Spalte zu einem DataFrame ist eine grundlegende Operation, die Sie häufig benötigen werden, wenn Sie mit Pandas arbeiten. In diesem Artikel haben wir zwei Methoden vorgestellt, um eine neue Spalte zu einem DataFrame hinzuzufügen. Sie können entweder eine vorhandene Spalte verwenden oder eine neue erstellen. Es ist wichtig, die Namen der Spalten korrekt anzugeben, um sicherzustellen, dass die Daten korrekt zugeordnet werden. Mit diesen Informationen können Sie nun Ihre Datensätze analysieren und die gewünschten Spalten hinzufügen.
Wir hoffen, dass dieser Artikel Ihnen geholfen hat, das Hinzufügen einer neuen Spalte zu einem DataFrame besser zu verstehen. Viel Spaß beim Programmieren!