Bekerja dengan Pandas: Panduan untuk Pemula
Pandas adalah library powerful untuk manipulasi dan analisis data di Python. Di sini, kita akan menjelajahi beberapa operasi dasar yang bisa dilakukan dengan Pandas, termasuk mengganti nama kolom, menambah, memperbarui, dan menghapus data, serta menyortir dan memfilter DataFrame.
Memasang Pandas
Untuk memulai, pastikan Pandas sudah terpasang. Anda bisa memasangnya dengan mudah menggunakan pip:
pip install pandas
Membuat DataFrame
kita mulai dengan membuat DataFrame sederhana. Berikut cara menginisialisasi DataFrame dengan beberapa data contoh:
import pandas as pd
df = pd.DataFrame(
{
"Name": [
"Braund, Mr. Owen Harris",
"Allen, Mr. William Henry",
"Bonnell, Miss. Elizabeth",
],
"Age": [22, 35, 58],
"Sex": ["male", "male", "female"],
}
)
Mengganti Nama Kolom
Jika perlu mengganti nama kolom, gunakan metode rename
. Misalnya, mengganti kolom “Sex” menjadi “Gender”:
df.rename(columns={"Sex": "Gender"}, inplace=True)
Menambah Data
Menambah baris baru ke DataFrame sangat mudah. Contoh menambahkan baris baru:
df.loc[len(df)] = ["Smith, Mr. John", 28, "male"]
Memperbarui Data
Untuk memperbarui data tertentu, gunakan indexer loc
. Misalnya, memperbarui usia “Allen, Mr. William Henry”:
df.loc[df['Name'] == "Allen, Mr. William Henry", 'Age'] = 36
Menghapus Data
Anda dapat menghapus baris atau kolom dengan berbagai cara:
-
Hapus Berdasarkan Nama: Gunakan boolean indexing untuk menghapus baris tertentu:
df = df[df['Name'] != "Allen, Mr. William Henry"]
-
Hapus Berdasarkan Index: Gunakan metode
drop
:df = df.drop(3)
-
Hapus Kolom: Gunakan
drop
denganaxis=1
:df = df.drop(columns=['Age'])
Menyortir Data
Menyortir data di Pandas mudah dilakukan, baik secara ascending maupun descending:
-
Sortir Ascending:
sortAscending = df.sort_values(by="Age")
-
Sortir Descending:
sortDescending = df.sort_values(by="Age", ascending=False)
Memfilter Data
Filter memungkinkan Anda mengekstrak baris berdasarkan kondisi tertentu:
-
Filter Usia di Bawah 30:
filterBelow30 = df[df['Age'] < 30]
-
Filter Usia Tertentu:
filterAge = df[df["Age"] == 35]
Kesimpulan
Pandas menyediakan berbagai alat kuat untuk manipulasi dan analisis data. Dengan menguasai operasi dasar ini, Anda bisa membersihkan, mentransformasi, dan menganalisis data dengan efisien. Nantikan topik lanjutan untuk analisis data yang lebih kompleks dengan Pandas!