Bekerja dengan File CSV di Pandas
Dalam analisis data, file CSV (Comma-Separated Values) merupakan format populer untuk menyimpan dan bertukar data. Pandas, library Python yang powerful, memudahkan saya untuk bekerja dengan file CSV, baik untuk mengekspor maupun mengimpor data. Di sini, kita akan membahas cara mengekspor DataFrame ke file CSV dan membacanya kembali ke dalam DataFrame.
Memasang Pandas
Jika belum memasang Pandas, Anda bisa melakukannya menggunakan pip:
pip install pandas
Mengekspor DataFrame ke File CSV
Mengekspor data ke file CSV adalah tugas umum dalam analisis data. Berikut cara membuat DataFrame dan menyimpannya ke file CSV:
-
Membuat DataFrame
kita mulai dengan membuat DataFrame sederhana dengan beberapa data contoh:
import pandas as pd df = pd.DataFrame( { "Name": [ "Braund, Mr. Owen Harris", "Allen, Mr. William Henry", "Bonnell, Miss. Elizabeth", ], "Age": [22, 35, 58], "Sex": ["male", "male", "female"], } )
-
Mengekspor DataFrame
Untuk menyimpan DataFrame ke file CSV, gunakan metode
to_csv
. Dengan mengaturindex=False
, indeks DataFrame tidak akan ditulis ke file:df.to_csv('output.csv', index=False)
Ini akan membuat file
output.csv
di direktori kerja saat ini, berisi data dari DataFrame.
Membaca File CSV ke DataFrame
Setelah memiliki file CSV, Anda dapat membacanya kembali ke DataFrame menggunakan metode read_csv
:
-
Membaca File CSV
Untuk memuat data dari file CSV ke DataFrame:
df = pd.read_csv('output.csv')
-
Menampilkan DataFrame
Tampilkan isi DataFrame untuk memverifikasi bahwa data telah dibaca dengan benar:
print(df)
Contoh Lengkap
Berikut contoh lengkap yang menunjukkan cara mengekspor dan mengimpor data CSV:
import pandas as pd
# Membuat DataFrame
df = pd.DataFrame(
{
"Name": [
"Braund, Mr. Owen Harris",
"Allen, Mr. William Henry",
"Bonnell, Miss. Elizabeth",
],
"Age": [22, 35, 58],
"Sex": ["male", "male", "female"],
}
)
# Mengekspor DataFrame ke file CSV
df.to_csv('output.csv', index=False)
# Membaca file CSV ke DataFrame
df = pd.read_csv('output.csv')
# Menampilkan DataFrame
print(df)
Kesimpulan
Mengekspor dan mengimpor data dengan Pandas sangat mudah. Dengan beberapa baris kode, Anda bisa menyimpan data ke file CSV dan membacanya kembali ke DataFrame untuk analisis lebih lanjut. Fungsi ini sangat penting dalam pengolahan data dan integrasi dengan sistem lain yang menggunakan file CSV.