Apps Artificial Intelligence CSS DevOps Go JavaScript Laravel Linux MongoDB MySQL PHP Python Rust Vue

Bekerja dengan File CSV di Pandas

1 min read .
Bekerja dengan File CSV di Pandas

Dalam analisis data, file CSV (Comma-Separated Values) merupakan format populer untuk menyimpan dan bertukar data. Pandas, library Python yang powerful, memudahkan saya untuk bekerja dengan file CSV, baik untuk mengekspor maupun mengimpor data. Di sini, kita akan membahas cara mengekspor DataFrame ke file CSV dan membacanya kembali ke dalam DataFrame.

Memasang Pandas

Jika belum memasang Pandas, Anda bisa melakukannya menggunakan pip:

pip install pandas

Mengekspor DataFrame ke File CSV

Mengekspor data ke file CSV adalah tugas umum dalam analisis data. Berikut cara membuat DataFrame dan menyimpannya ke file CSV:

  1. Membuat DataFrame

    kita mulai dengan membuat DataFrame sederhana dengan beberapa data contoh:

    import pandas as pd
    
    df = pd.DataFrame(
        {
            "Name": [
                "Braund, Mr. Owen Harris",
                "Allen, Mr. William Henry",
                "Bonnell, Miss. Elizabeth",
            ],
            "Age": [22, 35, 58],
            "Sex": ["male", "male", "female"],
        }
    )
  2. Mengekspor DataFrame

    Untuk menyimpan DataFrame ke file CSV, gunakan metode to_csv. Dengan mengatur index=False, indeks DataFrame tidak akan ditulis ke file:

    df.to_csv('output.csv', index=False)

    Ini akan membuat file output.csv di direktori kerja saat ini, berisi data dari DataFrame.

Membaca File CSV ke DataFrame

Setelah memiliki file CSV, Anda dapat membacanya kembali ke DataFrame menggunakan metode read_csv:

  1. Membaca File CSV

    Untuk memuat data dari file CSV ke DataFrame:

    df = pd.read_csv('output.csv')
  2. Menampilkan DataFrame

    Tampilkan isi DataFrame untuk memverifikasi bahwa data telah dibaca dengan benar:

    print(df)

Contoh Lengkap

Berikut contoh lengkap yang menunjukkan cara mengekspor dan mengimpor data CSV:

import pandas as pd

# Membuat DataFrame
df = pd.DataFrame(
    {
        "Name": [
            "Braund, Mr. Owen Harris",
            "Allen, Mr. William Henry",
            "Bonnell, Miss. Elizabeth",
        ],
        "Age": [22, 35, 58],
        "Sex": ["male", "male", "female"],
    }
)

# Mengekspor DataFrame ke file CSV
df.to_csv('output.csv', index=False)

# Membaca file CSV ke DataFrame
df = pd.read_csv('output.csv')

# Menampilkan DataFrame
print(df)

Kesimpulan

Mengekspor dan mengimpor data dengan Pandas sangat mudah. Dengan beberapa baris kode, Anda bisa menyimpan data ke file CSV dan membacanya kembali ke DataFrame untuk analisis lebih lanjut. Fungsi ini sangat penting dalam pengolahan data dan integrasi dengan sistem lain yang menggunakan file CSV.

Lihat Juga

Mengenal Python Lists: Panduan Lengkap dari Dasar hingga Multidimensional
Mengenal Python Lists: Panduan Lengkap dari Dasar hingga Multidimensional
Sebagai developer independen, saya sering banget ketemu kasus di mana data harus disimpan dan diolah dengan fleksibel. Awalnya saya rada bingung bedain kapan pakai list biasa, nested list, atau cara querying yang efisien. Tapi setelah sering eksperimen, Python lists itu ternyata powerful banget. Gini deh, mari kita kupas tuntas. 1. Membuat Lists Dasar Copy # Kosong empty_list = [] # Integer numbers = [1, 2, 3, 4, 5] # Campur-campur mixed_list = [1, "Hello", 3.14, True] # Nested list nested_list = [[1,2,3], [4,5,6], [7,8,9]] Menggunakan list() Copy tuple_to_list = list((1,2,3)) string_to_list = list("hello") 2. Mengakses & Mengubah Elemen Copy numbers = [10, 20, 30, 40, 50] # Akses first_element = numbers[0] last_element = numbers[-1] slice_of_list = numbers[1:4] # Modifikasi numbers[1] = 99 3. Menambah & Menghapus Elemen Copy numbers = [1,2,3] # Menambah numbers.append(4) numbers.extend([5,6]) numbers.insert(1, 10) # Menghapus numbers.remove(3) removed = numbers.pop(1) del numbers[1] 4. Operasi Dasar Lists Copy list1 + list2 # Concatenation [1,2,3] * 3 # Repetition 3 in [1,2,3] # Membership 5. Iterasi & List Comprehension Copy for n in numbers: print(n) squares = [x**2 for x in range(10)] evens = [x for x in range(10) if x%2==0] 6. Multidimensional Lists Copy matrix = [ [1,2,3], [4,5,6], [7,8,9] ] tensor = [ [[1,2],[3,4]], [[5,6],[7,8]], [[9,10],[11,12]] ] # Akses element = matrix[1][2] block = tensor[0] # Iterasi for row in matrix: for val in row: print(val, end=' ') print() 7. Querying Lists Copy numbers = [1,2,3,4,5,6,7,8,9,10] # Filtering evens = [x for x in numbers if x%2==0] evens2 = list(filter(lambda x: x%2==0, numbers)) # Searching greater_than_five = next((x for x in numbers if x>5), None) all_positive = all(x>0 for x in numbers) # Aggregating total_sum = sum(numbers) min_value = min(numbers) max_value = max(numbers) 8. Kesimpulan Gini deh, Python lists itu simpel tapi powerful. Dari list dasar, nested list, sampai querying, semuanya bikin manipulasi data lebih fleksibel. Kita rutin pakai list dan list comprehension, coding Python sehari-hari jadi lebih cepat dan enak.
chevron-up