Struktur utama di Pandas disebut DataFrame. Bayangkan DataFrame itu seperti satu sheet di Excel, lengkap dengan baris dan kolom, tapi bisa kamu kendalikan pakai kode.
🧩 Apa yang Akan Dipelajari
- Cara instal dan impor Pandas.
- Membuat DataFrame dari Dictionary.
- Membaca file CSV atau Excel secara instan.
- Melakukan "Filtering" data (nyari data spesifik).
- Melihat statistik ringkas dari ribuan baris data.
⚙️ Persiapan
Instal dulu Pandas di terminal (pastikan venv aktif):
pip install pandas
🚀 1. Membuat DataFrame Pertama
Pandas biasanya diimpor dengan alias pd.
import pandas as pd
# Data dalam bentuk Dictionary (seperti materi Season 1)
data_karyawan = {
'Nama': ['Kay', 'Sena', 'Shala'],
'Umur': [25, 28, 5],
'Kota': ['Jakarta', 'Bandung', 'Surabaya']
}
# Ubah jadi DataFrame
df = pd.DataFrame(data_karyawan)
print(df)
🚀 2. Membaca File Eksternal (Magic!)
Gak perlu nulis data manual. Pandas bisa baca file CSV atau Excel cuma dalam satu baris.
# Membaca file CSV
df_csv = pd.read_csv('data_penjualan.csv')
# Melihat 5 baris pertama saja
print(df_csv.head())
# Melihat info struktur data (berapa baris, ada data kosong gak?)
print(df_csv.info())
🚀 3. Filtering Data (Cari Data Cepat)
Misal kamu punya data 1.000 orang, dan kamu cuma mau lihat yang umurnya di atas 20 tahun.
# Cara filter yang sangat "manusiawi"
orang_dewasa = df[df['Umur'] > 20]
print(orang_dewasa)
🚀 4. Analisis Kilat (describe)
Mau tahu berapa rata-rata umur, nilai tertinggi, dan terendah dari ribuan data? Cukup pakai satu fungsi ini:
print(df.describe())
💡 Tips untuk Pemula
- Series vs DataFrame: Series itu cuma satu kolom (1D), sedangkan DataFrame itu tabel utuh (2D).
- Data Cleaning: Pandas punya fungsi sakti seperti
.dropna()buat buang baris yang isinya kosong (NaN), atau.fillna()buat ngisi data yang bolong. - Integrasi NumPy: Pandas dibangun di atas NumPy, jadi kamu bisa pakai fungsi-fungsi NumPy di dalam Pandas dengan sangat lancar.
❗ Troubleshooting
Masalah: Muncul error ImportError: Missing optional dependency 'openpyxl'.
Solusi: Pandas butuh library tambahan buat baca file .xlsx (Excel). Kamu tinggal instal dengan perintah: pip install openpyxl.
🎯 Kesimpulan
Pandas adalah pintu gerbang menuju AI Workflow. Sebelum data dikasih ke AI, data itu harus "mandi" dulu di Pandas supaya bersih dan rapi. Dengan Pandas, kamu bisa mengolah jutaan baris data secepat kilat!