Hello guys! Kali ini kita akan menambahkan Box Plot dengan Seaborn untuk melakukan Visualisasi Grafik dengan Python.
Sumber Kode (Referensi) : Geeksforgeeks.org dan juga menggunakan ChatGPT
Untuk Software-nya, Anda bisa menggunakan Atom, Sublime Text, PyCharm, Spyder, ataupun VS Code. Bahkan Anda juga bisa menggunakan Online Compiler yang ada di Internet seperti Programiz, OneCompiler, OnlineGDB, Trinket, dll. Akan tetapi, Anda juga bisa menggunakan Jupyter Notebook agar lebih praktis.
Sebuah diagram kotak (boxplot), juga dikenal sebagai diagram kotak dan cambuk, kotak dan cambuk jelas ditampilkan dalam gambar di bawah ini. Ini adalah representasi visual yang sangat baik ketika datang untuk mengukur distribusi data. Dengan jelas menunjukkan nilai median, pencilan, dan kuartil. Pemahaman distribusi data adalah faktor penting lainnya yang mengarah pada pembangunan model yang lebih baik. Jika data memiliki pencilan, diagram kotak adalah cara yang direkomendasikan untuk mengidentifikasinya dan mengambil tindakan yang diperlukan.
Sintaks :
seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, ax=None, **kwargs)
Parameter :
- x, y, hue: Input untuk memplot data bentuk panjang.
- data: Kumpulan data untuk pembuatan plot. Jika x dan y tidak ada, maka diartikan sebagai bentuk lebar.
- color: Warna untuk semua elemen.
Diagram kotak dan cambuk menunjukkan bagaimana data tersebar. Lima informasi umumnya disertakan dalam diagram ini :
- Minimum ditunjukkan di ujung kiri diagram, di ujung "cambuk" kiri
- Kuartil pertama, Q1, berada di ujung kiri kotak (cambuk kiri)
- Median ditunjukkan sebagai garis di tengah kotak
- Kuartil ketiga, Q3, ditunjukkan di ujung kanan kotak (cambuk kanan)
- Maksimum berada di ujung kanan kotak
Seperti yang dapat dilihat dalam representasi dan diagram di bawah ini, diagram kotak dapat digambarkan untuk satu atau lebih variabel, memberikan wawasan yang sangat baik pada data kita.
a. Box Plot dan Violin Plot
Contoh :
import matplotlib.pyplot as pltimport seaborn as snsimport pandas as pd # Import pandas or use your dataset# Sample data (replace this with your actual dataset)diabetes = pd.read_csv("diabetes.csv")# Box plot and violin plot for Outcome vs BloodPressure_, axes = plt.subplots(1, 2, sharey=True, figsize=(10, 4))# Box plot illustrationsns.boxplot(x='Outcome', y='BloodPressure', data=diabetes, ax=axes[0])# Violin plot illustrationsns.violinplot(x='Outcome', y='BloodPressure', data=diabetes, ax=axes[1])# Show the plotsplt.show()
Output :
b. Multiple Box Plot
Contoh :
import seaborn as snsimport pandas as pd # Import pandas or use your dataset# Sample data (replace this with your actual dataset)diabetes = pd.read_csv("diabetes.csv")# Box plot for all the numerical variablessns.set(rc={'figure.figsize': (16, 5)})# Multiple box plot illustrationsns.boxplot(data=diabetes.select_dtypes(include='number'))# Show the plotplt.show()
Output :
Mohon maaf apabila ada kesalahan sedikit pun pada Kode Program ini.
Terima Kasih 😀😊😘👌👍 :)