Cara menambahkan Box Plot dengan Seaborn

Hello guys! Kali ini kita akan menambahkan Box Plot dengan Seaborn untuk melakukan Visualisasi Grafik dengan Python.

Sumber Kode (Referensi) : Geeksforgeeks.org dan juga menggunakan ChatGPT

Untuk Software-nya, Anda bisa menggunakan Atom, Sublime Text, PyCharm, Spyder, ataupun VS Code. Bahkan Anda juga bisa menggunakan Online Compiler yang ada di Internet seperti ProgramizOneCompilerOnlineGDBTrinket, dll. Akan tetapi, Anda juga bisa menggunakan Jupyter Notebook agar lebih praktis.


Sebuah diagram kotak (boxplot), juga dikenal sebagai diagram kotak dan cambuk, kotak dan cambuk jelas ditampilkan dalam gambar di bawah ini. Ini adalah representasi visual yang sangat baik ketika datang untuk mengukur distribusi data. Dengan jelas menunjukkan nilai median, pencilan, dan kuartil. Pemahaman distribusi data adalah faktor penting lainnya yang mengarah pada pembangunan model yang lebih baik. Jika data memiliki pencilan, diagram kotak adalah cara yang direkomendasikan untuk mengidentifikasinya dan mengambil tindakan yang diperlukan.

Sintaks :

seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, ax=None, **kwargs)

Parameter :

  • x, y, hue: Input untuk memplot data bentuk panjang.
  • data: Kumpulan data untuk pembuatan plot. Jika x dan y tidak ada, maka diartikan sebagai bentuk lebar.
  • color: Warna untuk semua elemen.

Diagram kotak dan cambuk menunjukkan bagaimana data tersebar. Lima informasi umumnya disertakan dalam diagram ini :

  • Minimum ditunjukkan di ujung kiri diagram, di ujung "cambuk" kiri
  • Kuartil pertama, Q1, berada di ujung kiri kotak (cambuk kiri)
  • Median ditunjukkan sebagai garis di tengah kotak
  • Kuartil ketiga, Q3, ditunjukkan di ujung kanan kotak (cambuk kanan)
  • Maksimum berada di ujung kanan kotak

Seperti yang dapat dilihat dalam representasi dan diagram di bawah ini, diagram kotak dapat digambarkan untuk satu atau lebih variabel, memberikan wawasan yang sangat baik pada data kita.

a. Box Plot dan Violin Plot

Contoh : 

import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd  # Import pandas or use your dataset

# Sample data (replace this with your actual dataset)
diabetes = pd.read_csv("diabetes.csv")

# Box plot and violin plot for Outcome vs BloodPressure
_, axes = plt.subplots(1, 2, sharey=True, figsize=(10, 4))

# Box plot illustration
sns.boxplot(x='Outcome', y='BloodPressure', data=diabetes, ax=axes[0])

# Violin plot illustration
sns.violinplot(x='Outcome', y='BloodPressure', data=diabetes, ax=axes[1])

# Show the plots
plt.show()

Output :

b. Multiple Box Plot

Contoh : 

import seaborn as sns
import pandas as pd  # Import pandas or use your dataset

# Sample data (replace this with your actual dataset)
diabetes = pd.read_csv("diabetes.csv")

# Box plot for all the numerical variables
sns.set(rc={'figure.figsize': (16, 5)})

# Multiple box plot illustration
sns.boxplot(data=diabetes.select_dtypes(include='number'))

# Show the plot
plt.show()

Output :


Mohon maaf apabila ada kesalahan sedikit pun pada Kode Program ini.

Terima Kasih 😀😊😘👌👍 :)

Post a Comment

Previous Post Next Post