Hello guys! Kali ini kita akan menambahkan Scatter Plot dengan Seaborn untuk melakukan Visualisasi Grafik dengan Python.
Sumber Kode (Referensi) : Geeksforgeeks.org dan juga menggunakan ChatGPT
Untuk Software-nya, Anda bisa menggunakan Atom, Sublime Text, PyCharm, Spyder, ataupun VS Code. Bahkan Anda juga bisa menggunakan Online Compiler yang ada di Internet seperti Programiz, OneCompiler, OnlineGDB, Trinket, dll. Akan tetapi, Anda juga bisa menggunakan Jupyter Notebook agar lebih praktis.
Diagram pencar atau scatter plot adalah diagram bivariat yang memiliki kemiripan yang besar dengan grafik garis dalam cara pembuatannya. Grafik garis menggunakan garis pada sumbu X-Y untuk memplot fungsi kontinu, sementara scatter plot mengandalkan titik-titik untuk merepresentasikan data individual. Plot ini sangat berguna untuk melihat apakah dua variabel saling berkorelasi. Scatter plot bisa berdimensi 2 atau 3.
Sintaks :
seaborn.scatterplot(x=None, y=None, hue=None, style=None, size=None, data=None, palette=None, hue_order=None, hue_norm=None, sizes=None, size_order=None, size_norm=None, markers=True, style_order=None, x_bins=None, y_bins=None, units=None, estimator=None, ci=95, n_boot=1000, alpha=’auto’, x_jitter=None, y_jitter=None, legend=’brief’, ax=None, **kwargs)
Parameter :
- x, y: Variabel data input yang seharusnya bersifat numerik.
- data: Dataframe di mana setiap kolom adalah variabel dan setiap baris adalah suatu observasi.
- size: Variabel pengelompokan yang akan menghasilkan titik-titik dengan ukuran yang berbeda.
- style: Variabel pengelompokan yang akan menghasilkan titik-titik dengan penanda yang berbeda.
- palette: Variabel pengelompokan yang akan menghasilkan titik-titik dengan penanda yang berbeda.
- markers: Objek yang menentukan bagaimana menggambar penanda untuk berbagai tingkatan.
- alpha: Proporsional opasitas titik-titik.
Pengembalian : Metode ini mengembalikan objek Axes dengan plot yang digambar di atasnya.
Keuntungan dari Plot Sebar (Scatter Plot) :
- Menampilkan korelasi antar variabel
- Cocok untuk kumpulan data besar
- Lebih mudah untuk menemukan cluster data
- Representasi yang lebih baik dari setiap titik data
a. 2D Scatter Plot
Contoh :
import seaborn as snsimport matplotlib.pyplot as pltimport pandas as pd # Import pandas or use your dataset# Sample data (replace this with your actual dataset)diabetes = pd.read_csv("diabetes.csv")# Scatter plot illustration using Seabornplt.figure(figsize=(8, 6))sns.scatterplot(x='DiabetesPedigreeFunction', y='BMI', data=diabetes, hue='Outcome', palette='viridis')# Set plot labels and titleplt.title('2D Scatter Plot of DiabetesPedigreeFunction vs BMI')plt.xlabel('DiabetesPedigreeFunction')plt.ylabel('BMI')# Show the plotplt.show()
Output :
b. 3D Scatter Plot
Contoh :
import seaborn as snsimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3D# Assign axis valuesx = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]y = [5, 6, 2, 3, 13, 4, 1, 2, 4, 8]z = [2, 3, 3, 3, 5, 7, 9, 11, 9, 10]# Adjust size of plotsns.set(rc={'figure.figsize': (8, 7)})fig = plt.figure()ax = fig.add_subplot(111, projection='3d')ax.scatter(x, y, z, c='r', marker='o')# Assign labelsax.set_xlabel('X Label')ax.set_ylabel('Y Label')ax.set_zlabel('Z Label')# Set equal aspect ratio for all axesax.set_box_aspect([1, 1, 1])# Display illustrationplt.show()
Output :
Mohon maaf apabila ada kesalahan sedikit pun pada Kode Program ini.
Terima Kasih 😀😊😘👌👍 :)