Hello guys! Kali ini kita akan menambahkan Plot Korelasi (Correlation Plot) dengan Seaborn untuk melakukan Visualisasi Grafik dengan Python.
Plot Korelasi adalah analisis multivariat yang sangat berguna untuk melihat hubungan antar titik data. Scatter plot membantu memahami pengaruh satu variabel terhadap variabel lainnya. Korelasi dapat didefinisikan sebagai pengaruh yang satu variabel berikan terhadap variabel lainnya.
Korelasi dapat dihitung antara dua variabel atau dapat pula merupakan korelasi satu terhadap banyak, seperti yang dapat kita lihat pada plot di bawah ini. Korelasi dapat bersifat positif, negatif, atau netral, dan rentang matematis dari korelasi adalah dari -1 hingga 1. Memahami korelasi dapat memiliki pengaruh yang sangat signifikan pada tahap pembangunan model dan juga pemahaman terhadap keluaran model.
Contoh :
import seaborn as snsimport matplotlib.pyplot as pltimport pandas as pdimport numpy as np# Fetch the Boston Housing dataset from the original sourcedata_url = "http://lib.stat.cmu.edu/datasets/boston"raw_df = pd.read_csv(data_url, sep="\s+", skiprows=22, header=None)data = np.hstack([raw_df.values[::2, :], raw_df.values[1::2, :2]])target = raw_df.values[1::2, 2]# Create a DataFrame with the fetched databoston_df = pd.DataFrame(data, columns=["CRIM", "ZN", "INDUS", "CHAS", "NOX", "RM", "AGE", "DIS", "RAD", "TAX", "PTRATIO", "B", "LSTAT"])boston_df["MEDV"] = target # Adding the target variable (median value of owner-occupied homes)# Set the style for the plotsns.set(style="white")# Adjust plot sizeplt.figure(figsize=(14, 10))# Illustrate a heatmap of the correlation matrixsns.heatmap(boston_df.corr(), cmap=sns.cubehelix_palette(20, light=0.95, dark=0.15), annot=True)# Set plot titleplt.title('Correlation Matrix Heatmap')# Show the plotplt.show()
Output :
Mohon maaf apabila ada kesalahan sedikit pun pada Kode Program ini.
Terima Kasih 😀😊😘👌👍 :)