Menambahkan Plot Korelasi dengan Seaborn

Hello guys! Kali ini kita akan menambahkan Plot Korelasi (Correlation Plot) dengan Seaborn untuk melakukan Visualisasi Grafik dengan Python.


Plot Korelasi adalah analisis multivariat yang sangat berguna untuk melihat hubungan antar titik data. Scatter plot membantu memahami pengaruh satu variabel terhadap variabel lainnya. Korelasi dapat didefinisikan sebagai pengaruh yang satu variabel berikan terhadap variabel lainnya.

Korelasi dapat dihitung antara dua variabel atau dapat pula merupakan korelasi satu terhadap banyak, seperti yang dapat kita lihat pada plot di bawah ini. Korelasi dapat bersifat positif, negatif, atau netral, dan rentang matematis dari korelasi adalah dari -1 hingga 1. Memahami korelasi dapat memiliki pengaruh yang sangat signifikan pada tahap pembangunan model dan juga pemahaman terhadap keluaran model.

Contoh : 

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# Fetch the Boston Housing dataset from the original source
data_url = "http://lib.stat.cmu.edu/datasets/boston"
raw_df = pd.read_csv(data_url, sep="\s+", skiprows=22, header=None)
data = np.hstack([raw_df.values[::2, :], raw_df.values[1::2, :2]])
target = raw_df.values[1::2, 2]

# Create a DataFrame with the fetched data
boston_df = pd.DataFrame(data, columns=["CRIM", "ZN", "INDUS", "CHAS", "NOX", "RM", "AGE", "DIS", "RAD", "TAX", "PTRATIO", "B", "LSTAT"])
boston_df["MEDV"] = target  # Adding the target variable (median value of owner-occupied homes)

# Set the style for the plot
sns.set(style="white")

# Adjust plot size
plt.figure(figsize=(14, 10))

# Illustrate a heatmap of the correlation matrix
sns.heatmap(boston_df.corr(), cmap=sns.cubehelix_palette(20, light=0.95, dark=0.15), annot=True)

# Set plot title
plt.title('Correlation Matrix Heatmap')

# Show the plot
plt.show()

Output :


Mohon maaf apabila ada kesalahan sedikit pun pada Kode Program ini.

Terima Kasih 😀😊😘👌👍 :)

Post a Comment

Previous Post Next Post