Scatter(์ค์บํฐ)
์ค์บํฐ ํ๋กฏ์ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ์๊ฐ์ ์ผ๋ก ํ์ ํ ์ ์๊ฒ ํด์ฃผ๋ฉฐ, ๋ ๋ณ์ ๊ฐ์ ๊ด๊ณ๋ฅผ ์ดํดํ๋ ๋ฐ ๋์์ด ๋๋ค
์๋ฅผ ๋ค์ด, ๋ ๋ณ์ ๊ฐ์ ์์ ์๊ด ๊ด๊ณ๊ฐ ์์ ๋, ๋ฐ์ดํฐ ํฌ์ธํธ๋ค์ ๋์ฒด๋ก ์ค๋ฅธ์ชฝ ์๋ก ํฅํ๋ ๊ฒฝํฅ์ด ์๋ค.
๋ฐ๋๋ก ์์ ์๊ด ๊ด๊ณ๊ฐ ์์ ๋๋ ๋์ฒด๋ก ์ผ์ชฝ ์๋ก ํฅํ๋ ๊ฒฝํฅ์ด ์๋ค.
๋ํ ์๊ด๊ด๊ณ๊ฐ ๊ฐํ ๊ฒฝ์ฐ ๋ฐ์ดํฐ๋ค์ด ๋ชจ์ฌ์๊ณ , ์๊ด๊ด๊ณ๊ฐ ์ฝํ ๊ฒฝ์ฐ ๋ฐ์ดํฐ๋ค์ด ํผ์ ธ์๋ค


import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sb
# ๋ฐฐ๊ธฐ๋(displ)๊ณผ ์ฐ๋น(comb)์ ๊ด๊ณ๋ฅผ ๋์ผ๋ก ํ์ธํด๋ณด๊ณ ์ถ๋ค
df
displ | pv2 | pv4 | city | UCity | highway | UHighway | comb | |
0 | 3.8 | 79 | 0 | 16.4596 | 20.2988 | 22.5568 | 30.1798 | 18.7389 |
1 | 2.0 | 94 | 0 | 21.8706 | 26.9770 | 31.0367 | 42.4936 | 25.2227 |
2 | 3.6 | 94 | 0 | 17.4935 | 21.2000 | 26.5716 | 35.1000 | 20.6716 |
3 | 3.6 | 94 | 0 | 16.9415 | 20.5000 | 25.2190 | 33.5000 | 19.8774 |
4 | 2.4 | 0 | 95 | 24.7726 | 31.9796 | 35.5340 | 51.8816 | 28.6813 |
... | ... | ... | ... | ... | ... | ... | ... | ... |
3924 | 1.8 | 0 | 0 | 55.2206 | 78.8197 | 53.0000 | 73.6525 | 54.4329 |
3925 | 2.0 | 0 | 106 | 39.0000 | 55.9000 | 44.3066 | 64.0000 | 41.0000 |
3926 | 2.0 | 0 | 106 | 40.0000 | 56.0000 | 46.0000 | 64.0000 | 42.0000 |
3927 | 3.4 | 99 | 0 | 19.2200 | 24.2000 | 30.2863 | 43.4000 | 23.0021 |
3928 | 3.4 | 99 | 0 | 18.0431 | 22.6000 | 27.0000 | 39.3000 | 21.3945 |
plt.figure()
plt.scatter(data=df, x = 'displ', y= 'comb')
plt.title('Displ Vs Comb')
plt.xlabel('Displacement')
plt.ylabel('Combined Fuel Eff (mpg)')
plt.show()

์ค์บํฐ ์ฐจํธ๋ฅผ ํตํด ์ผ์ชฝ ์๋ก ํฅํ๋ ๊ฒ์ ๋ณด์, ์์ ์๊ด๊ด๊ณ๊ฐ ์๋ค๋ ๊ฒ์ ์ ์๊ฐ ์๋ค.
# ์๊ด๊ด๊ณ ๋ถ์
df[['displ','comb']].corr()

displ = displ, comb=comb๋ 1์ด ๋์ค๋ ๊ฒ์ ์๋ฏธ์๋ ๋ถ์์ด๊ณ
-0.758397์ด ๋์ค๋ ๊ฒ์ ํตํด displ๊ณผ comb๋ ์์ ์๊ด๊ด๊ณ๋ผ๋ ๊ฒ์ ์ ์ ์๋ค.
# ๋ ๋ง์ ์๊ด๊ด๊ณ ๋ฐ์ดํฐ๋ฅผ ๋ณด๊ณ ์ถ๋ค๋ฉด?
df.corr(numeric_only=True)
# ์ค์บํฐ ์ฐจํธ์ ํ๊ท์ง์ ์ ์ถ๊ฐํ๊ณ ์ถ๋ค๋ฉด?
sb.regplot(data=df, x = 'displ', y= 'comb')
plt.title('Displ Vs Comb')
plt.xlabel('Displacement')
plt.ylabel('Combined Fuel Eff (mpg)')
plt.show()
scatter ๋์ regplot์ ์ฌ์ฉํ๋ฉด ๋๋ค

# ์๋ฅ์ด ๊ณก์ ์ ๊ทธ๋ฆฌ๊ณ ์ถ๋ค๋ฉด?
sb.pairplot(data= df, vars= ['displ','comb','co2'])
plt.show()
scatter ๋์ pairplot์ ์ฌ์ฉํ๋ฉด ๋๋ค

HeatMap(ํํธ๋งต)
์ค์บํฐํ๋กฏ์, ๊ฒน์ณ์๋ ์ ์ด ์ผ๋ง๋ ๋ฐ๋์๋์ง๋ฅผ ์์ธํ ์์ง ๋ชปํ๋ค.
์ด๋ฌํ ๋ฐ์ดํฐ์ "๋ฐ๋"๋ HeatMap(ํํธ๋งต)์ ํตํด ์์๋ณผ ์ ์๋ค.
plt.hist2d(data= df, x='displ', y='comb', cmin=0.5, cmap = 'viridis_r', bins=20)
#cmin์ ์๋ ๋ฐ์ดํฐ๋ฅผ ํ์์์ผ๋ก ํํํด์ค๋ค
plt.colorbar()
plt.show()

'Python > Matplotlib' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
PIE, BAR, LINE, AREA ์ฐจํธ๋ฅผ ์คํธ๋ฆผ๋ฆฟ(streamlit)์ ํํํ๊ธฐ (0) | 2024.04.26 |
---|---|
scatter, histogram ๋ฑ์ ์ฐจํธ๋ฅผ ์คํธ๋ฆผ๋ฆฟ(streamlit)์ผ๋ก ํํํ๊ธฐ (0) | 2024.04.26 |
Matplotlib) Histograms(ํ์คํ ๊ทธ๋จ) ์ฐจํธ ๊ทธ๋ฆฌ๊ธฐ (0) | 2024.04.15 |
Matplotlib) Pie (ํ์ด) ์ฐจํธ ๊ทธ๋ฆฌ๊ธฐ (0) | 2024.04.15 |
Matplotlib) Bar chart : countplot ์ฐจํธ ๊ทธ๋ฆฌ๊ธฐ (0) | 2024.04.15 |