mpg데이터의 cty와 hwy간의 어떤 관계가 있는지 알아보려고 합니다.
x축은 cty, y축은 hwy로 된 산점도를 만들어 보세요.
import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltmpg=pd.read_csv('data/mpg.csv')mpg.head()
manufacturer
model
displ
year
cyl
trans
drv
cty
hwy
fl
category
0
audi
a4
1.8
1999
4
auto(l5)
f
18
29
p
compact
1
audi
a4
1.8
1999
4
manual(m5)
f
21
29
p
compact
2
audi
a4
2.0
2008
4
manual(m6)
f
20
31
p
compact
3
audi
a4
2.0
2008
4
auto(av)
f
21
30
p
compact
4
audi
a4
2.8
1999
6
auto(l5)
f
16
26
p
compact
sns.scatterplot(mpg, x="cty",y="hwy")plt.show()
Q2
미국의 지역별 인구통계 정보를 담은 midwest.csv 를 이용해 전체 인구와 아시아인
인구 간에 어떤 관계가 있는지 알아보려고 합니다. x축은 poptotal, y축은 popasian으로 된
산점도를 만들어 보세요. 전체 인구는 50만 명 이하, 아시아인 인구는 1만 면 이하인 지역만
산점도에 표시되게 설정하세요.
자동차 중에 어떤 category가 많은지 알아보려고 합니다. sns.barplot() 을 이용해 자동차 종류별 빈도를 표현한 막대그래프를 만들어 보세요. 막대는 빈도가 높은 순으로 정렬하세요.
plt.clf()mpg_c=mpg.groupby('category')['category'].count().sort_values(ascending=False)sns.barplot(mpg_c).set(ylim=[0,100])plt.xticks(rotation=45)plt.title("Frequency barplot by category")plt.show()