728x90
반응형

1. titanic 데이터

titanic = sns.load_dataset('titanic')
sns.histplot(data= titanic , x='age' ) # 히스토그램은 수치형 데이터의 구간별 빈도수

히스토그램

sns.histplot(data= titanic , x='age' , bins = 10 )

히스토그램 개수 10개

sns.histplot(data= titanic , x='age' , hue = 'alive') # 범주별로 구분 데이터

==> hue = 'alive' ==> 범주형 데이터 추가

범주형 데이터 구분 히스토그램

sns.histplot(data= titanic , x='age'  , hue = 'alive' , multiple= 'stack') # 생존자 누적 그래프

==> multiple = 'stack' ==> 누적 그래프 출력

범주형 누적 데이터 구분 히스토그램

sns.kdeplot(data = titanic , x ='age') # 커널밀도추정 함수 그래프(히스토그램을 매끄럽게 곡선으로 연결한 그래프)

==> 히스토그램을 곡선으로 연결한 그래프

커널밀도추정 함수 그래프

sns.kdeplot(data = titanic , x ='age' , hue = 'alive' , multiple ='stack') # 누적 커널밀도추정 함수 그래프

누적 커널밀도추정 함수 그래프

sns.displot(data=titanic , x = 'age') # 분포도 : 수치형 데이터 하나의 분포를 나타내는 그래프

displot 수치형 데이터의 분포

sns.displot(data=titanic , x='age' , kind = 'kde')

displot 수치형 데이터의 분포

sns.kdeplot(data=titanic , x='age')
sns.rugplot(data=titanic , x='age') # 러그플롯은 주변 분포를 나타내는 그래프

rugplot 주변분포 나타낸다.

sns.barplot(x='class' , y='fare', data=titanic) # x축에 범주형 데이터, y축에 수치형 데이터

==> feature 2개 넣어야한다. x축에 범주형 데이터 , y축에 수치형 데이터

barplot

sns.countplot(y='class' , data= titanic)

# barplot은 범주형 데이터 , 수치형 데이터 2개의 피처
# countplot은 범주형 데이터 하나만 받는다.

countplot()

sns.regplot(x='total_bill' , y ='tip' , data= tips) # regplot()은 선형 회귀선을 동시에 그려주는 함수이다.

==> regplot()은 선형 회귀선을 동시에 그려주는 함수

regplot의 선형회귀선

sns.regplot(x='total_bill' , y ='tip' ,ci = 99 , data= tips) # 신뢰구간 99%에 대한 regplot()은 선형 회귀선을 동시에 그려주는 함수이다.

신뢰구간 99%의 선형회귀선 범위

출처 : 머신러닝·딥러닝 문제해결 전략

(Golden Rabbit , 저자 : 신백균)

※혼자 공부용

728x90
반응형

+ Recent posts