#01_2 [python] pandas & matplotlib 을 이용한 데이터 가공 / 시각화

2022. 1. 21. 18:31개발의 흔적/데이터분석

#서울특별시 인구통계 data --------> 날짜별 강남구 유동인구수를 시각화 

04월 서울특별시 인구통계조사 csv파일을 pandas 라이브러리를 이용해 불러온 모습

 

우선 matplotlib 라이브러리를 이용해 각 구별 유동인구수를 시각화

--> 강남구의 유동인구수가 가장 많다

 

강남구의 유동인구수만 알아 볼 것이기에 '군구' column의 강남구만 선택

그 후 '일자'별로 그룹화해서 유동인구수만 데이터를 추출

 

그결과 일자 column이 index가 되었고, 냔도/월/일 이 표현됨

 

 

이를 꺾은선 그래프로 나타낼시에, x축 각 일자에 들어가는 글자량이 많아서 

함수를 이용해 시각화 가공 

(ex. 20200412 -> 0412)

dat 리스트에 2020xxxx에서 20200000을 뺀 값을 String으로 저장 (기존 data에 int값으로 저장되었기에 str()처리 해줘야함)

 

그후 plt.plot의 x축에 이 리스트를 삽입