데이터분석
상권별 업종 밀집 통계 데이터
아리벱
2024. 5. 31. 12:22
이번에는 상권별 업종 밀집 통계 데이터를 지금까지 배운 pandas, numpy, matplotlib을 활용해보겠습니다.
데이터 시각화할 떄 많이 사용하는 seaborn 라이브러리를 소개하고자 합니다.
seaborn
- 데이터를 시각화하는 데 사용하는 라이브러리
- Matplotlib을 기반으로 더 쉽고, 통계적으로 유의미한 그래프를 그릴 수 있도록 다양한 기능을 제공
- 데이터 분석 및 데이터 사이언스 프로젝트에서 자주 사용
- seaborn 공식 홈페이지 https://seaborn.pydata.org/
seaborn: statistical data visualization — seaborn 0.13.2 documentation
seaborn: statistical data visualization
seaborn.pydata.org
여러 상권업종중 '학문/교육' 분야만 추출해서 분포를 확인하고 싶을 때는 다음과 같이 코드 작성할 수 있습니다.
'학문/교육' 분야 중 '학원-컴퓨터' 부분을 추출해서 분포 확인할 때에는 다음과 같습니다.
산점도로 분포를 확인할 수 있습니다.
이번에는 지도 위의 데이터 시각화를 할 때에 사용하는 folium 라이브러리에 대해 알아보겠습니다.
folium
- leaflet.js 기반으로 만들어진 지도위 데이터를 표현해주는 대표적인 파이썬 시각화 라이브러리
- folium 공식 홈페이지https://python-visualization.github.io/folium
Redirecting to latest Folium documentation
python-visualization.github.io
예제를 풀어보겠습니다.
문제 1
- shop_seoul_edu_computer 데이터프레임에 있는 모든 데이터를 지도에 표기
- 단, 일반 마커로 표기하며 클릭하면 "상호명-주소" 형태의 팝업을 보여줌
문제2
- 상권업종중분류명이 '커피점/카페'인 데이터 중 '구군'이 '강남구'인 데이터만 지도에 표기
- 단, 일반 마커로 표기하며 클릭하면 "상호명-주소" 형태의 팝업을 보여줌