Plotly7 Python 데이터 시각화 - 상관관계(correlation) 분석, Heatmap (with Matplotlib, seaborn ) 데이터 상관관계 시각화 Pandas dataframe 구조의 데이터를 사용하여 데이터 간의 상관관계(correlation)를 확인해보고 이를 Heatmap으로 시각화하여 표현해보자. 샘플데이터는 Plotly에서 제공하는 샘플 데이터를 사용하도록 한다. 상관관계 분석(Correlation Analysis) 상관관계 분석은 두 개이상의 변수 사이에 존재하는 상호 연관성 존재와 그 강도를 측정하는 방법이다. 개발환경 - Pandas 3.9.0 - Jupyter-lab 3.0 - Plotly 4.14.3 - matplotlib 3.2.2 - seaborn 0.11.1 임포트 라이브러리 # Data import numpy as np import pandas as pd # Visualization import ma.. 2021. 3. 30. Python 데이터 시각화, 국내 시.도별 코로나 19 확진 정보 - 공간정보 ( 단계구분도 - plotly choropleth map ) 국내 코로나19 정보를 Plotly의 공간정보 표현 API인 Choropleth map API를 사용하여 공간정보를 표시해본다. 데이터는 이전 블로그에서 사용한 sorted_df 를 사용할 것이므로 미리 준비하도록 하자. 2021.03.15 - [데이터 시각화] - 국내 시.도별 코로나19 확진자 발생 현황 데이터 시각화( 공공데이터포탈 Open API ) 다음으로 공간정보의 이해를 위해 아래내용들을 숙지하길 바란다. 1. 지리정보시스템, GIS ( Geographic Information System ) 일반 지도와 같은 지형정보와 함께 지하시설물 등 관련 정보를 인공위성으로 수집, 컴퓨터로 작성해 검색, 분석할 수 있도록 한 복합적인 지리정보시스템이다. 국토계획 및 도시계획, 수자원관리, 통신 · 교.. 2021. 3. 18. 공공데이터포탈 Open API 활용법 - 국내 시.도별 코로나19 확진자 발생 현황 데이터 시각화 ( Python, Pandas, Plotly ) 공공데이터포탈 Open API 활용 국내 시.도별 코로나19 확진자 발생 현황 데이터 시각화 공공데이터포털은 국내 각 기관이 다루는 데이터를 통합하여 사용하기 편리하게 제공하는 포털사이트이다. 코로나19(COVID-19)와 관련한 데이터도 제공한다. 이번 블로그에서는 국내 코로나19 현황 데이터를 사용하여 일별 국내 총 확진자 추이, 국내 시.도별 확진자 추이 정보를 시각화 라이브러리, Plotly를 사용하여 차트로 표현해 본다. 배워 볼 것 - 공공데이터포털 OpenAPI 사용방법 - 데이터 전처리 - 데이터 시각화 ( Bar, Pie, Map(공간정보) ) 개발 환경 - Python 3.9 - Pandas 1.2.0 - plotly 4.14.3 - requests 2.25.1 - beautifulso.. 2021. 3. 15. 1. Python 주식 일간 변동률 계산 - ( 삼성전자 vs 애플 시각화 비교 ) 일간변동률은 주식간의 주가변화를 상대적으로 비교하기 용이한 척도다. 국내 주식과 해외 주식간에 주식변화 추이를 비교하는 경우 통화에 차이가 있기 때문에 단순 종가로는 비교하는 것은 무의미하다. 변동률을 구한 뒤 누적합계를 구하여 비교하면 유의미한 결과를 얻을 수 있다. 본 블로그에서는 샘플DataFrame을 사용하여 일간변동률, 누적합계를 쉽게 이해해보고 뒤에서 삼성전자와 애플의 일간변동율 변화를 시각화하여 비교해 보도록 한다. 일간변동률 주가의 변화를 상대적으로 비교하기 위해 일간변동률을 사용한다. 식은 아래와 같다. Python 예제 ( python version 3.9 ) 가상의 주식데이터 생성 import pandas as pd # 가상의 주식 데이터 10일치 생성 close_data = [100.. 2021. 2. 16. 이전 1 2 다음