-
[Python] 지역별 부동산 데이터 시각화Programming 2022. 10. 7. 12:46
오늘은 지난 번에 수집한 KB 부동산 데이터를 바탕을 시각화를 해보려 한다.
KB 부동산 - 데이터 허브 에 들어가면 주택매매가격지수, 주택전세가격지수 데이터가 있다.
분석에 앞서 여기서 말하는 가격지수가 실제 거래 금액이 아닌 지수화한 값이라는 것을 알고 넘어가자.
[ 주택 매매/전세 가격지수란? ]
정확하게 어떤 산식을 통해 지수화하는 것인지 찾지 못했지만,
현 시점의 가격 데이터를 100으로 두고 나머지 기간의 가격 데이터를 0~100 사이 값으로 환산한 값인 듯하다.
(Relative frequency 개념으로 이해하면 될 듯)
[ 가격지수 Plotting ]
Plotting 에 앞서 데이터가 어떻게 생겼는지 먼저 살펴보자.
아래 표는 주택전세가격지수 데이터 예시이다. (주택매매가격지수도 동일한 형태)
지난 번에 'KB 부동산 데이터 수집하기 (아래 링크 참고)' 편에서 수집한 데이터를 시각화하기에 편한 형태로 변형했다.
구글 스프레드 시트로 공유한 KB 부동산 데이터는 아래 표와 동일한 형태이다.
주택전세가격지수 예시 참고) KB 부동산 데이터 수집하기
[Python] KB 부동산 데이터 수집하기
하락장에는 공부하는 것이 진리!! 선배가 추천해준 '파이썬을 활용한 부동산 데이터 분석' 책을 사두고 꽤 오래 방치했었는데 다시 시작해보려한다. (하고 싶은 것과 해야할 것들... 너어어어무
thisiswhoiam.tistory.com
참고) KB 부동산 데이터 공유
[데이터 공유] KB부동산 데이터 (22.10.03)
지난 포스팅에서 KB부동산 데이터 허브를 크롤링하는 방법을 다뤘었다. KB부동산 데이터 허브는 다양한 데이터를 제공하고 있는데, 대표적으로 매매/전세가격지수가 있다. 그 외에도 소득을 연
thisiswhoiam.tistory.com
데이터가 어떻게 생겼는지 살펴봤으니, 이제 본격적으로 plotting 을 해보자.
가로축은 시간, 세로축은 가격지수로 그래프를 그리면, 시간에 따른 가격지수 변화를 볼 수 있다.
Plotting 을 위한 코드는 아래와 같다.
import pandas as pd import numpy as np from datetime import datetime # 시각화 import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline # 한글 깨질 때 설정 (Mac) plt.rc("font", family = "AppleGothic") sns.set(font="AppleGothic") # dataframe 이름 # total_sales_price: 주택매매가격지수 # total_rent_price: 주택전세가격지수 def conditional_plotting_(date_info_str, region_info): imf = datetime.strptime('1997-12-01', "%Y-%m-%d") #1997년 subprime = datetime.strptime('2008-01-01', "%Y-%m-%d") #2008년 # plot 시작 시점 설정 date_info = datetime.strptime(date_info_str, "%Y-%m-%d") sales_data = total_sales_price[total_sales_price['date'] > date_info] rent_data = total_rent_price[total_rent_price['date'] > date_info] plt.figure(figsize=(11, 5)) # 전 기간 plt.subplot(1, 2, 1) plt.plot(total_sales_price['date'], total_sales_price[region_info], label='매매') plt.plot(total_rent_price['date'], total_rent_price[region_info], label='전세') plt.title('주택매매가격 ({})'.format(region_info)) plt.axvline(imf, color = 'gray', label = 'IMF (1997)', linestyle='dashed') plt.axvline(subprime, color = 'gray', label = '금융위기 (2008)', linestyle='dashed') plt.xticks(rotation=45) plt.legend() # 2008 년 이후 plt.subplot(1, 2, 2) plt.plot(sales_data['date'], sales_data[region_info], label='매매') plt.plot(rent_data['date'], rent_data[region_info], label='전세') plt.axvline(subprime, color = 'gray', label = '금융위기 (2008)', linestyle='dashed') plt.xticks(rotation=45) plt.title('주택매매가격 ({}) / {} ~ 현재'.format(region_info, date_info_str)) plt.legend() plt.show() # 실제 plot 생성 for col in list(total_sales_price.columns): if col != '지역_date': conditional_plotting_('2005-01-01', col)
위의 코드로 plotting 된 결과를 살펴보고, 그 중에서 유사한 패턴을 가지는 지역별로 모아봤다.
처음에는 서울, 광역시, 그 외 지방으로 나누어서 살펴보았는데, 인천의 경우는 수도권에 가까운 광역시라 그런지 수도권 패턴을 따라가는 걸 알 수 있었다.
특히 2005 년 이후에는 서울, 경기, 수도권, 인천의 매매/전세 가격지수의 흐름이 굉장히 유사한 걸 알 수 있다.
***** 아래 plot 들의 label 이 바뀜ㅠㅠㅠㅠ (전세 > 매매 / 매매 > 전세) 로 봐주시면 됩니다.
서울/수도권 가격지수 패턴 그리고 지방 광역시의 경우에는 또 다른 패턴을 보인다.
우선 대전을 먼저 살펴보면, 대전은 다른 지방 광역시의 패턴과 수도권의 패턴이 섞여있는 것처럼 보인다.
2014-2020년 사이의 패턴에서는 전세와 매매 가격지수 간의 갭이 크게 벌어지는 것을 확인할 수 있고, 2020년 이후에는 그 갭이 급속하게 매꿔지는 것을 볼 수 있다. 이는 대표적인 수도권의 특징이라고 볼 만하다.
그 외 대구, 부산, 광주는 동일 기간(2014-2020)에 전세가와 매매가 사이의 갭이 거의 균등하게 움직이는 것으로 보여진다.
(2020년 이후에 전세가와 매매가가 급등하는 건 지역 불문하고 공통된 패턴으로 판단됨)
광역시 주택가격지수 패턴 광역시 중 울산이 조금 다른 패턴을 보이는데, 전세와 매매 갭이 크지 않았고 다른 광역시와는 다르게 2018년을 기점으로 2020년까지 지수가 팍 떨어졌다가 급증하는 패턴이다.
조금 더 찾아봐야겠지만, 2018년이라면 울산 지역 경제에 많은 영향을 미치는 중공업의 수주 부진으로 한동안 울산 경기가 침체되었던 시점이다.
이런 동일한 패턴은 다른 지방에서도 나타났다.
경북/경남 지역과 충북/충남 지역, 강원도에서 울산과 유사한 패턴이 보이는 것을 알 수 있다.
전북/전남 지역은 또 다른 패턴을 보이는데 2018년에 하락폭이 그렇게 크지 않은 것이 특징이다.
기타 지방 가격지수 패턴
[ 요약 ]
위에서 살펴본 내용들을 요약해보자.
* 여기서 해석에 유념해야할 부분!!!
- 위에서 언급한 것처럼 사용된 데이터는 실제 전세가와 매매가가 아니고, 지수화된 값이므로 증감률 정도로 받아들이는 것이 더 정확할 듯 하다.
- 전세/매매 모두 지수가 현 시점을 100 으로 두고 가격을 상대적으로 지수화한 것이기에 데이터를 뽑은 시점에 따라 결과가 달라질 수 있다.
- 그래프 상에서도 현 시점의 전세/매매 가격지수가 만나는 것을 볼 수 있듯이, 이 그래프들은 전세가격/매매가격 차이의 갭을 절대적으로 반영한 값들은 아니다.1) 패턴 유사성
- 서울 / 수도권 / 경기 / 인천의 가격지수 패턴이 유사
- 4개 광역시(대전, 대구, 부산, 광주) 의 가격지수 패턴이 유사
- 울산광역시는 오히려 다른 지방의 가격지수 패턴과 유사
2) 전세/매매 가격 폭
- 수도권의 경우, 2014-2020년 사이에 매매가가 전세가를 훨씬 웃도는 패턴이 나타남
- 광역시 중에서는 대전, 부산, 광주에서도 2012-2020년 사이에 동일한 패턴이 나타남
- 광역시를 포함한 지방의 경우, 2018-2020년 사이에 큰 폭으로 가격이 하락함 (전북/전남 제외)
- 대체적으로 지방은 전세가와 매매가 사이의 폭이 그렇게 크지 않음
여기서 몇 가지 더 살펴보고 싶은 것이 있다.
우선은 매매가가 전세가를 웃도는 현상이 나타났을 때를 투자 수요가 붙은 것이라고 생각하면,
일부 광역시(대전, 부산, 광주)에서 수도권보다 더 일찍 투자 수요가 나타난 것이 아니냐는 생각을 해볼 수 있다.
그리고 하락이 발생했을 때, 최대 하락폭이 어느 정도인지 살펴보면 현재 하락장에서는 어느 정도의 하락을 염두해둘 수 있는지도 살펴볼만 하다.
(개인적으로 현재 조정장보다는 하락장이라고 생각함)
가격지수 외에도 다른 지표들을 가지고 함께 분석하면 조금 더 세밀하게 분석해볼 수 있을 것 같다.
어떤 지표를 사용해볼지 고민해본 후, 다음 포스팅 주제로 삼아야겠다.
'Programming' 카테고리의 다른 글
[Python] Yahoo Finance 코드 업데이트 (22.3Q) (0) 2022.12.03 [Python] 네이버 부동산 매물 크롤링 (1) 2022.11.05 [Python] KB 부동산 데이터 수집하기 (4) 2022.10.03 [Python] 퀀트 투자 기법 적용 결과 (한국편) (1) 2022.09.17 [Python] naver finance 에서 원하는 정보 긁어오기 Part 2. (한국편) (0) 2022.09.15