R을 이용해 공동주택 가격에 대한 통계분석을 시도해보았습니다.
이번 게시물에서는
1. 공동주택에 대한 설명
2. 사용한 데이터에 대한 소개
3. 데이터 전처리
4. EDA
5. 가격의 통계분석
6. 교차분석
7. 추가상관분석 & 회귀분석
에 대해 다뤄보겠습니다.
1. 공동주택이란?
- 건축물의 벽 · 복도 · 계단이나 그 밖의 설비 등의 전부 또는 일부를 공동으로 사용하는 각 세대가 하나의 건축물 안에서 각각 독립된 주거생활을 할 수 있는 구조로 된 주택
- 「건축법」에서는 공동주택의 종류와 범위를 아파트, 연립주택, 다세대주택 및 기숙사로 규정하고 있다.
① 아파트 : 주택으로 쓰는 층수가 5개 층 이상인 주택
② 연립주택, 다세대주택 : 주택으로 쓰는 1개 동의 바닥면적 합계가 660m2를 초과하고, 층수가 4개 층 이하인 주택
③ 기숙사 : 학교 또는 공장 등의 학생 또는 종업원 등을 위하여 쓰는 것으로서 1개 동의 공동취사시설 이용 세대 수가 전체의 50% 이상인 것(학생복지주택 포함)
- 「주택법」에서는 공동주택을 건축물의 벽 · 복도 · 계단이나 그 밖의 설비 등의 전부 또는 일부를 공동으로 사용하는 각 세대가 하나의 건축물 안에서 각각 독립된 주거생활을 할 수 있는 구조로 된 주택으로 정의하고, 그 종류와 범위는 「건축법」에 의한 아파트, 연립주택 및 다세대주택의 규정에 따르고 있다.
출처 : [네이버 지식백과] 공동주택 (토지이용 용어사전)
- 주택 유형별 주거 비율을 살펴보았을 때, 공동주택에 해당하는 주택 유형이 약 74% 정도
- 따라서 공동주택이 상당한 양의 국내 주택을 이루고 있으므로, 공동주택 가격 데이터만 살피더라도 유의미한 주택 가격 통계 자료로 사용할 수 있을 것이라 생각함
2. 사용한 데이터 소개
- 괄호 안은 임의로 부여한 파일명
- 총 4개의 데이터를 사용했으나, 주된 분석은 gongdong과 gongdong_price, gongdong_price2 자료만 가지고 진행
>> 사용 데이터 파일은 다음 링크를 통해 다운 받으실 수 있습니다.
https://drive.google.com/file/d/1DzOminjLAGnGlEPIj7RkbtYG_U3VMO3y/view?usp=sharing
데이터의 형태, 데이터 살펴보기
- 'K-ICT빅데이터센터'에 업로드 된 '공간과 가치'가 제공하는 공동주택 관련 데이터
- 위치정보가 주된 정보이고, 주택 구분과 건축년도를 알 수 있음
- 'K-ICT빅데이터센터'에 업로드 된 '공간과 가치'가 제공하는 공동주택 관련 데이터
- 주택의 가격과 평수를 알 수 있음
- 앞의 자료와 연결되는, 공통된 '고유코드', '공동주택명' 필드를 가지고 있음
- 지역별 연령별 인구수가 담긴 데이터
- 출처 : 통계청
- 지역별 부동산임대업 소상공인의 수를 알 수 있는 데이터
- 출처 : K-ICT빅데이터센터
데이터 사용 방향
- 'gongdong' 데이터에서 위치 및 지역정보를 얻고, 'gongdong_price' 데이터에서 가격정보를 얻는다
- 두 데이터는 공통된 칼럼('고유코드')으로 조인하여 사용한다.
- 'gongdong'과 'gongdong_price' 데이터를 '고유코드'로 결합하여 사용한다.
- 공동주택 가격을 결정하는 요소를 찾기 위해 가격과 여러 변수들의 상관관계를 분석한다.
( 가격 & 평수, 위치, 주택형태 등)
>> 다음 게시물
'R 과 데이터분석 > [활용] 공동주택 가격 분석' 카테고리의 다른 글
[R 데이터분석] 공동주택 가격현황분석 - (5) 상관, 회귀분석 (0) | 2019.11.28 |
---|---|
[R 데이터분석] 공동주택 가격현황분석 - (4) 교차분석 (0) | 2019.11.28 |
[R 데이터분석] 공동주택 가격현황분석 - (3) EDA 및 통계분석 (0) | 2019.11.28 |
[R 데이터분석] 공동주택 가격현황분석 - (2) 데이터 전처리 (0) | 2019.11.28 |
댓글