한글 주소 체계
주소를 통해 데이터를 정제하고 리포팅해야할 일이 있어서 정리.
새로운 발견을 하면 지속 업데이트할 예정.
법정동? 행정동?
- 정의 (출처: 서울시홈페이지)
- 법정동 : 옛부터 전래되어온 동명으로 개인의 권리·의무 및 법률행위시 주소로 사용되는 동명칭
- 행정동 : 주민의 편의와 행정능률을 위하여 적정한 규모와 인구를 기준으로 동주민센터를 설치운영하는 동명칭
- 한 행정동에 여러 법정동이 묶여 있을 수도 있고, 한 법정동이 여러 행정동으로 나뉘기도 한다.
- 행정동 명칭인 수원시 팔달구 '행궁동' 안에는 무려 12개의 법정동이 있다. 반대로 법정동 명칭인 수원시 영통구 매탄동은 4개의 행정동으로 나뉘어 있다. (출처)
- 법정동은 인구수나 면적에 비례하지 않는 경우가 많다
- 법정동에는 서울 시청 건물의 절반 크기 밖에 안되는 곳이 있다. (대구 중구 상덕동)
- 법적인 모든 문서에는 법정동을 쓰는 것이 원칙
- 지번주소, 도로명 주소의 마지막 괄호 안 등 주소
- 등기문서 등
분석 용도에 따른 기준
보통 우리가 말하는 읍면동은 '행정동'을 지칭.
- 인구, 면적 비례에 따른 분석이 필요하다 → 행정동
- 변하지 않는 기준을 잡아 관리하고 싶다 → 법정동
법정동 | 행정동 |
---|---|
법적으로 정의 | 주민센터 단위 |
동리 | 읍면동 |
거의 변하지 않는다 | 인구의 변동 등 행정상 편의에 따라 변한다 |
2만개 (리단위까지) 5천개 (읍면동단위) | 3~4천개 |
행정동, 법정동 매핑
- 우편번호 : 우편번호 DB 다운로드
- 도로명 주소 : 도로명주소 DB
현재 제공되는 행정동 정보는 관할주민센터 정보를 기준으로 하고있으며
juso.go.kr 문의게시판
도로명주소와 1:1로 매칭되는 정보만 포함합니다.
따라서 행정동 정보가 제공되지 않는 건물이 존재할 수 있으므로
행정동 정보는 참고용으로만 사용하시기 바랍니다.
- 행정동, 법정동 매핑 테이블 및 변경이력 행정안전부
多 대 多 가 존재해서 읍면동 단위만 가지고는 100% 매핑은 불가함
ex. 서울 중구 남대문로3가 → 소공동 or 회현동- 법정동 코드 (10자리) : 시도(2)+시군구(3)+읍면동(3)+리(2)
- 행정동 코드 (10자리) : 시도(2)+시군구(3)+읍면동(3)+리(2)
세종시는 '구' 구분이 없음에 유의
기본 통계
- 인구수 : 행정동 기준 행정구역(읍면동)별/5세별 주민등록인구(2011년~)
- 면적 : 지자체별로 따로 데이터가 존재
- 전체 데이터는 pdf 파일로만 존재 행정안전부 2019 지방자치단체 행정구역 및 인구현황
- 데이터로 정리된 파일은 없는 것으로 보임 (공공데이터포털의 문의게시판
공간데이터를 이용해서 간단히 면적 구하기
- 데이터 소스 : 아래 중 하나를 골라 shp 파일은 다운받으면 된다. (동일한 것으로 보임).
- 행정동은 변동이 심해 법정동 기준으로만 공개.
- 파이썬의 경우 geopandas 패키지를 통해서 shp 파일을 로드한 후 .area 로 간단히 구할 수 있음
- 대한민국 행정동 경계 : 사용법은 github 참고 (https://github.com/vuski/admdongkor)
주소 정리
지번, 도로명 주소 체계
텍스트 파싱 방법
주소변환가이드.pdf
[]
- 하지만 다양한, 오류가 있음
주소 입력 오류 예시
- 도로명 주소 (괄호)로 동 추출 때 고려점 : (주)
2010년 민간부문 주소DB 전환 가이드 에 여러가지 유형이 나와 있음
- 법정동이 아닌 행정동 사용 : 원래 주소에는 행정동이 아닌 법정동으로 표기하여야 하나, 행정동으로 표시
- 지번주소와 도로명 주소 중복 사용 : 서울 서초구 서초동 우먼로 100 서울중앙지방법원 종합민원실
- 주소의 지번표기가 지번형식과 다른 경우 : 제주 제주 용담이동 338398
- 주소에 행정지역과 건물명으로 표현한 경우(지번 누락) : 서울 서초구 반포동 강남지하상가 가 4-1호
- 주소의 건물명이 중복되어 표현된 경우 : 서울 서초구 반포1동 삼호가든 삼호가든22차아파트 차아파트 1~11 1~11동 동 삼호가든 삼호가든44차 차 라동 라동 802호
Discussion