우리나라 자살 통계 관련 그래프 시각화 정보 디자인

트위터에 https://twitter.com/#!/Imseong/status/173247933515431937 이런 트윗을 올렸습니다. 이 글은 그 관련 작업을 정리해본 글입니다. 

1. 시작은 통계청의 2011년 청소년 통계(링크)였습니다. 7-8쪽에 보면 아래와 같은 얘기들이 있거든요. 

이런 얘기도 있었고요.
2. 저 표로는 뭔가 와닿지 않았고, 뒤의 표에서 15-19세를 따로 떼어서 보고 싶었는데, 앞의 표에는 15-24세로 묶여 있어서 직접 보기가 어렵다...라는 것에서 모든 일이 시작됐습니다.

그래서 앞의 표의 원자료인 통계청의 사망원인통계를 찾아보기로 했습니다. 통계청 자료는 은근히 괜찮은데, 별도 url이 안 된다는 게 너무 안 좋네요. 아래 화면처럼 해당 사이트(http://kosis.kr/metatdata)에 가서 통합 검색에서 '사망원인' 검색하면 나옵니다.

위의 링크를 누르면 아래 화면이 뜨고 
이 화면의 중간쯤에 버튼 'KOSIS 바로가기'를 누르면 아래 같은 창이 뜹니다.
여기에서 궁금한 건 '사망원인: 연령(5세)별 사망자수, 사망률'이니까, 위에서 세번째 줄을 클릭하면,
드디어, 원자료 등장. 이제는 조회 기간과 조회 범위 설정을 통해 원하는 자료를 뽑아내는 과정이 남았습니다.

시스템이 잘 되어 있어서 자료 필터링을 꽤 쉽게 해낼 수 있습니다.
  
3. 원래 원하던 청소년의 사망 원인 통계는 연도별로 찾아냈는데(이건 별도로 시각화했는데, 이건 다음 기회에 공개), 그러고 나니 '어, 이거 뭔가 우리나라 전체로 봐도 뭔가 나올 것 같은데?'하는 생각이 들기 시작합니다. 

이렇게 저렇게 자료를 뽑아보다가, '지난 10년간 연령대별 자살 수와 자살률'을 찾아보자고 생각합니다. 사망원인에 '고의적 자해(자살)'만 넣고, 연령대는 1-4세부터 80세 이상까지 5세 간격으로 모두 넣고, 사망자수와 사망률을 넣고, 조회기간은 1991년부터 2010년으로 설정. 자료를 뽑습니다.

4. 그래프로 그려야 하니까, 스프레드시트로 옮겨봅니다. 그래서 표로 옮긴 것이 이 문서(링크)입니다.
5. 이제야 자료가 갖춰졌네요. 넘버스에서 꺾은 선 차트로 그려봅니다.

뭔가 경향은 보이지만, 이대로는 알아보기 어렵습니다. 저 온갖 색깔의 선을 아래 범례에서 보면서 따라갈 수는 없거든요. 

6. 선의 색깔에 대해 고민하다가, 선의 색깔만 보고도 연령대를 짐작할 수 있게 해보자고 생각합니다. 어린이는 노란색, 청소년은 녹색, 청년은 파란색, 장년은 붉은색, 노년은 회색이면 나름대로 직관적인 색깔일 거라고 생각하고, 색을 바꿔봅니다. 

실제로 칠하다 보니 그 중간색을 잡기가 애매한 부분이 많아서, 생각만큼 잘 나오진 않았습니다만, 그래도 연령대를 그럭저럭 파악할 수 있게 됐습니다. 이미 이 자살률 그래프에서도 나이가 어릴 수록 자살률이 낮고, 높을 수록 자살률이 높다는 것은 꽤 잘 나타납니다. 회색의 노년층 자살률이 2001년 이후 굉장히 높아진 것이 보이고, 61-64세와 거의 동일하던 65-69세(흐릿한 붉은색)의 자살률이 2003년을 기점으로 확 높아진 것이 보입니다. 그리고 25-29세(밝은 파란색)의 자살률이 2007년을 기점으로 상위 연령층인 30-34세, 34-39세보다 높아진 이상 현상도 볼 수 있습니다.

7. 이제 키노트로 가서, 자잘한 것들을 처리합니다.

(1) 그래프의 데이터 표시점인 'ㅇ'는 그래프를 복잡하게 만들기 때문에 삭제
(2) 아래에 따로 있던 범례를 각 그래프의 오른쪽에 붙이고, 해당 연령대의 글씨를 해당 연령대의 색깔로 변경
(3) 전체 가로/세로 비율 조정
(4) Y축 최대값, 눈금 간격 조정
(5) 각 연도의 자료를 비교할 수 있도록 X축에 그리드라인 삽입
(6) 차트 제목 붙이고
(7) 출처 표시

자살률 그래프와 자살 수 그래프 둘 모두 동일하게 처리하고, 전체 그래프의 크기도 맞춰줍니다.

8. 완성. 해석은 각자가 하시면 될 것 같습니다.


9. 뒷얘기

(1) 사실 자살 변동 그래프부터 만들고, 그 다음에 자살률 그래프를 만들었는데, 그래서인지 둘의 색 진하기가 조금씩 다르군요. 그냥 패스...

(2) 각 연도에서 연령대별 상대비율을 따져서 버블 그래프로 만들거나, 히트맵을 써봐도 뭔가 새로운 시각을 얻을 수 있을 것 같은데요. 일단은 저는 이 정도까지 하렵니다. 관심 있으시거나, 더 좋은 방법 있으신 분들은 중간에 있는 원자료 이용하셔서 만들어주시면 될 것 같아요. 

 

핑백

  • OO 디자인 공부합니다. : 블로그 첫 페이지 2012-11-13 00:12:48 #

    ... 이션 연구모임) * 게임과 플랫폼- 달리는 플랫폼에 올라타기: 페이스북을 중심으로 (2012년 4월@소셜 게임 파티) * 통계로 보는 사회- 우리나라 자살 통계 관련 그래프 시각화 (2012년 2월) * 스타트업 문화- [번역] 쉐릴 샌드버그, 2012년 하바드 비지니스 스쿨 졸업 축사 (2012년 6월) 이 글 ... more

  • 연령대별 자살 통계 그래프 1991-2011 | OO 디자인 공부합니다 2013-06-16 01:47:02 #

    ... 통계 그래프 1991-2011 기존 블로그에 올려뒀던 자살 통계 그래프에 2011년 자료를 추가했습니다. (2012년 자료는 아직 발표되지 않았습니다.) 먼저 자살률입니다. 그전에 비해 노년층의 자살률이 일부 연령 ... more

덧글

  • 아무것도없어서죄송 2012/02/25 15:06 # 답글

    2001년과 2002년 사이에 폭발적으로 증가하는군요 ㅠㅜ
  • Imseong 2012/02/26 00:23 #

    네. 보통 우리나라가 2001년부터 질적으로 변했다...고들 하던데, 그런 단면을 보여주는 것 같아요.
  • 불타지않는뿔 2012/02/25 15:37 # 답글

    와 뭐야 이거.
  • Imseong 2012/02/26 00:24 #

    네. 숫자라고 해도 사람이라서, 실제로 보고 있으면 무섭죠...
  • net진보 2012/02/25 17:10 # 답글

    경제활동인가의 자살률이 대선 전후 마다 급격히 증가하는군....
  • Imseong 2012/02/26 00:25 #

    네. 정치적인 영향도 있을 테고.. 경제 쪽의 지수들과 좀 더 상관관계가 높을 것 같아요. 소득 분배 지수라던가, 아니면 특정 경제 정책의 시행 시점과 맞춰보는 것도 의미가 있을 거에요.
  • 저녁 달빛 2012/02/25 21:11 # 답글

    코스피와 비교해도 괜찮습니다.
    자살이 급격히 늘은 기간은
    코스피가 급락하는 기간과 일치 하는 [경향]이 있습니다.
  • Imseong 2012/02/26 00:27 #

    네. 둘 사이에는 어느 정도 상관 관계가 있을 거에요. 우리나라에서의 자살은 경제적 어려움에서 비롯된 게 많을 테니까요. 근근히 버티다가, 외부에서 커다란 경제적 충격이 오면, 휙 떨려나가게 되고, 그 시점에서 사회적 안전망 밖으로 밀려나면, 현시점에서는 정말 어려운 것 같습니다.
  • 노찬 2012/05/29 19:19 # 삭제 답글

    와우ㅠㅠ 자료 정말 세심하고 깔끔하게 정리하셨네요!!
    학교 수행평가 자료로 도표를 이용해도 될까요?
  • Imseong 2012/05/30 10:46 #

    네. 어차피 원래 자료가 공개 자료인 걸요. 편하게 쓰세요.
  • simjiwell 2012/10/02 11:15 # 삭제 답글

    정확한 자살통계 및 추이가 궁금했는데, 올려주신 자료를 보고 많은 공부가 되었습니다.
    강임성님의 열정과 노력에 찬사를 보냅니다.
    매우 감사합니다.
  • shadowpalm 2012/11/30 00:58 # 삭제 답글

    제가 이 자료좀 써도 괜찮을까요? 정말 정리 잘해두셨네요 ^^
  • 잔인한오후 2013/05/15 17:37 # 삭제 답글

    하단 링크에서 도표를 이용하였습니다. 좋은 자료 만들어주셔서 감사합니다.
    http://djuna.cine21.com/xe/board/5950112
  • 2016/05/30 00:58 # 삭제 답글 비공개

    비공개 덧글입니다.
댓글 입력 영역

Analytics