[기고] 살아 있는 공약 개발을 위한 빅데이터 분석

  • 전채남 더아이엠씨 대표
  • |
  • 입력 2021-11-22 18:00
2021112201010008581.jpeg
전채남 더아이엠씨 대표

살아있는 공약 개발은 책상에서 머리로 공약을 만드는 것이 아니라 현장의 목소리를 모아서 집단지성으로 공약을 개발하는 것이다. 전문가, 청년, 시도민들의 생생한 목소리를 모으기 위해 직접 물어 보고 원천 데이터를 모아 분석하였다. 10년 후 이상적인 대구경북의 미래상과 이 미래상을 실현하기 위해 필요한 대선 공약에 대하여 질문하고 데이터를 수집하였다. 현장의 목소리를 잘 분석하는 방법이 데이터 편집과 입력의 과정을 거치지 않는 빅데이터 분석(Big Data Analsys)이다.


응답자의 텍스트 데이터는 개방형 질문(Open Question)에 대하여 자유롭게 응답한 문구(Document)로 제대로 분석하기 위해 텍스톰(TEXTOM)을 사용해 빅데이터 분석을 실시하였다. 빅데이터 분석은 생각나는 대로 기술한 거친 문장으로 부터 단어를 추출하여 현황을 확인하고 의미단어의 상관관계를 통해 가치를 추출하는 방법이다. 빅데이터의 핵심적 가치는 단어 빈도수(Term Frequency)를 통해 관심도를 확인하고 일정한 패턴을 찾을 수 있고 통찰력을 높일 수 있다는 점이다. 구체적으로는 응답자들의 자유로운 생각을 데이터화하여 빅데이터 분석 방법인 텍스트마이닝(Textming)과 시맨틱네트워크분석(Semantic Network Analysis)을 실시하였다.


텍스트마이닝을 먼저 실시한 것은 수집한 데이터가 텍스트이기 때문이다. 텍스트마이닝은 텍스트 데이터를 정제하고 전처리하여 데이터에서 의미가 있는 정보를 찾아내는 방법이다. 텍스트는 현실에 대한 사람들 인식을 글로 표현한 것으로 맥락적으로 이해하면 사람들의 관심과 인식, 태도 등을 읽을 수 있다. 그리고 데이터의 특성과 이슈에 대한 추이를 확인할 수 있다. 살아있는 공약 개발을 위해 응답자들이 대구경북 미래상과 이를 위한 대선 공약을 표출한 주요 단어들을 추출하고 빈도수(TF)와 응답자수를 고려한 빈도수(TF-IDF)를 확인하였다. TF와 TF-IDF 값이 높은 단어를 통해 대구경북의 미래상과 대선 공약의 범주를 추정할 수 있다.


다음으로 시맨틱네트워크분석(SNA)은 대상이나 주제에 대한 응답자의 의미망으로 텍스트마이닝을 통해 추출한 주요 단어들의 행렬(Matrics)로 연결 상태를 확인하여 의미의 구조를 찾아낸다. 먼저 전체 네트워크를 통해 네트워크의 특성을 파악하고 주요 단어들 중에서 중요도가 높은 단어를 찾아낸다. 대구경북 미래상과 대선 공약에서 중요도가 높은 단어가 무엇인지 확인하여 공약 개발을 위한 의미단어가 무엇인지 찾아낸다.


그 다음에는 담론분석을 통해 대구경북 미래상과 대선 공약 의미단어 네트워크에서 담론이 어떻게 형성되어 있는지 확인한다. 담론분석은 구조적 등위성으로 묶여 있는 단어들을 통해 담론을 추정하는 칸커(ConCor)분석을 실시하였다. ConCor분석은 단어들 간의 상관관계를 통해 구조적 등위성 분석을 하는 기술이다. 대선 공약의 큰 범주를 확인하는 좋은 방법이다. 예를 들어 일자리, 청년정책, 산업구조, 지역균형발전 등의 거대 담론을 확인할 수 있다.


빅데이터 분석을 통해 전문가, 청년, 시도민이 원하는 대구경북의 미래상을 확인하고 이를 실현하기 위한 대선 공약의 주요 범주들을 도출하였다. 기존 정책이나 발전 계획에 따라 현안 해결식 대선 공약을 개발하는 것이 아니라 다양한 계층의 현장의 집단지성으로 대구경북 미래상을 위한 공약을 개발하기 위한 노력이다. 살아있는 공약 개발은 대선을 실질적인 대구경북 발전의 계기로 활용할 수 있는 단초가 될 것이다. 

전채남<더아이엠씨 대표> 

영남일보(www.yeongnam.com), 무단전재 및 수집, 재배포금지

기획/특집인기뉴스

영남일보TV





영남일보TV

더보기




많이 본 뉴스

  • 최신
  • 주간
  • 월간