본문 바로가기
IT tips

데이터마이닝(Data Mining)이란?

by 초코우유 ∽ blog 2014. 7. 5.
데이터마이닝(Data Mining)이란? - 분야별 데이터마이닝 사례 3가지

지난 2012년, 재선에 성공한 미국 오바마 대통령은 대통령선거 당시 데이터마이닝 및 통계 전문가를 모집한 바 있습니다. 이것은 유권자들의 데이터베이스를 분석하여 전략적인 선거활동을 펼치기 위함이었는데요. 그 결과 오바마 대통령은 재선에 성공하게 됩니다. 해당 사례 외에도 최근 빅데이터 시대를 맞이하여 기업/공공기관/정부에서도 데이터마이닝을 진행하고 있는데요. 오늘은 데이터마이닝(Data Mining)이란 무엇인지 살펴보고 분야별 데이터마이닝 사례 3가지를 소개해드리겠습니다. (참고 : 빅데이터란? - 빅데이터 활용사례 및 분석방법)

  


데이터마이닝(Data Mining)이란?

 

분야별 데이터마이닝 사례를 살펴보기 전에, 먼저 데이터마이닝이란 무엇인지 그 의미부터 짚고 가도록 하겠습니다. 데이터마이닝(Data Mining)에서 Mining은 '추출하다.', '채광하다'는 의미를 가지고 있으며, 이를 바탕으로 데이터마이닝(Data Mining)이란, 수많은 데이터 안에서 일정한 패턴을 찾아내고, 이로부터 가치있는 정보를 추출해내는 기술을 의미합니다. 특히, 기업들이 데이터마이닝에 관심을 기울이는 이유는 과학적인 통계를 기반으로 하여 실질적인 전략경영을 위한 새로운 아이디어를 창출할 수 있기 때문입니다. 예를들어, 수 십년간 축적되어 온 고객데이터를 분석하여 일정한 고객패턴을 찾아낸다면, 핵심타겟을 설정이 가능해지고, 그에 맞춤형으로 개발된 서비스/제품/마케팅 효과를 극대화 할 수 있게 되는 것이지요. (참고 : 소셜큐레이션이란? - 소셜큐레이션 서비스 3가지)

  



데이터마이닝 사례 01. 고객관리분야

 

앞서 살펴보았듯이, 데이터마이닝이란 방대한 데이터 속에서 일정한 패턴을 찾아내어 유의미한 정보를 도출하는 일련의 과정을 의미합니다. 특히, 기업은 이러한 데이터마이닝 기술을 비즈니스 차원에서 적극 활용하고 있는데요. 이를테면, 기업이 데이터마이닝을 통해 전체 고객들 가운데 매출에 막대한 영향을 미치는 로열고객층을 구분하고, 해당 고객층의 라이프스타일의 공통점을 분석한다고 했을때, 도출된 결과를 바탕으로 맞춤형 서비스를 제공하여 고객만족도를 높일 수 있게 됩니다. 뿐만아니라 로열고객층이 필요한 것이 무엇인지 파악하고 간지러운 부분을 긁어주는 마케팅을 펼친다면, 불특정다수를 대상으로 하는 마케팅보다 그 효율성은 높아지게 되는데요. 백화점이나 신용카드사, 은행에서 고객등급을 구분하여 차별화된 서비스를 제공해주는 것도 데이터마이닝이 근간에 있다고 할 수 있겠습니다. (참고 : 앵커링효과(Anchoring Effect)란? - 앵커링 효과 사례와 실험)

 



데이터마이닝 사례 02. 의학분야

 

대표적인 데이터마이닝 사례로 언급되는 것 중 하나가 바로 구글에서 제공하는 '독감 트렌드' 서비스입니다. 구글 검색어 가운데 '감기'와 관련된 키워드가 증가할 경우 독감이 유행한다는 패턴을 발견한 구글은, 독감 트렌드 페이지를 별도로 구축하여 전 세계 독감 확산현황을 확인 할 수 있습니다. 구글은 독감 트렌드를 통해 2007년부터 축적되어 온 감기 검색빈도 데이터에 대해 국가별로 구분하여 어떤 달에 가장 검색수가 높은지를 차트로 확인시켜줍니다. 즉, 감기에 대한 검색이 높을수록 감기/독감에 대한 위험도가 높다는 것으로 해당 자료를 통해 정부기관 및 의학분야는 독감환자를 대비하고 예방을 조모할 수 있게 되는 것이지요. 하지만, 안타깝게도 구글 독감트렌드에 우리 대한민국은 포함되어 있지 않네요. ㅠㅠ (참고 : 집단지성(Collective Intelligence)이란? - 집단지성 사례 및 실험)

 




데이터마이닝 사례 03. 제조업

 

데이터마이닝에 대해 실질적인 효과를 본 분야를 꼽아본다면 제조업이 빠질 수 없습니다. 공장을 운영하다보면 불가피하게 불량품이 발생하곤 합니다. 검수과정을 통해 불량품을 걸러내게 된다면 다행이지만, 혹시 상품화되어 소비자에게 넘어간다면 브랜드 이미지 타격은 물론 신뢰도를 잃을 수 있습니다. 이에, 제조업 분야는 데이터마이닝 기술을 통해 정상제품의 기준을 규정한 뒤, 해당 범위를 벗어나는 제품을 불량품으로 자동구분하도록 적용했는데요. 뿐만아니라, 불량품의 공통된 패턴을 분석하여 불량품이 발생되는 원인을 규명하고 이를 보완함으로써 실질적인 불량품 발생빈도를 낮추는 작업도 일련의 데이터마이닝 사례라고 할 수 있습니다. 이렇게 불량품이 소비자에게 전달되는 경우를 최소화함으로써 고객과의 신뢰를 구축하고 매출신장에 도움이 될 수 있는 것이지요. (참고 : 퍼베이시브 컴퓨팅(Pervasive Computing)이란? - 퍼베이시브 컴퓨팅 사례)


스크랩출처: http://blog.naver.com/PostView.nhn?blogId=no1_hanafax&logNo=220040641496