[BUSINESS]

더아이엠씨는 보유하고 있는 기술을 다양한 분야에 적용하여 효과적이고 혁신적인
분석 및 예측 서비스를 구현하였습니다.

    • 지역별 개발 차별화를 위한 언어별 고객 불만 분석
    • 2020-04-28 15:55:29
  • ■ 사업 개요

    과제명

    (현대자동차) 국가별 텍스트 데이터 분석 자동화 기술 개발

    수행기간

    2018 ~ 현재

    활용데이터

    웹 데이터, 현대자동차 내부 데이터 및 보증 데이터

    수행기관

    더아이엠씨

    개체명 사전 구축, 데이터 수집 및 정제, 데이터 분석, 분석 결과 기반 시사점 제시

    ■ 내용

    문제

    - 서비스 품질향상을 위한 기초 자료 필요

    - 자동차 업계에서 발생하는 리콜 사태 등의 위기 상황에 대한 사전 예방책 요구

    접근

    <1차 년도>

    - 주요 수집 대상 선정 및 데이터 수집

    · 과제 분석을 통해 주요 수집 대상을 선정 후 자사 보유 빅데이터 솔루션 텍스톰을 활용해 웹데이터 수집

    - 형태소 분석 및 데이터 전처리 과정 진행

    · 한국어, 중국어, 영어, 포르투갈어, 러시아어, 인도어, 독일어에 대한 정제 작업 수행

    - 텍스트 마이닝 알고리즘을 활용한 핵심어 추출

    · 각 국가별(한국, 중국, 포르투갈, 러시아 등) 차량 관련 이슈 파악

    · TF, TF-IDF, N-GRAM 추출

    · 공출현 기반 연관어 추출

    · LDA 토픽모델링을 활용한 주제 도출

    · SVM 기반의 문서 분류

     

    <2차 년도>

    - 개체명 사전 구축

    · 고장 유형, 차종, 도로상태, 부품 등으로 카테고리 구분 후 개체명 사전 구축

    · 대시보드 생성을 통해 카테고리별 어떤 이슈가 나타났는지 직관적으로 표현

    ·

    - 데이터 분석을 통한 시사점 도출

    · TF, TF-IDF, N-GRAM 분석 등 분석 작업을 수해앻 차량 관련 이슈 파악

    · 발생한 이슈에 대한 분석 작업을 통해 보고서 제출

    결과

    다양한 언어의 소비자 리뷰를 활용하여 국가별 고객 만족을 조사 분석해 현재 수준의 평가와 향후 발전 방향의 근거 제시

    전문가의 데이터 분석 결과 활용을 통한 자동차업계에서 발생할 수 있는 자동차 결함 등 갑작스러운 이슈에 대한 선제적 대응 체계 마련