[BLOG]

더아이엠씨의 사내문화를 소개합니다.

    • 빅데이터 분석을 활용한 관광·여행객의 특성 조사
    • 2020-07-21 11:47:05
  • 걷기 여행은 치유(힐링), 체험관광,

    헬스투어, 체류형 여행 등의 최신 여행 흐름을

    아우르는 대표 관광 콘텐츠로 자리매김했다.

    소셜미디어 빅데이터를 활용한 걷기 여행 특성 조사, 2019




    걷기 여행길 조성 확대와 그에 따른 정책의 수립

    끊임없이 변화하는 사회 속에서 관광 트렌드 역시 변하기 마련입니다. 이전의 관광 트렌드는 버스를 타고 유명 관광지를 돌아보는 패키지여행이 유행이었다면, 최근에는 나 홀로, 천천히, 심신의 안정을 위한, 친환경의 분위기에 따라 여행의 특성이 크게 전환되었죠. 이러한 분위기 속에서 07년과 08년도에 각각 만들어진 제주 올레길과 지리산 둘레길을 시작으로 전국에 '걷기 여행'에 관한 관심이 확대되었는데요. 관광 트렌드의 변화는 중앙정부와 각 지방자치단체에 '걷기 여행'에 관련된 인프라가 필요하다는 요구로 확대되었고, 이에 '걷기 여행길'은 전국적으로 조성·활성화될 수 있었습니다.



    이렇듯 관광분야에서 걷기 여행에 관한 관심은 현재까지도 계속 커져왔으나, 전국 약 550개의 걷기 여행길 가운데 관련 데이터나 실태 및 분석 자료는 많이 부족한 실정이었고, 진행되고 있던 실태 조사조차 조사 범위와 표본 수의 한계로 관광객들의 이용행태를 파악하기 어려운 상황이었습니다. 이에 한국관광공사는 객관적인 토대를 갖추어 보다 나은 걷기 여행 문화를 조성하고자 했으며, 더아이엠씨는 빅데이터 분석 기술을 활용하여 이용객의 행태를 조사·분석하는 방법을 제안했습니다.



    클릭 시, 텍스톰 4.0 홈페이지로 이동

    더아이엠씨는 소셜미디어의 확산으로 인해 온라인상에서 여행/관광 후기 및 경험들을 공유하는 게시물이 큰 폭으로 증가하고 있음에 주목했습니다. 이에 텍스트 마이닝 솔루션 'TEXTOM(텍스톰)'을 이용해 데이터를 수집과 정제·분석하여 걷기 여행을 즐기는 관광객들의 특성을 파악하고자 했습니다. 이러한 분석방법은 마케팅, 공공정책 수립 및 평가 등 대국민 인식조사(오피니언 마이닝)가 필요한 분야에서 이미 광범위하고 사용되고 있었기에, 큰 표본집단을 대상으로 한 조사·분석 상황에서 비용과 시간을 줄일 수 있는 가장 효율적이고 적합한 방법이었죠.






    '걷기여행'에 관한 각기 다른 정의

    본격적인 특성 조사에 앞서 관광분야에서 '걷기 여행'에 대한 명확한 정의와 어떠한 특성을 조사하고 결과를 도출할 것인지에 대한 협의가 선행되었습니다. 이에 걷기 여행의 특성을 방문 집단, 숙박 행태, 콘텐츠로 정의하고 해당 특성을 연도별/계절별/걷기여행길별로 나누어 분석하고자 했으며, '걷기 여행'에 관련된 개념과 정의를 설정했는데요. 각기 달라질 수 있는 '걷기 여행'에 관해 공통적으로 동의할 수 있다고 논의된 개념 및 정의는 다음과 같습니다.

    도보여행(걷기 여행)의 개념 및 정의

    구분

    내용

    김인식 · 조민호

    (2011)

    길과 어우러진 자연‧생태자원을 감상하고 체험하며, 문화‧역사자원을 배우고 느끼고자 하는 관광객에 의한 적극적인 활동으로, 신체적‧정신적 건강에 긍정적 영향을 주는 사색하면서 걷는 관광

    박근수

    (2010)

    길을 따라 종교‧문화‧역사자원‧자연, 그리고 생태자원들의 매력물을 체험하고 감상하는 여행

    박시사·노경국

    (2010)

    자연‧생태자원이나 문화‧역사자원을 좀 더 쉽게 찾고(체험), 즐기고(감상), 배울 수(학습/사색) 있도록 조성된 도보 중심의 길을 걷는 여행

    인천발전연구원

    (2008)

    도보로 매력물을 찾아 이동하는 관광객의 경로탐색과 관광매력물에 대한 이해와 관계되는 행동

    박영아 · 현용호

    (2009)

    느리게 걸으면서 하는 여행

    장용운

    (2013)

    길을 따라 걸으며 그 지역의 역사를 이해하고, 문화 및 자연환경을 체험하고 감상하며 신체적, 정신적 활동을 하는 여행

    문화체육관광부

    (2010)

    길을 따라 종교‧문화‧역사자원이나 자연‧생태자원 등 매력물을 스스로 체험하고 감상하며 학습하기를 즐기며 걷는 여행



    조사의 첫걸음, 데이터 수집

    이후에는 개념적 정의를 바탕으로 어떻게 분석할 것인지에 대한 결정해야 했는데요. 더아이엠씨는 2009년 7월부터 2019년 6월까지의 10년(120개월) 간 발생한 데이터를 수집하고 활용하고자 했습니다. 여기에 자연어 처리 모델 구성·적용하고, 텍스트 마이닝과 비정형 데이터의 분석 방법은 결정되면서 본격적으로 '소셜미디어(SNS) 빅데이터를 활용한 걷기여행 특성 조사 (2019)'가 시작되었습니다.






    분석 도구는 더아이엠씨에서 개발한 'TEXTOM'이 사용되었으며, 네이버/다음 블로그 등 온라인 포털과 인스타그램 등 각종 SNS, 그리고 루리웹, 디시인사이드 등 주요 웹 커뮤니티를 대상으로 데이터의 수집이 이루어졌습니다. 또한 이때 수집한 데이터의 키워드는 '걷기여행', '도보여행', '걷기관광', '걷기여행길', '도보관광'으로, 도출된 결괏값을 이용해 걷기 관광 소비행태와 관련 이슈 및 담론을 분석할 수 있었습니다.



    '진짜 후기'만을 잡아라, 데이터 정제

    구분

    분석 내용

    걷기 여행 분석

    목적지별 관심도 변화

    걷기 여행 목적지

    걷기 여행 주요 관심 지역

    이미지 및 감정

    이미지 및 감정

    방문 집단 형태

    여행 기간

    주요 걷기길 분석

    걷기 여행길별 특성

    걷기 여행길별 관심도

    걷기 여행길별 이용 형태

    걷기 여행길별 지명 및 명소

    걷기 여행길별 세부 특성

    이번 조사에서 6개의 키워드로 수집된 데이터는 총 11만 건으로, 텍스트 마이닝을 통한 형태소 분석을 통해 주요 단어들의 출현 빈도 횟수와 문서 내 중요도를 바탕으로 하여 분석이 진행되었습니다. 조사는 크게 '걷기 여행 분석'과 '주요 걷기길 분석'으로 나뉘었는데요. 시기별, 계절별로 걷기 여행에 대한 관심도를 도출하고, 주요 관광지명 및 걷기 여행에 대한 관심도 조사를 수행하는 것을 목표로 설정하여 진행되었습니다.



    수집 데이터 중 본 연구목적에 맞지 않는 해외여행 관련 데이터, 스팸/홍보/광고, 단순 정보 제공 등의 불용 데이터 관한 처리 작업과 함께 데이터 분석의 정확도와 결과에 관한 변수를 줄이기 위한 데이터 정제 작업이 진행되었습니다. 이에 조사의 신뢰성을 떨어뜨릴 수 있는 불용 데이터(26%)를 걸러내었고, 가용 데이터(74%, 82,304건)만을 분석 데이터로 활용할 수 있었습니다. 불용 데이터 처리 및 데이터 정제가 어떠한 작업인지는 위의 이미지를 참고하시면 되겠습니다.






    걷기 여행에 관련된 시민들의 관심 수준

    데이터 분석에서의 자료량은 네티즌들이 실제 작성하는 문서 수는 동일하므로, '분석된 자료의 분량'이 '걷기 여행의 관심도'와의 상관관계를 가지는 것으로 해석할 수 있습니다. 분석된 결과를 미루어볼 때, 지자체와 정부 기관에서 걷기길을 조성하기 시작한 2010년도부터 자료량이 꾸준히 증가해 관심도가 조금씩 증가했음을 알 수 있는데요.







    그러나 2015년부터는 수집된 데이터양은 많은 데 비해 불용 데이터로 처리한 '해외여행 관련 데이터'의 비중이 커진 것으로 나타났습니다. 이는 즉 걷기 여행, 관광, 등산 등 여행과 관련된 국민적 관심도가 전반적으로 상승했다고 볼 수 있겠으나, 국내여행보다 해외여행에 더 큰 관심을 가지게 되었음을 나타냅니다.



    기온에 따른 걷기 여행 관심도의 변화

    가용 데이터의 월별 자료량과 계절별 자료량의 상관관계를 분석해본 결과 봄>여름>가을>겨울 순으로 자료량이 많게 나타났습니다. 봄의 경우, 기후뿐만 아니라 벚꽃 등 야생화 감상 등을 목적으로 걷기 여행이 활발히 이루어지는 것으로 해석되며, 여름에는 휴가철로 인한 영향을 받은 것으로 분석되었습니다.




    그러나 가을의 전반적인 자료량은 여름보다도 적음에도 불구, 10월에는 기온이 낮아지면서 오히려 반등하는 경향도 나타나는데요. 이러한 상관관계가 나타나는 이유는 단풍 놀이 등의 외부 행사 시즌이기도 하면서, 동시에 걷기 여행은 이동 수단 이용의 빈도가 적은 특성으로 여행의 변수가 외부 환경(기온 등)에 의해 얼마나 자유로우냐가 관건이 되므로 어찌 보면 당연한 결과라고도 할 수 있겠습니다.



    걷기 여행의 목적은 '운동'?'휴식'?

    걷기 여행의 목적이 무엇이라고 생각하시나요? 혹자는 '건강'을 위하여 재미있게 걷기 위하여라고 말하겠지만, 반면 '단순 관광'이나 '심신의 안정'을 위해서라고 말하는 사람들도 있을 것입니다. 이와 관련하여 시민들이 걷기 여행의 목적에 대해 어떻게 생각하는지 '건강', '휴식', '경관' 세 분류로 나누어 분석하였는데요.



    각각의 분류에 따른 관련 키워드들이 걷기 여행과 함께 얼마나 많은 빈도로 언급되었는지 살펴본 결과, 2000년대 초반에는 사회·환경적인 '웰빙' 열풍에 힘입어 '건강'에 관련된 '다이어트', '운동' 등의 키워드의 언급량이 많았던 반면, 시간이 지남에 따라 이는 줄어들고 오히려 '휴식'에 관련된 '명상', '맛집', '치유' 등의 키워드는 2010년에 비해 크게 증가한 모습을 확인할 수 있었습니다.



    최근 가장 인기 있는 걷기 여행길 TOP 5!

    더아이엠씨는 SNS 빅데이터에서 걷기 여행 목적지 키워드의 빈도 분석을 통해, 전국의 걷기길 이용량을 간접적으로 도출하고자 했는데요. 전체 기간에 걸친 빈도 분석 결과, 제주 올레길(4,028), 해파랑길(2,556), 지리산 둘레길(2,063) 순으로 나타났는데요.( : 건) 이는 상위 30개 걷기길 출현 빈도의 절반 이상을 차지하는 분량이었습니다.





    그러나 최근 30개월 (201.01~2019.06) 동안의 단어 출현 빈도를 추출해본 결과는 그 순위가 조금 다르게 나타났는데요. 빈도 추출 결과, 과거에는 제주 올레길, 지리산 둘레길, 서울성곽 길가, 북한산 둘레길 등의 결과가 나타났다면, 최근의 결과로는 해파랑길(1,356), 제주 올레길(739), 갈맷길(295), 강릉 바우길(230) 등으로 나타나 그 양상이 많이 변했는데요.


    시민들이 제주 등 관광지나 트레킹 코스 등을 찾았던 과거와는 달리 부산 및 동해안 지역의 걷기 길에 관심을 갖게 된 요인으로는 걷기길의 지속적인 신규 조성 및 관리와 한국관광공사의 '해파랑길' 홍보의 효과로 관심도가 급증하였기에 나타난 결과라 분석됩니다.






    걷기 여행 특성 조사가 시사하는 점

    본문에는 다 담지 못했지만 빈도 분석 결과, 여행 행태에서는 '바닷가'가, 지명 및 명소에서는 '오륙도'가 가장 높은 빈도를 보인 것으로 보아 앞으로도 해파랑길에 대한 관심도가 지속적으로 높아질 것이며, 해파랑길에 포함된 오륙도 스카이워크 등이 사계절 내내 인기가 많은 걷기 여행지로 자리 잡을 것으로 보입니다.

    그리고 관광 시장에서 국내외 전반에 걸친 걷기 여행 수요가 지속적으로 증가하고 있다는 점을 미루어 보아, 전국의 걷기 여행 축제가 보다 활성화되고 지속되어야 함을 보여주고 있습니다. 이에 '2022년 DMZ 평화의 길'이 열려 걷기 여행에 관심이 최고조에 오를 것으로 예상되는 만큼 이용 편의 서비스를 강화하고 높은 품질의 콘텐츠를 개발하는 등의 노력이 뒷받침되어야 할 것으로 보입니다.




    또한 이번 조사를 통해 특정 분야의 현황을 파악하여 정책적 시사점을 도출해낼 객관적인 자료를 제시한 것은 눈여겨볼만한 점인데요. 시민들의 생각이 소셜미디어에서 즉각적으로 반영되는 시대인 만큼 이와 관련한 데이터의 수집과 분석을 통해 '관광 분야 빅데이터 플랫폼'을 구축, 수요를 예측하여 이를 즉각적으로 지원할 수 있는 정책적 기반이 마련되어야만 효율적으로 관광산업을 운영해나갈 수 있을 것으로 분석됩니다.