[BLOG]

더아이엠씨의 사내문화를 소개합니다.

    • 1차 산업 농업과 4차 산업 기술이 만난다면?
    • 2020-09-07 17:21:19
  • 한국정보화진흥원은 2009년 설립 이후 아마 가장 바쁜 한 해를 보내고 있을 것이라 짐작된다. 문재인 정부의 '한국판 뉴딜'이 본격적으로 시동이 걸리면서 '디지털 뉴딜'이라는 이름 아래서 유례없는 규모의 사업들을 동시에 진행하고 있기 때문이다. … 지난 3차 추경으로 탄력을 받은 국내 AI ·빅데이터 기업들은 4차 산업 기술과 산업을 결합시키기 위해 피땀 흘리고 있다. 가장 인상적인 것은 아무래도 '농업 분야'이다. 기계의 힘을 빌린 농업 분야의 발전은 지금껏 계속되어 왔지만, 병충해를 식별하고, 잡초를 제거하는 등의 일을 하기 위해 인간의 눈과 손을 계속 필요로 했기 때문이다. …

    농민의 '생활'과 직결될 '빅데이터'

    정부의 입장에서 농업 정책은 다루기 민감한 사안으로 여겨집니다. 그럴 수밖에 없는 이유가 대다수의 정책들은 정책 시행으로부터 영향을 받는 대상이 '단체'이기에 국민 개인이 느끼는 페널티가 적다고 체감되는 반면, 농업 정책의 경우에는 농민 개인의 생활과 직결되기 때문인데요. 이는 우리가 TV 등을 통해 한 번쯤은 농민들이 서울에 모여 단체 시위를 하는 모습을 봤던 적이 있는 만큼 체감되는 것이 크다고 할 수 있습니다.


    농식품에 관련된 이슈는 농민뿐만 아니라 일반 국민에게도 큰 영향을 미치고 있는데요. 의식주의 한 요소로서 국민의 기본 생활을 유지해 나가는데 필수적인 식품에 관련된 이슈가 발생할 때마다 예민하게 반응하고 있는 모습 또한 쉽게 찾아볼 수 있습니다. 이에 더아이엠씨NIA(한국정보화진흥원)와 함께 빅데이터를 활용하여 농업 정책 수립에 있어 '객관적인 자료'를 제공하기 위한 사업을 진행한 바 있는데요.


    기본적으로 농식품 데이터 활용에 대한 기본적인 환경 조성이 미흡하여, 사업을 진행했던 2018년 당시에는 데이터를 활용한 정책 수립이 제대로 이뤄지지 않고 있었습니다. 정책 지원을 위한 지식 서비스의 구현이 필요한 상황이었고, 이에 더아이엠씨데이터를 수집, 용어 사전을 구축, 영농상황 및 지원 정책 분야 지식베이스를 구축, 협력체계의 구축을 내용으로 하는 사업에 컨소시엄 주관 기업으로 참여하게 되었습니다.


    사업은 '지능정보 서비스 구현을 위한 농업 분야 지식베이스 구축 및 검증' 사업이란 이름으로 진행되어 현재는 AI Hub를 통해 데이터에 누구나 접근할 수 있게 되어 있는데요. 이번 사례는 사업 내용이 방대한 만큼 최대한 알기 쉽고, 핵심적인 요소들을 풀어 설명드리도록 하겠습니다.


    데이터 활용의 근간을 만드는

    '지식 베이스 구축 사업'

    농업 분야 지식베이스 구축 방안

    데이터를 활용함에 있어 전문가와 비전문가 모두가 가장 편리하게 접근할 수 있는 방법인 '지식 베이스 구축'을 위해서는 높은 질의 데이터를 확보하고 이를 학습 시키는 과정이 필요한데요. 정형 데이터뿐만 아니라, 이미지 등의 비정형 데이터를 처리할 수 있어야 하는 만큼' 빅데이터'를 오랜 기간 다뤄온 더아이엠씨의 노하우가 필요했습니다.

    농업 분야 지식베이스 구축 사업을 위해 진행한 내용

    사용자들이 편리하게 사용할 수 있는 지식 베이스를 구성하기 위해서 이후, 뒤에 설명드릴 다양한 방안들을 적용·연동하여 온톨로지 개발도구로 잘 알려진 protégé를 중심으로 농업 지식 베이스를 구축하였는데요. 또한 많은 이들이 구축된 지식베이스를 직접 활용할 수 있도록 '검색 모듈'을 개발, 농림 사업 안내 서비스에 구축, 언론을 통한 홍보를 진행을 돕는 등의 노력을 기울였습니다. 그 상세한 내용은 다음과 같습니다.


    병충해 이미지 등 외부 데이터 수집

    데이터의 종류는 크게 정형 데이터 비정형 데이터로 나뉩니다. 정형을 이루는 원천 데이터(Raw Data)를 수집하는 일은 비교적 단순하고 반복적인 형태인데 반해, 비정형 데이터의 경우에는 원천 데이터를 컴퓨터가 읽을 수 있을 정도의 품질로 수집하기 위해서 수많은 방법들이 동원되는데요.


    먼저, 머신러닝 기법을 활용을 위해 생육과정에 따라 병해충 이미지를 학습, 확인, 실험 데이터 세트로 구성하고자 했습니다. 이에 시설원예작물 이미지를 촬영할 수 있는 장소를 섭외하여 현장 촬영을 진행했는데요. 한 장의 잎을 촬영함에 있어서도 수집 매뉴얼을 구성하여 진행되었기에 질 좋은 데이터를 확보할 수 있었습니다.


    또한 귀농/귀촌인들을 상담·지원하기 위한 귀농귀촌지원센터의 데이터 또한 확보하고자 했습니다. 그 이유는 농촌의 현안으로 떠오른 귀농 귀촌인들을 위한 정책 근거를 확보할 수 있는 방안으로 녹취된 상담 데이터를 활용하고자 했기 때문입니다. 이에 음성 인식을 통해 도출된 텍스트 데이터를 토대로 '텍스트 마이닝' 기법을 적용하여 새로이 제기된 이슈 등을 지식베이스에 반영하는 방안을 적용했는데요. 정책 의사결정 지원이라는 본연의 기능을 더 강화되어 농업 정책을 결정·시행하는 각 부처에서는 보다 실효성 있는 근거를 확보할 수 있게 되었습니다.


    지침서 등 내부 데이터 수집 및 용어 정리

    지식 베이스 구축을 위한 병충해 이미지 등의 비정형 데이터의 확보를 성공적으로 진행했으나, 내부 데이터를 수집·정제하는 일 역시 쉽지만은 않습니다. 사람이 보기 쉽게 정리된 자료를 컴퓨터가 읽을 수 있는 형태로 바꾸기 위해 정보를 추출해야 하는 작업이 필수적이었기 때문입니다. 또한, 이러한 경우에는 추후 누적되는 데이터들을 통해 고도화되는 지식 베이스의 특성상, 컴퓨터가 읽을 수 있는 서식으로 통일시킬 필요가 생기기도 합니다.


    이에 이번 사업을 위해 농업인 대상 119개 사업에 관한 안내서와 지침서, 기타 사업 지원 공고문, 신청서 그리고 반정형 데이터였던 농림사업 안내성 등에 대해 정형 데이터 활용을 위한 전처리를 진행했습니다. 또한, 지원 사업에 대한 정보 추출을 진행한 결과, 각 지침서에서 다루는 용어의 차이 및 정의의 차이로 인해 지식베이스의 품질을 보완하기 위한 용어 정리가 진행되었습니다. 이는 곧 용어 사전 구축 단계로 이어지게 되는데요.


    지식베이스 용어 사전 구축


    컴퓨터가 읽을 수 있는 정제 데이터를 우리가 쉽게 구분하고 확인하기 위해서는 '용어 사전'은 필수적입니다. 여기서 말하는 용어 사전이란 데이터 베이스의 검색을 용이하게 하기 위한 색인용 사전이라 할 수 있습니다.

    먼저 농업경영체 관련 정보, 지원 사업 지급 정보, 관련 상담사례 정보의 언어분석을 통한 표제어의 후보 추출하는 일이 선행되었습니다. 이후 10,000개의 표제어를 선정하여 이에 정의와 용례 등 개념 정보 작성이 진행되었고, 이후에는 동의 관계, 계층 관계, 연상 관계 등을 작성하여 용어 사전을 구축할 수 있었습니다.

    용어 사전의 구축 결과는 아래의 표와 같습니다.

    시소러스 분류

    단어 수

    포함 표제어

    영문명

    4,518

    4,518

    동의어·유의어

    5,605

    2,604

    상위어

    6,817

    6,817

    하위어

    5,329

    442

    연상어

    13,076

    9,012

    합계

    35,345

    -

    지식베이스 활용 확산을 위한 노력




    많은 노력 끝에 구축된 농업 분야 지식 베이스의 접근성을 높이고자 더아이엠씨에서는 '질의응답 서비스'를 구현 및 실행하고자 했는데요. '질의응답 서비스'를 통해 농업인의 고충과 지식베이스 활용에 관한 고민을 해결하고자 했으며 또한 홍보를 위한 세미나 개최, 타 기관 및 연구과제와의 협력을 통해 챗봇을 개발하는 방안을 구상하는 등 많은 노력을 기울였습니다.



    농업 현안의 과학적 해결방안 제시

    지능정보사회라는 이름으로 산업 전반에 걸쳐서 '지능화'가 진행 중에 있습니다. 빅데이터와 AI를 활용한 이번 지식 베이스 구축 사례는 농업 분야에 특화된 지능정보 서비스를 개발할 수 있는 환경을 조성했다는 의의를 지닙니다.

    한국어 AI 서비스를 위한 지식베이스 구축

    지난번 '한국어 AI 서비스 사례'와 동일하게 이번에도 역시 국정보화지능원에서 운영 중인 AI Hub를 통해 지식 베이스에 누구나 접근할 수 있는데요. 이를 통해 민간 연구개발기관 등은 해당 데이터를 활용하여 서비스 개발, 교육 등에 활용할 수 있는 기초자료를 확보할 수 있게 되었습니다.

    ▼ AI Hub에서 농업 분야 지식 베이스 확인하기


    또한 최신 ICT 기술 기반 농업 경영체의 영농 계획에 최적화된 정책 상담 서비스 과학적 농업의 구현을 확보할 수 있을 것으로 보이는데요. 지식베이스를 활용할 경영체가 어려운 지원 사업 내용을 쉽게 이해할 수 있는 보조 기반을 마련하게 되었으며, 각종 질병과 자연재해에 관련한 정보를 쉽게 접근함으로써 농업의 생산성을 제고할 수 있게 되었습니다.


    또한 지식베이스를 활용하여 농업 관련 FTA, 직불제 등 민감한 사안에 대해 정부가 보다 객관적인 데이터를 기반으로 대응할 수 있는 도구가 마련되었다고 볼 수 있는데요. 농업 현안에 대해 현명하고 객관적인 해결책을 강구할 수 있게 되면서, 농업 친화적 국민 정서 확산을 기대할 수 있는 정책을 펼쳐나갈 수 있을 것으로 기대가 됩니다.


이전글
빅데이터·AI 기반 나라장터 입찰 잇템 '비딩톰'
다음글
다음글이 없습니다.