빅데이터 분석의 새로운 조류, 머신러닝 기반 자동분석 솔루션 ‘스마트 오토 ML’
빅데이터 분석의 새로운 조류, 머신러닝 기반 자동분석 솔루션 ‘스마트 오토 ML’
  • 오상헌 기자
  • 승인 2019.03.15 15:06
  • 댓글 0
이 기사를 공유합니다

“4차산업시대, 어려운 AI 머신러닝 언어 공부보다 창의성과 업무 효율 높일 솔루션이 더 효과적”
㈜에이아이더 김수화 대표
㈜에이아이더 김수화 대표

[월간인터뷰] 오상헌 기자 = “짧게는 5년, 길게는 10년” 인공지능 분야 최대 강국인 미국, 캐나다와 국내 기술 격차에 대한 시장의 평가다. 이웃 중국과도 이미 3~4년 격차가 난다고 한다. 4차산업혁명 관련 기술을 국내 기업의 핵심 경쟁력으로 추진하고 있는 우리 입장에서 이러한 현실은 매우 큰 위기가 아닐 수 없다. 이러한 격차를 초래한 가장 큰 원인으로 데이터와 AI 전문 인력 부족을 꼽는다. 구글이 검색과 유튜브(youtube)로 전 세계의 데이터를 독점하다시피 하는 빅 데이터 시장은 미래 국가 간의 ‘데이터 셧다운’ 현상에 대한 우려를 자아낼 정도이다. 단 시일 내에 인공지능 전문가가 양성되기 어려운 것도 고민스러운 대목이다. 이러한 상황에서 고가의 해외 머신러닝 솔루션을 대체하고자 국내 기업 ㈜에이아이더가 개발한 솔루션 ‘스마트 오토 ML’은, 머신러닝 언어를 잘 몰라도 인공지능 업무를 충분히 수행할 수 있는 해결책으로 각광받고 있다. 

서울시 챗봇
서울시 챗봇

머신러닝 코딩과 프로그래밍 언어 비전문가들도 사용 가능한 솔루션, AI 인력 부족 문제 해결
시장 예측, 이미지 인식, 자연어 처리 등 AI 기술 융합에는 머신러닝 분석이 필수적이다. 2015년 구글의 텐서플로 발표를 기점으로 국내 AI의 도입이 매우 활발하다. 금융, 제조 분야를 비롯해 의료, 국방, 농업, 유통에 이르기까지 산업 전반에 영향력을 끼치고 있다. 그럼에도 여전히 AI, 빅데이터와 클라우드, 증강현실 분야에서 4차 산업 소프트웨어 기술 인력은 턱없이 부족하다. AI를 다루기 위해서는 자바, R, C/C++ 등 머신러닝 코딩에 필요한 프로그래밍언어와 파이선 계열의 라이브러리 마스터가 필요하다. 그러나, 구글의 텐서플로를 비롯해 파이토치, 사이킷-런과 같은 라이브러리를 배우려면 상당 시간 관련 분야를 공부해야 한다. 이러한 장벽으로 인해 AI 전문 인력 확보에 제대로 대처하지 못한다면 전 세계의 정보를 흡수하고 있는 아마존, 구글과 같은 선진국 Big Giant들에 의한 정보와 핵심기술 종속을 피할 수 없게 된다. 현재 오픈소스로 공개되는 머신러닝 플랫폼 기술도 점차 클라우드 형태로 유료화 추세로 돌아설 전망이다. 이러한 시장 흐름 가운데 지난해 6월 설립된 구매공급망관리(SCM) 솔루션기업 엠로의 AI 분야 자회사인 ㈜에이아이더(www.aithe.io)는 머신러닝 분석을 자동화하는 솔루션을 시장에 내놓았다. 기업과 일반 사용자들이 AI에 더 쉽게 접근할 수 있도록 편리하고 쉬운 기능과 함께 비교적 저렴한 비용에 ‘스마트 오토 ML’을 제공하고 있다. ‘스마트 오토 ML’은 전문 데이터 사이언티스트들을 고용하지 않고도, 자동화된 분석 결과를 바탕으로 서비스를 개발하고 업무에 적용할 수 있는, 일명 시티즌 데이터 사이언티스트들을 위한 신개념 솔루션이다. 

시티즌 데이터 사이언티스트를 위한 획기적 솔루션, 분석기술의 상향 평준화 기여
㈜에이아이더의 김수화 대표는 ‘스마트 오토 ML’을 이용해 파이선, R, 케라스 등 머신러닝 언어와 라이브러리에 대한 지식이 없어도 빅 데이터 분석과 이를 쉽게 업무에 활용할 수 있다고 말한다. 과거 HTML 언어를 몰라도 클릭 몇 번에 사진 편집과 폰트 변경이 가능한 웹 디자인 환경이 되었듯, 이제 AI에 필요한 알고리즘과 파라미터 값을 탐색해 인간이 입력하는 것보다 빠르게 분석, 처리할 수 있는 솔루션을 개발해낸 것이다. ‘스마트 오토 ML’은 사용자당 1억 원가량의 DataRobot, SAS Viya 등의 외산 솔루션에 못지않은 구동 성능을 자랑하며 AI활용도의 대중화, 상향 평준화를 겨냥한 솔루션이다. 딥러닝, 랜덤 포레스트, GBM, GLM과 같은 머신러닝 분야의 알고리즘 선택을 자동화하고, 최근 각광받는 앙상블(Ensemble) 모델 기법도 제공한다. 김 대표는 이러한 솔루션으로 비싼 몸값의 머신러닝 인력 확보와 장시간 인력양성에 시간을 쏟아부어야 하는 기업들에게 큰 도움이 될 것이라고 주장한다. 국내 기업들의 ‘AI 3중고’인 데이터, 알고리즘, 인력 부족 가운데 분석 인력 부족을 상당 부분 해소해 줄 것으로 기대하기 때문이다. 

아시아경제 TV 클로즈업 기업현장에 방영된 (주)에이아이더

머신러닝 자동화 개념 도입으로 국내 기업의 AI 활용도가 획기적으로 개선될 것
구글, 아마존, Clarifai 등 글로벌 기업들의 AI 이미지 인식 기술 수준은 이미 95%의 정확도를 넘어서고 있다. 이러한 기술의 원천은 방대한 빅 데이터에서 나온다. 가령, 미국 검색시장에서 90% 이상의 점유율을 차지하고 있는 구글의 경우 Google 검색, G-Mail, Youtube 등을 통해 오가는 빅 데이터를 기반으로 Google AI가 학습하는 구조이다. 이렇게 학습한 알고리즘은 전이학습(Transfer Learning)이라는 방식으로 점차 진화한다. 국내 기업이 머신러닝 프로그램을 잘 개발한다 하더라도 학습할 데이터는 턱없이 부족하다. Google AI가 수만 권의 책을 읽고 시험을 치르는 반면, 국내 기업은 1~2권의 책을 읽고 같이 경쟁한다고 비교하면 된다. 데이터가 곧 경쟁력인 시대(Data Economy)가 도래하고 있다. 양질의 데이터를 개발하고 유통시키는 것, 데이터 유통 관련 지나친 규제를 과감히 개선해야 길이 열린다는 것이다. 반려동물 동영상 분석 AI 서비스를 개발하면서 수의사법 제약으로 인해 일반 기업이 할 수 있는 영역이 거의 없어 해외에 나가 서비스 개발하는 것을 고려하는 중이라고 김 대표가 고충을 토로했다. 애완견의 경우 원격진료가 가능할 것으로 생각했는데 사람 대상의 의료법과 같이 아직 문턱이 높음을 실감했다고 한다. 

그러나, 비관적인 것만은 아니다. 데이터와 플랫폼 관점에서 열세지만, 알고리즘을 신속히 도입하고 실제 업무에 적용하는 기술은 우리가 빨리 따라잡을 수 있다. 국내 기업들의 AI도 입 노력도 매우 활발하다. 제조 현장의 스마트팩토리, 금융회사의 AI 기반 고객 분석, 유통분야의 가격 및 수요 예측, 공공분야의 문서가공과 이미지 분석 등 수많은 시도가 추진 중에 있다. 대기업뿐 만 아니라 중소 호텔에서 고객의 예약 및 취소율 예측, ATM 기기의 현금 입출금 예측, 동네제과점 품목별 일일 판매량 예측까지 우리 일상의 다양한 분야에서 데이터 분석이 시도되고 있는 추세이다. 김 대표는 향후 2~3년간 AI 분석 황금기가 도래할 것이라고 예상한다. 성공 경험이 또 다른 시도를 이끌 수 있기 때문에 이러한 시도는 반드시 성공적으로 추진되어야 국내 AI 산업이 더욱 발전할 수 있다. 김 대표는 국내 기업의 빅 데이터 분석 패러다임도 변해야 함을 강조한다. 분석 자동화(Analytics Automation)가 국내외 시장 전반의 흐름이기 때문이다. 일부 분석가들에 의한 데이터와 알고리즘 독점은 바람직하지 않으며, 조직 내 대대수가 AI를 이용해야 한다고 말한다. “계산(Computation) 노동은 컴퓨터가, 창의적인 인사이트(insight) 발견은 인간이”, 이것이 김 대표가 주장하는 Human-Machine 콜라보이다. 즉, 4차산업혁명이란 기계에게 인간의 일자리를 빼앗기는 것이 아닌, 장차 인간과 분업이 가능한 ‘휴먼 플러스 머신’ 구조의 밝은 미래를 예고하는 신 산업혁명인 것이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.