중소벤처기업연구원은 「중소기업의 성장 예측에 대한 머신러닝 활용 방안 탐색 연구(Ⅰ): 중소기업의 고용 수준 예측」보고서를 발표하였다.
[빅데이터의 성장 등으로 기존의 전통적 통계 분석 방식에서 나아가 보다 정확한 예측을 위한 분석적 접근들이 이루어지고 있는 실정]
- 머신러닝(Machine Learning)은 데이터에 기반을 두고 이의 패턴을 학습하는 것이 특징이며, 특히 미래 예측에 관한 문제에 대해 탁월한 성능을 보이는 것으로 알려짐
- 재정, 노동, 교육 등 다양한 국가정책 관련 분야에서 정책 방안을 모색하기 위한 목적으로 이러한 분석 기법을 적용하려는 시도가 활발함
- 그러나 중소기업 고용 또는 성장의 문제에 관하여 정책 설계를 고도화하고 신뢰성 있는 예측 모형을 개발하기 위해 머신러닝 기법을 적용하려는 시도는 아직 부족한 상황
[(목적) 최근 예측 연구에서 활발히 활용되고 있는 머신러닝 방법을 적용하여 중소기업 성장 예측에 대한 새로운 시사점을 도출]
- 특히 본 연구는 중소기업의 고용 수준(고용의 양)에 관심을 두고 이를 예측하기 위한 탐색적 접근을 시도
- 연구 내용은 크게 2가지 사항으로 구성: 1) 머신러닝 개념 및 특징 고찰, 2) 머신러닝 모형을 적용한 중소기업 고용 수준 예측 및 평가
[중소기업의 고용 수준을 예측하는 분야에 대해 머신러닝 방법론을 적용한 예측모형 개발이 이루어지는 것이 필요]
- 본 연구는 기업 단위 자료인 SIMS를 바탕으로 머신러닝 기법을 적용하여 우수한 예측 성능을 보이는 모형을 확인함
- 특히 의사결정트리 기반 앙상블 모형에 대한 머신러닝 방법론 간 비교와 더불어 벤치마크 모형과의 비교를 통해 머신러닝의 적용 가능성을 탐색
- 기업 단위의 빅데이터를 기반으로 하는 경우 본 연구를 통해 확인한 LightGBM과 같은 기법이 유용할 것으로 판단
- 구체적으로 중소기업의 고용 예측 전망 분야, 고용 상황에 따른 조기경보 시스템 분야 등을 개발하는 방향으로 머신러닝 방법의 적용 확대를 고려할 필요
[중소기업 고용 예측 문제에 있어 정책지원의 역할을 주요한 변수로 고려하며, 분석 시 표본 데이터를 활용하려는 분석적 접근이 중요]
- 중소기업 관련 이슈에 있어 머신러닝을 적용한 기존 논의는 대게 기업의 재무, R&D 관련 정보를 활용하는 경향
- 본 연구는 기업 재무, 거시카지노 슬롯게임 추천 상황 관련 정보에 더하여 정책지원 자료를 분석 모형에 포함하였으며, 정책 변수에 대한 높은 중요도를 확인
- 특히 본 연구에서 활용한 SIMS는 정부의 정책지원을 활용한 기업의 표준 자료임을 고려할 때 이를 머신러닝 방법으로 분석하는 것은 중요한 의미를 가짐
- 머신러닝 기법이 빅데이터 분석 시 적용하는 방법임을 고려할 때 적은 수의 샘플을 토대로 하는 경우 분석 결과에 편의가 발생하는 ‘Small Sample Bias’에 대한 논의도 존재
- 정책지원의 역할을 주요한 변수로 고려하며 표본 데이터를 활용하려는 접근을 통해 분석 결과의 신뢰성, 객관성을 더욱 제고할 수 있음
[머신러닝 기법을 적용한 중소기업 예측 문제를 다루는 경우 데이터 수집, 관리 주기를 연 단위보다 축소하는 것이 바람직]
- 본 연구는 SIMS가 가지는 시계열 특성을 중요하게 보고 이를 반영한 예측을 수행하기 위해 LSTM 방법을 적용하였으나 앙상블 모형 대비 예측 성능이 부족한 것으로 나타남
- 이러한 결과는 2010~2022년의 연 단위 데이터를 활용함으로 인해 일반적인 시계열 자료 분석의 관점에서 짧은 주기의 데이터를 적용한 점에 기인할 가능성 존재
- LSTM을 적용한 논의가 일, 주 단위 수준에서 긴 시간 주기에 적용하고 있는 점에서 시계열 특성을 고려하는 방법론을 적용하려는 경우 그에 걸맞은 데이터 확보, 관리가 필요
- 특히 중소기업 경보시스템 등을 개발하려는 경우 연 단위 데이터의 적용은 한계가 있을 것으로 보이며, 시간 주기를 이보다 축소한다면 더욱 적합한 예측 방법론 활용이 가능