지수평활법과 ARIMA를 이용한 전남 김 위판가격 예측모형 비교
Abstract
This study conducted a price forecast of major Purple laver production areas, Jeollanam-do, in South Korea. Based on the reasoning that price forecast of Purple laver production regions could assist in controlling supply and demand, through the Exponential smoothing technique(Single exponential smoothing, Holt-Winters Additive and Multiplicative, Exponential smoothing method) and Auto regressive integrated moving average model(ARIMA), Purple laver producer price of Jeollanam-do, the largest wet Purple laver producing area, has been predicted. Moreover, the accuracy and stability of the relevant forecasting model have been reviewed through the Historical simulation method. Concerning Jeollanam-do Purple laver producer price forecast results, among the total models adopted through the utilization of the Historical simulation method, the Simple exponential smoothing with DRIFT forecast model, which uses a DRIFT forecast, was ultimately selected after going through stationary Time series and forecast model accuracy tests.
Keywords:
Exponential smoothing method, Arima, Historical simulation method, Price forecasting, Purple laver producer priceⅠ. 서 론
김(Purple laver)은 해외에서 웰빙식품으로 알려지고 인기를 끌기 시작하면서 국내 김 생산량과 수출량은 꾸준히 증가하였고, 우리나라 수산물 수출 주력상품이 되었다. 하지만 김 산지가격은 연도별 생산성에 따라 큰 가격변동을 보이며 안정적인 공급에 한계를 보이고 있다(Kim DJ, 2016). 김은 물김 특성상 타 산지에서의 수급 상황과 관계없이 자기 산지 내에서의 수급 상황에 따라서 위판가격이 결정되고, 지역별, 시기별로 가격의 차이가 매우 심하기도 하다.
더구나 김 양식 중에 기후변화에 따른 고수온 현상과 황백화 등의 원인으로 김 산지의 생산량이 급감하거나, 조미김 가공업체가 증가하게 되면 물김 산지 가격은 더욱 상승하게 된다(MOF, 2018). 물김 위판가격은 산지별 수급 상황에 따라 지역별 가격 차이가 크다는 특성이 있다(Nam et al., 2014). 이렇듯 김 생산성의 변화는 김 산지 위판가격에 영향을 미치기 때문에 김 산지가격 안정화와 안정적인 김 수급조절을 위해서는 지속적인 김 가격 동향파악과 예측 및 예측력 검정 연구가 수반되어야 한다.
하지만, 김 가격 예측에 관한 선행연구가 거의 없다시피 한 상황이라고 평가(Nam et al., 2014)한 것에 착안해, 가장 상위단계인 전국 전체 평균에서부터, 도, 시·군 단위로 상위에서 하위단계로의 예측 확장이 필요하다고 판단하였고, Nam et al.(2014)에서 이미 전국 수협들의 물김 평균 위판가격을 대상으로 연구를 진행하였기에, 본연구에서는 물김 최대 산지인 전라남도 물김 위판가격을 대상으로 시계열분석에 가장 많이 쓰이는 두 가지 기법인 지수평활법과 ARIMA 분석을 이용하여 김 가격을 예측하였다. 예측의 검정으로는 역사적 시뮬레이션 방법을 통해 전남 김 위판가격 추정치와 실제치를 비교하고, 예측모형의 정확도와 안정성을 검토하였다. 본연구는 산지별 김 가격 예측과 예측력 검정 연구를 통해 우리나라 김 생산과 수급조절의 기초자료로 활용될 수 있을 뿐 아니라, 관계자들이 생산량 조정, 출하시기 변경 등 의사결정을 하는 데 도움이 될 것으로 판단된다.
본연구와 관련된 선행연구를 검토해보면, 김 가격 예측과 관련된 선행연구 자료는 극히 제한적이지만 농업 분야에서는 상대적으로 많은 예측 연구가 수행되었다. 농업 분야의 가격 예측과 예측력 검정에 관한 선행연구로는 Choi et al.(2007)이 VAR, ARIMA, GARCH 모형을 이용하여 과채류 3개 품목, 6개 품종을 대상으로 단기적 가격을 예측하였고, 실측치와 추정된 예측치를 비교하여 각 품목과 품종에 적합한 가격 예측모형을 선정하였다. Lee et al.(2017)은 통마늘 도매가격, 깐마늘 도매가격 두 가지 변수의 시계열 자료를 대상으로 단위근검정, 공적분검정, 오차수정모형, Bayesian VAR 모형 등의 계량경제학적 방법을 통해 마늘가격 간의 관계성을 분석하고 도매가격 예측모형을 추정하였다. 또 Ha et al.(2019)는 ARMA, ARCH 모형을 이용하여 품목별 적합한 시계열 모형을 산출한 뒤, 추정된 예측치와 실측치를 비교하여 적합한 가격 예측모형을 제시하였다.
수산업 분야에서는 Ock et al.(2007)이 양식 넙치의 가격변동을 기반으로, ARMA와 VAR 모형을 통해 가격을 예측하였고, Nam JO and Noh SG(2011)가 OLS와 FGLS를 통해 국내 지역별 김장굴 수요함수를 추정하여, 김장굴의 생산, 가격, 수급 동향을 파악하였다. 이후 다중회귀모형, ARIMA 모형, VAR 모형을 이용해 굴의 단기 위판가격을 예측하고, 예측 결과를 비교, 분석해 예측력을 검정하였으며(Nam et al., 2012), 또한 시계열 모형을 이용한 김 위판가격 예측 연구를 진행하여 기존에 고등어, 갈치, 넙치와 같은 대표 품목에 한정되어 진행되었던 예측 연구를 김이라는 새로운 품종으로 확장 시켰다(Nam et al., 2014). 그리고 제주 양식넙치를 대상으로, 월별 산지가격을 예측하고, MDM 검정을 통해 모형 간 예측력을 비교·검정하였다(Nam JO and Jeong MJ, 2017). Han DJ and Park CH(2018)는 Holt-Winters 지수평활법을 통해 계절성을 고려한 가공유형별 오징어 소매가격을 예측하고, MDM 검정을 통해 예측모형을 비교 분석하였다.
Ⅱ. 재료 및 방법
본연구는 지수평활법과 ARIMA 모형 분석으로 전라남도 김 위판가격을 예측하고, 역사적 시뮬레이션을 통해 실측치(Actual value)와 예측치(Forecast value)를 비교하는 것이다. 지수평활법 분석으로는 수준, 추세 및 계절변동의 고려 여부에 따라 Drift 예측을 이용한 단순지수평활법(Single exponential smoothing, SES), Holt-Winters 가법(Additive)과 승법(Multiplicative) 지수평활법, 그리고 지수평활법을 기반으로 하는 ETS 모형을 사용하였고, ARIMA 모형을 이용한 분석으로는 2009년부터 2018년까지의 전라남도 김 계통 판매가격(JLP)을 ts() 함수를 사용해 시계열 객체로 변경하여, 모형을 식별하고, 모형계수를 추정하여 예측 분석하였다.
지수평활법과 ARIMA 모형은 시계열 예측 방법 중에서 가장 많이 이용하는 두 가지 접근 방식이며, 상호 보완적이기 때문에 두 가지 접근 방식을 이용해 예측하였다(Hyndman RJ and Athanasopoulos G, 2018).
1. 지수평활법
지수평활법(Exponential smoothing method)은 비교적 단순한 시계열 분석 방법으로, 시계열 자료의 미래를 예측할 때 많이 활용되고 있는 대표적인 예측 방법이다. 지수평활법은 일종의 가중이동평균과 비슷하지만 가중치를 부여하는 방법이 다르다. 지수평활법에서는 가장 가까운 과거인 최근 데이터일수록 큰 가중치를 부여하고, 오래된 데이터일수록 작은 가중치를 부여해 미래값을 예측한다(Rho HJ, 2011; Ahn YG, 2019; Jeong DB, 2015).
단순지수평활법(SES)은 시계열 데이터가 수평적 패턴일 때 사용하며, 가장 최근의 예측치와 실제치의 차이인 잔차의 일정 비율에 가장 최근의 예측치를 더하는 방법이다(Yim ES, 2007). 불안정한 시계열 형태 중 대표적인 것이 랜덤워크(Random walk) 즉, 확률 보행이며, 랜덤워크는 표류경향(Drift)이 있는 모형과 표류경향(Drift)이 없는 모형으로 구분된다. 표류경향(Drift)이 없는 시계열 자료는 분산이 대체로 일정하지만 표류경향(Drift)이 있는 시계열 자료는 시간이 지남에 따라 분산이 확대되는 모습을 보이기도 하는데, Drift 예측을 이용한 SES를 이용해 예측한다.
계절적 지수평활법인 Holt-Winters의 가법과 승법 지수평활법은 추세성과 계절성이 함께 식별될 경우 Holt-Winters 모형을 적용할 수 있다. Holt-Winters 지수평활법은 관측치의 수준(Level), 추세(Trend), 계절변동(Seasonal)을 함께 고려할 수 있도록 3개의 평활 방정식이 있고, 계절변동의 성질, 즉 모형에 포함되는 방식에 따라 가법과 승법으로 구분된다(Hyndman RJ and Athanasopoulos G, 2018). 시간의 흐름에 따라 시계열의 변동 폭이 없거나 일정한 경우는 가법 모형을 적용하며, 반대로 시간의 흐름에 따라 시계열 변동 폭이 커지는 경우는 승법 모형을 적용한다. 가법 모형의 경우 시계열 변동 특성이 일반적인 시계열 변동과 괴리가 발생하는 경우가 많으므로, 통상적으로 Holt-Winters 승법 모형이 가법 모형보다 많이 사용되는 편이다(Hyeon et al., 2015).
ETS(Exponential smoothing method) 모형은 상태 공간 모형(SSM, State space model)으로 불리고, 이는 관측방정식과 아직 관측되지 않은 상태(수준, 추세, 계절성)가 시간의 흐름에 따라 어떻게 변화하는지를 나타내는 몇 가지 상태식(State equation)으로 구성된다. 상태 공간 모델(SSM)은 관측자료를 이용하여 아직 관측되지 않은 변수를 추정하는 방법으로 ETS 분석이 최적 예측법으로 뽑힌다(Hyndman RJ and Athanasopoulos G, 2018).
2. ARIMA 모형
ARIMA(Autoregressive intergrated moving average)는 AR(Auto regression, 자기회귀)과 MA(Moving average, 이동평균)가 결합하여 구성된 분석모형으로, 자기회귀통합이동평균 (p,d,q) 모형을 의미한다. ARIMA 모형은 과거 자료를 통한 과거와 현재의 자기회귀과정, 즉 현재의 시계열 값이 과거 자신의 값으로 설명된다는 것이고, 이동추세를 이용한 현재 값을 현재의 오차항과 과거의 오차항으로 이동평균을 통해 통합한 모델로서 AR, MR, ARMA, ARIMA, 계절 ARIMA 등의 이론적 특성을 기초로 한 시계열 분석의 대표적인 예측 분석 방법이다. ARIMA 모형은 Box et al.(1994)에 의해 개발되어 연구에 이용되기 시작하였고, 최적의 모형을 찾는 방법으로 식별, 추정, 모형진단 3단계의 절차를 제안하였다(Kim JK, 2017; Park TY, 2018; Um SM, 2014). ARIMA 예측모형 구축 절차 세부내용은 첫째, 평균과 분산의 정상성을 확인하고, 둘째, 모형의 식별단계, 셋째 모형계수 추정 단계, 넷째, 모형진단 단계를 거쳐 최종 예측하는 과정이다.
모형진단 단계에서는 Ljung-Box(융-박스)와 AIC 통계량을 이용한다. Ljung-Box 통계량은 시계열에서 관측값은 자기 자신의 과거 관측값을 이용하여 예측하는데 이것을 적합값(Fitted values)이라고 부른다. 시계열 분석에서의 잔차(Residuals)는 모형진단에서 백색잡음에 대한 추정값이라고 할 수 있다. 많은 시계열 모델에서 이 잔차는 관측값과 적합값의 차이와 같다. 잔차의 자기상관에 관한 검정방법 중 하나가 Box-Pierce 방법이고, Ljung-Box 검정방법은 Box-Pierce 검정의 정확도를 개선한 검정방법이다(Hyndman RJ and Athanasopoulos G, 2018).
AIC(Akaike’s Information Criterion)는 이론적 예측력이 좋은 모형식별에 사용되는 통계량이다. 이와 유사한 통계량으로 SC, HQ 등이 있다. AIC의 값이 적게 되는 모형이 예측력이 좋은 모형이라고 할 수 있고(Park JS, 2015), SC, HQ 역시 AIC의 대안으로 사용하며, 작은값 일수록 추정모형의 예측력이 높은 모형이다(Jeong DB, 2015). 시계열 자료의 예측은 필연적으로 예측오차(Forecast error)를 포함한다. 시계열 자료 예측모형의 적합성은 일반적으로 예측오차를 이용하여 평가한다. 그래서 예측오차는 예측방법의 신뢰성을 평가하는 기준이 된다(Park JS, 2015; Lee JG, 2017).
예측방법의 정확도를 측정하는 방법으로는 ME(예측오차의 산술평균), MSE(평균 제곱 오차), RMSE(제곱근 평균 제곱 오차), MAE(평균 절대 오차= MAD), MPE(평균 백분율 오차), MAPE(평균 절대 백분율 오차), TS(추적지표)와 같은 척도가 사용된다(Lee JG, 2017; Hong ES, 2017).
3. 분석자료
천해양식으로 생산되는 수산물 중에서 생산량이 많은 품종 1위부터 3위까지는 다시마, 김, 미역과 같은 해조류이고, 그중에서 미역류와 다시마류가 천해양식 생산금액에서 7위와 8위를 차지했지만, 김류는 전복과 넙치 다음으로 높은 가격을 형성하고 있어 상대적으로 고소득 양식산업에 속한다. 지역별 김 생산량은 전남이 전국의 73.5%, 전북과 충남이 각각 7.7%, 경기도가 5.3%로 전남에서 생산되는 물김의 비중이 가장 큰 것을 확인할 수 있다(KOSIS, 2020).
김의 생산시기는 수온이 22℃~23℃가량이 되는 9월 말에서 10월 초에 김 채묘와 시설을 시작으로 이듬해 4월에서 5월까지이며, 수온과 강수량 등 해양환경과 기상요소의 영향을 많이 받는다.
김은 생산과 가공의 이원화에 따라서 산지가격은 물김 생산량의 증감에 상당한 영향을 받고, 도매가격은 가공업체의 마른김 출하량에 큰 영향을 받는다. 김 양식이 시작되는 10월에는 생산량이 다소 적은 잇바디돌김이 주로 생산되기 때문에 위판가격이 상대적으로 높지만, 김 생산이 본격적으로 시작되면 위판가격은 일반적으로 하락하는 추세를 보인다(Nam et al., 2014).
본연구에서는 전국 김 생산량의 70% 이상을 차지하는 전라남도 김 위판가격을 예측하였고, 대부분의 양식수산물이 비계통으로 출하되는 것과 다르게 김은 계통출하 되고 있어 해양수산부 수산정보포털의 수협을 통한 2009년부터 2018년까지의 전남 김 계통 판매가격(JLP) 시계열 자료를 변수로 사용하였다. JLP의 연도별·계절별 시계열 추이는 [Fig. 1]과 같다.
전남 김 계통판매가격(JLP)은 한국은행에서 고시하는 김 품목의 생산자물가지수(PPI)를 반영하여 2015=100을 기준으로 가격을 실질화하였다. 본 분석에서 이용되는 변수들의 기초통계량을 살펴보면, 전남 김 위판가격 예측을 위한 JLP의 평균은 586.7원, 최대값은 2,228.8원, 최소값은 1원이었다.
J-B 통계량은‘시계열 자료는 정규분포를 따른다’는 귀무가설(Ho)이 JLP(2009-2018)는 5% 유의수준에서 정규성이 기각되어 정규분포를 따르지 않는 자료로 나타났다(<Table 1>). 최소값이 1원으로는 나온 이유는 물김 생산이 없는 여름철 원 데이터의 값을‘0’으로 설정하면 분석이 진행될 때 이를 결측값으로 인식하게 되므로 절대값에 1을 더해 그 의미를 왜곡시키지 않은 범위에서 데이터를 보정 해 준다(Ahn SM, 2016; Hwang et al., 2016). 본연구 분석에는 R 프로그램의 library(forecast)(tseries)(TSA)(ggplot2)와 Eviews 프로그램을 사용하였다.
분석자료 JLP의 시계열 자료(ts_dat) 정상성 및 안정성 검정을 위해 ADF(Augmented Dickey-Fuller Test) 검정, PP(Phillips-Perron Unit Root Test) 검정, KPSS(Kwiatkowsk -Phillips-Schmidt-Shin) 검정을 진행하였다.
ADF 및 PP 검정의 귀무가설은‘시계열 자료에는 단위근이 존재한다’이다. 하지만 KPSS 검정의 귀무가설은‘시계열 자료에는 단위근이 존재하지 않는다’로 ADF 및 PP 검정의 귀무가설과 반대되므로 KPSS 검정 시에는 이 점을 특히 유의해야 한다. ADF 및 PP 검정 결과 ADF와 PP의 p 값이 모두 0.01로 0.05 보다 작게 나와 귀무가설이 기각되어 단위근이 존재하지 않는 것으로 나왔고, KPSS의 Level과 Trend 모두의 p값은 0.1로 0.05보다 크게 나와 귀무가설을 기각할 수 없어, 즉 귀무가설이 채택되어 단위근이 존재하지 않는 것으로 나와 세 가지 검정 모두에서 JLP 시계열 자료는 5% 유의수준에서 가성 회귀의 우려가 없는 것으로 판단되었다(Kim Ch and Nam JO, 2018, <Table 2>).
Ⅲ. 결과 및 고찰
1. 지수평활법
Drift 예측을 이용한 단순지수평활법(SES) 결과, 전라남도 김 계통 판매가격(JLP)은 상승추세가 관찰되므로, 드리프트(Drift) 항을 포함하는, 즉 단순 지수평활법(SES)의 Drift 방법으로 예측을 시도하였다. Drift 예측을 이용한 SES의 분석결과는 α = 0.489, drift = -0.238, sigma = 14556.170으로 산정되었다.
Holt-Winters 가법 및 승법 모형 결과, Holt-Winters 가법의 각 구성 성분인 평활상수 α, β, γ에 대하여, α = 0.180, β = 0.018, γ = 0.388의 분석결과를 얻었고, 승법(Multiplicative)의 각 구성 성분인 평활상수 α, β, γ는, α = 0.094, β = 0.239, γ = 0.332의 분석결과를 얻었다. 가법과 승법의 SSE(설명된 제곱합)는 각각 5,364,559와 4,139,190으로 나왔다. SSE 값은 최소가 되는 것이 더 나은 예측모형이므로 Holt-Winters 승법 모형이 가법 모형보다 예측모형 정확도가 높다고 판단할 수 있다.
상태 공간 모형(SSM) 최적 예측법인 ETS 분석을 적용한 결과 최적의 예측모형은 ETS(M, Ad, M), 즉 ETS(Multiplicative error, Damped additive trend, Multiplicative seasonal)로 나왔고, α = 0.197, β = 0.0001, γ = 0.047, Φ(phi) = 0.974의 분석결과를 얻었고, AIC는 1300.75, AICc는 1307.52, BIC는 1350.92로 산정되었다.
2. ARIMA 모형
ARIMA 모형을 분석하기 위해서는 JLP를 시계열 자료(ts_dat)로 변환해야 한다. ts_dat 변수는 관측치(Observed), 추세요인(Trend), 계절요인(Seasonal), 불규칙요인(Random)으로 분해(Decomposition)할 수 있고, 추세와 계절성의 경향을 파악할 수 있다. JLP의 ts_dat 변수에서는 계절성과 일정 수준의 추세가 확인되어, ts_dat 변수를 차분해서 데이터의 정상화를 시도하였다. 일반적으로 수준변수에 1차 차분만 해도 어느 정도의 정상적인 패턴을 보인다. ts_dat 변수를 1차 차분한 변수는 dat_diff1로 정의하였고, 수준변수 ts_dat에서 계절성 요인만 제거한 변수는 ts_dat_adjusted로 정의하였다. 또 1차 차분한 시계열 데이터 dat_diff1에서 계절성 요인을 제거한 변수는 dat_diff1_adjusted로 정의하였다.
수준변수 ts_dat의 평균(Mean)은 586.6557, 표준편차(SD)는 516.9466로 나왔고, 1차 차분한 데이터인 dat_diff1의 평균은 –2.067475, 표준편차는 562.6608로 나왔다. 수준변수 ts_dat에서 계절성만 제거한 변수 ts_dat_adjusted의 평균은 586.6557, 표준편차는 200.5919, 1차 차분한 자료에서 계절성을 제거한 dat_diff1_adjusted의 평균은 –0.1014441, 표준편차는 524.1075로 확인되었다. ts_dat, dat_diff1, ts_dat_adjusted, dat_diff1_adjusted은 수준변수에서, 1차 차분만 진행한 dat_diff1에서 대체로 정상적인 시계열이 되었다.
본연구에서 수준변수인 ts_dat과 1차 차분한 변수 dat_diff1의 ARIMA 모형식별을 위해 각각의 ACF와 PACF를 확인해 보았지만, ACF와 PACF의 절단값이 시각적으로 명확하지 않아 모형식별이 쉽지 않음을 확인할 수 있었다. 따라서 절단값이 시각적으로 명확하지 않은 경우에 자동으로 최적의 모형을 찾아주는 방법인 R 프로그램의 auto.ARIMA 함수를 활용하여 분석을 시도하였다.
수준변수 ts_dat, 차분변수 dat_diff1의 데이터를 활용하여 최적의 ARIMA 모형을 선택하기 위해 auto.ARIMA 함수를 이용하여 ARIMA Model 1과 ARIMA Model 2를 선택하였고, 그 결과 각각의 모수는 계절성 속성을 포함한 ARIMA(1,0,2)(0,1,1)[12]와 ARIMA(0,0,2)(0,1,1)[12] 모형으로 선정되었다. 또 차분변수로 추정한 ARIMA Model 2에 1차 차분한 것을 고려하여 ARIMA Model 3의 모수를 추정한 결과 ARIMA(0,1,2)(0,1,1)[12]를 이끌어냈다. auto.ARIMA 함수로 각 ARIMA 비계절성과 계절성 모수의 계수를 알 수 있고, 표준오차(S.E)와 대수변환 된 시계열에 대한 Sigma^2(분산), Log likelihood(대우수도), AIC의 값을 알 수 있다(Kim HJ, 2011).
ARIMA 모형 1, 2, 3 각각의 계수를 보면, ARIMA(1,0,2)(0,1,1)[12] (ARIMA Model 1) 모형 추정에서 독립변수 ar1, ma1, ma2, sma1가 종속변수인 t기에 미치는 영향은 AR1 0.929, MA1 –0.381, MA2 –0.339, SMA1 –0.823 값으로, AR(1)은 양(+)의 영향, MA(1)은 음(-)의 영향, MA(2)는 음(-)의 영향, SMA(1)은 음(-)의 영향을 주는 것으로 나타났다. ARIMA(0,0,2)(0,1,1)[12](ARIMA Model 2) 모형 추정에서는 독립변수 ma1, ma2, sma1가 종속변수인 t기에 미치는 영향이 ma1 0.5428, ma2 0.1323, sma1 –0.8811 값으로 MA(1)은 양(+)의 영향, MA(2)는 양(+)의 영향, SMA(1)은 음(-)의 영향을 보이는 것으로 나타났다. ARIMA(0,1,2)(0,1,1)[12] (ARIMA Model 3) 모형 추정에서는 독립변수 ma1, ma2, sma1가 종속변수인 t기에 미치는 영향이 ma1 –0.4197, ma2 –0.3628, sma1 –0.8011 값으로 MA(1)은 음(-)의 영향, MA(2)는 음(-)의 영향, SMA(1)은 음(-)의 영향을 보였다(<Table 3>). 또한, ARIMA 모형의 적합성 검정과 예측정확도 평가(Error measures) 결과값은 <Table 3>과 같다.
표준잔차(Standardized residuals)와 ACF잔차(ACF of residuals) 그리고 Ljung-Box 통계량의 p값(p values for Ljung-Box statistics)을 통해 잔차를 분석하고, 추정된 시계열 모형에 대한 적합도 검정이 가능하다(Kim HJ, 2011). 표준잔차를 통해서는 등분산성과 선형성을 시각적으로 확인할 수 있고, ACF 잔차에 어떤 관계가 확인되면 문제가 있는 것으로 간주한다. [Fig. 2]의 세 가지 모형 모두에서 특별한 증가나 감소의 패턴이 발견되지 않았고 ACF잔차도 자기상관성이 없어 문제가 없으며, Ljung-Box 통계량의 p값도 유의수준 5% 파란 점선의 위쪽, 높은 값에 존재해 세 모형 모두 적합한 모형으로 볼 수 있다.
[Fig. 2]의 세 모형 모두에서 자기상관성을 확인할 수 없고, 잔차에 대한 Ljung-Box검정 결과는‘어떤 시차까지 자기상관계수가 모두 0이다’라는 귀무가설을 기각하지 못해 잔차는 백색잡음(White noise)을 따른다고 볼 수 있다. 이는 잔차에 더 이상 유의미한 정보가 없다는 것을 의미한다. 즉 세 가지 모형 모두 예측값이 양호하다는 것을 의미한다.
3. 김 위판 가격예측값 및 모형 정확도
지수평활법과 Box-Jenkins의 ARIMA 예측모형 구축 마지막 단계는 예측 방법의 정확도를 측정하고 미래값을 예측하는 것이다. <Table 4>는 전남 김 위판가격 2019년 1월부터 12월까지의 실제값과 지수평활법과 ARIMA 모형을 통한 예측값을 나타낸 표다. 실측치와 예측치의 정확도 파악을 위해서 예측정확도를 측정하는 여러 가지 척도 중에서 MAE (MAD, 평균 절대 오차)와 RMSE(Root mean of squared errors, 제곱근 평균 제곱 오차)를 통해 예측치에 대한 신뢰성을 확인하였다. MAPE(Mean of absolute percentage errors, 평균 절대 백분율 오차)는 백분율(%)로 오차를 비교하기 때문에 단위가 다른 변수 간의 예측도 가능하고 직관적으로 예측 결과를 검정할 수 있다는 장점이 있지만 김 위판가격 예측과 같이 실제값에 0이 있거나 0에 가까운 값이 있으면 MAPE 값이 100% 이상으로 무한하게 커지거나 정의가 되지 않는 큰 단점이 존재한다(Kim SG and Kim HY, 2016).
반면 MAE(MAD)는 예측오차에 동일한 벌점을 부여하는 방식으로 예측에 가장 보편적으로 활용되고 있는 방식이며, RMSE는 큰 예측오차에 더 큰 벌점을 부여함으로써 오차의 크기 정도를 평가하는 데 주로 활용된다. MAE와 RMSE 모두 평가치가 작을수록‘0’에 가까울수록 상대적으로 예측모형의 정확도가 높고 안정적인 것으로 판단한다.
Holt-Winters 가법 및 승법 예측모델, Drift 예측을 이용한 지수평활 예측모델, ETS 예측모델, 4가지 지수평활법 중에서는 Drift 예측을 이용한 지수평활 예측모델이 MAE(MAD) 값이 95.26으로 가장 작은 것으로 확인되었고, ARIMA 모형 1, 2, 3중에서는 1차 차분변수로 추정한 ARIMA Model 2의 모수 ARIMA(0,0,2)(0,1,1)[12] 예측모델이 MAE(MAD) 값이 111.77로 가장 작은 것으로 확인되었다.
실제 2019년 전남지역의 김 가격 변화를 살펴보면, 2019년 1월 물김의 주산지인 전남지역 평균 위판가격은 전년도보다 27% 이상 낮게 형성되었는데 그 원인으로 갯병 등의 영향으로 물김의 품질이 전반적으로 저하되었고, 마른김 업체의 재고 증가에 따른 매수세가 약했기 때문이다. 2월 들어서는 가공용 매수세의 증가로 물김 산지가격이 다소 회복되었고, 3월 초까지 매수세가 이어지다가 3월 말 들어서 김 생산이 증가하기 시작하면서 전남의 김 위판가격은 다시 하락세로 전환되며 6% 이상 감소하였다. 4월 전남 물김 위판가격은 전년도처럼 매수세가 이어지지 못했고, 물김 품질도 전반적으로 좋지 않아, 전년도 동월보다 26%가량 감소하였다. 2019년 10월과 11월은 전남 산지 위판가격이 전년도보다 각각 74%, 140%가량 큰 폭으로 상승했는데 이는 잇바디돌김의 작황 부진에 따른 생산량이 큰 폭으로 감소했기 때문이다(KMI, Fisheries Outlook Center).
Ⅳ. 결 론
본연구는 우리나라 김 최대 산지인 전남의 물김 위판가격을 예측하고, 역사적 시뮬레이션을 통해 실측치와 예측치를 비교해 봄으로써 역사적 시뮬레이션 결과가 실제치를 얼마나 근사하게 추적하는지 판단하는 것이다(Ko et al., 2012). 전남 김 위판가격 예측은 단위근 검정 결과 원래의 시계열 데이터에 단위근이 존재하지 않아 원래의 시계열을 수준변수로 설정하고 지수평활법과 ARIMA 모델을 이용하여 예측 및 추정하였고 각각의 모형을 모두 적용하여 예측력이 높은 모형을 선택하였다.
2019년 JLP 예측값을 추정하기 위해 지수평활법에서는 Drift 예측을 이용한 지수평활법과 Holt-Winters 가법 및 승법 모형, ETS 모형을 이용하였고, ARIMA 모형에서는 수준변수인 ts_dat으로 추정한 모수의 모형인 ARIMA(1,0,2)(0,1,1)[12](ARIMA Model 1)와 차분변수인 dat_diff1로 추정한 모수의 모형인 ARIMA(0,0,2)(0,1,1)[12](ARIMA Model 2), 그리고 차분변수 dat_diff1로 추정한 모수에 1차 차분을 고려해 추정한 ARIMA(0,1,2)(0,1,1)[12](ARIMA Model 3)을 이용하였다.
예측모형의 정확도를 측정하는 척도 중에서 MAPE는 본연구에서 실제치에 0에 가까운 값이 있어 MAPE를 적용하기 어렵다고 판단하였고, 예측정확도 측정에 가장 많이 쓰이는 MAE(MAD)를 기준으로 삼고, RMSE를 참고해서 예측기법의 신뢰성을 확보하였다.
지수평활법 중에서는 Drift 예측을 이용한 지수평활 예측모델이 채택되었고, ARIMA 모형 중에서는 차분변수로 추정한 모형인 ARIMA(0,0,2)(0,1,1)[12](ARIMA Model 2)가 채택되었다. 최종적으로 총 7가지의 예측모델 중 Drift 예측을 이용한 지수평활 예측모델이 시계열의 정상성, 모수 추정의 단계, 예측모형 정확도 검정을 거쳐 최종적으로 가장 적합한 모형으로 결정되었다.
본연구에서 지수평활법과 ARIMA 모형을 통해 2019년 전남 김 가격 추정값을 산출하였고, 2019년 실제값과 가장 근접한 모형을 선택하였지만, 예측 모델링 특성상 모델과 현실의 차이는 분명 존재한다. 모델 예측은 현시점에서 확보가 가능한 데이터 기반으로 만 할 수 있으며, 예측력 평가는 사후적으로 이루어질 수밖에 없다(Lee SK, 2018).
하지만 가장 적합한 모형 예측의 지속적인 축적은 향후 김 수급조절의 기초자료로 활용될 수 있다. 이는 지속가능한 김 산업을 유지하고 산지가격 안정을 유지하는 데 도움이 될 것으로 판단된다.
본연구결과와 기존 문헌을 바탕으로 김 산지가격 안정화를 위한 정책적 제언은 다음과 같다.
첫 번째로 김 과잉생산 방지를 위한 대책을 마련하여야 한다. 국내 김 소비가 정체되어있는 작금의 상황에서 김 과잉생산에 따른 김 재고의 적체는 김 산지가격을 하락시키는 직접적인 원인이 된다. 또한, 김 수출 호황에 따른 김 양식어가의 시설 증대 의향이 갈수록 높아져 시설량이 큰 폭으로 증가하고 있고, 이는 김 과잉생산의 또 다른 주요 원인으로 지목되고 있다. 하지만 수출 실적이 목표치를 달성하지 못하게 되면, 재고의 적체는 더욱 가중된다. Lee et al.(2018)에 따르면 과잉생산에 의한 김 수급불균형 해소 및 시장 안정은 최소 2년 이상의 시간이 걸린다고 하였고, 적체가 가중될수록 그 기간은 더욱 연장될 수 있다. 김 과잉생산 방지를 위한 대책으로 Lee et al.(2018)은 김 과잉생산을 가중시키는 불법 양식시설 정비를 통한 안정적인 김 생산 시스템 구축 조성을 제안했고, 생산자의 자율적인 수급조절 체계 마련과 소비자 기호 파악을 통한 국내 소비 확대 방안, 안정적인 수출을 위한 해외시장에 대한 지속적인 모니터링을 제안한 바 있다. 반면, 김 과잉생산 방지를 위한 대책과 함께 지구온난화에 따른 겨울철 이상 고수온 현상과 어기 초 잦은 태풍으로 인한 김 공급 차질로 야기될 생산량 급감에 대한 대안으로 김 채묘와 양식시기 조절과 고수온에 강한 김 품종 개발 등과 같은 대책 마련도 시급하다(Baek et al., 2020).
두 번째로는 김 가공업의 구조 개편을 들 수 있다. 전국 김 생산량의 70% 이상을 차지하는 전남의 경우, 마른김 가공업체수 역시 전체의 80%가량을 차지하고 있다. 마른김 가공업체들은 김 양식 시기인 10월에서 이듬해 5월 사이에 마른김으로 가공할 다량의 원물인 물김을 확보해야 한다. 더욱이 김 수출의 증가로 김 가공업체들은 당해의 김 생산량 증감을 떠나 원물 확보를 위한 매수세로 인해 과당경쟁이 일어난다. 일반적으로 김 양식어기 말에는 품질저하 등의 원인으로 산지가격이 하락하는 것이 일반적인 추세였지만, 가공업체들의 원물 확보 경쟁이 더욱 거세진 가운데 어기말 산기가격은 기존과 다른 양상을 보인다. 물김 확보를 위한 과당경쟁은 결국 대규모 가공업체와 중소형 가공업체들 간 경영상의 확연한 양극화를 초래하게 되고, 중소형 가공업체들은 심각한 경영난에 빠지며 도산의 위협에 노출되게 된다. 이와 같은 문제점의 개선 방안으로는 김 양식어가와 김 가공업체들 간에 상생할 수 있는 공동협력 체계 구축이 필요하며, 김은 여타 수산물과 다르게 대부분 가공을 거쳐 판매되기 때문에 생산과 가공을 경쟁 관계의 둘로 떼어 놓고 볼 것이 아니라 생산의 범주에 놓고 함께 고려되어야 한다(Baek EY, 2020).
세 번째로는 김 등급제 도입을 통한 장기적인 관점에서의 고부가가치 산업으로의 도약이다. 현재 국산 김은 다른 국가의 김에 비해 품질은 우수하지만, 제값을 받지 못하는 실정이다. 국내 김 산업은 그동안 중국과 일본에 비해 낮은 수출 단가로 해외시장에서 많은 수요를 유지할 수 있었다. 하지만 해양수산부가 2017년‘김 산업 발전방안’을 통해 발표한‘2024년까지 연간 김 수출 10억달러(1조원) 규모의 수출주도형 글로벌 식품산업으로 육성한다’는 목표를 달성하기 위해서는 기존과 같은 양적 생산만으로는 한계가 있다. 따라서 국내에서도 김 산업의 육성을 위해서는 규모화, 첨단화와 함께 중국과 일본처럼 국가가 김 제품 차별화를 위해 품질 등급제를 도입해서 고급 김을 생산하고, 중국과 일본에 비해 높은 수출단가를 통해 국산 김이 해외시장에서 경쟁력을 갖추도록 해, 국산 김의 부가가치를 높여야 한다(Baek et al., 2017 ; ISUSANIN, 2020).
넷째로는 4차산업의 핵심인 빅데이터(Big data) 축적과 머신러닝(Machine learning)을 통한 김 가격 예측 고도화로 안정적인 김 수급전망 시스템을 구축해 김 산지가격의 안정을 도모하고, 생산자와 소비자의 후생을 증대하는 것이다.
머신러닝은 알고리즘에 따라 빅데이터에 담긴 정보를 학습하여 예측하는 메커니즘으로, 머신러닝을 활용한 예측 활용방안은 다양하다. 하지만 변수의 미래값을 예측하는 모델에는 갑작스러운 변수의 충격반응은 투영되어 있지 않은 것이 예측의 본질적인 한계이므로, 모델을 설계하는 연구자의 직관적 조정과 통찰력을 반영한 정성적 평가가 중요하다. 또한, 머신러닝의 알고리즘은 빅데이터를 기반으로, 데이터에 담긴 정보를 학습하기 때문에, 실시간 기록되는 양적 데이터 구축뿐만 아니라, 질적으로도 유용하고, 신뢰 가능한 정보를 축적하고 사용하는 것이 중요하다. 이를 기반으로 빅데이터 정보를 활용한 머신러닝 기법을 김 가격 예측에 활용한다면 관계자들의 김 생산량 조정과 출하시기 변경과 같은 의사결정에 스마트하게 활용 가능하다고 판단된다(Lee SK, 2018).
선행연구에서 언급했듯이 수산물 가격 예측 연구 분야는 다양한 모형을 통한 예측과 예측력 검정 연구가 비교적 미흡해서, 본연구에서는 지수평활법과 ARIMA 모형을 통해 더욱 확장을 시도하였으나 한계점 역시 존재한다.
본연구는 김 양식 주산지인 전남지역을 대상으로 했지만 김은 생산지역과 방법, 시기에 따라서 위판가격의 차이가 있으므로 향후 산지별, 생산 방법별로 세부적으로 나누어 예측해볼 필요가 있다. 하지만 대부분 계통판매로 출하되는 김의 경우 산지별 가격은 국가통계포털인 KOSIS에서 다른 수산물에 비해서 비교적 정확한 정보를 얻을 수 있지만, 산지별로 양식 방법까지 구분되어 있지 않은 것이 현실이다. 전남지역에서도 여러 산지별로 구분해서 분석해볼 수도 있지만 보다 지역별 특성이 반영된 예측을 위해서는 품종별, 양식 방법별 등 향후 보다 체계화된 데이터 수집 시스템 구축이 요구된다.
향후 연구과제로는 김 산지가격은 수요처인 가공업체 분포와도 밀접한 관련성이 있어 향후 회귀분석을 통한 김 산지가격과 김 가공업체 분포의 관계를 파악해볼 수 있고, 김 위판가격은 김 생산량과 밀접하게 연관되어 있어 추후 김 생산량 예측모형으로 확대 분석할 필요가 있다. 더욱이 김 위판가격과 김 생산 산지별 해양환경 변수를 포함한 회귀분석과 주성분 분석(PCA)을 통한 분석 및 예측도 충분히 연구 가치가 있다고 생각된다.
김 위판가격 및 생산량 시계열 분석 연구 자료의 지속적인 축적을 통해 예측력이 향상된다면 수산물 수급조절의 기초자료로 널리 활용될 것으로 기대하며, 앞으로 새롭게 개발되는 다양한 예측모델을 통해서 예측력을 더욱 향상해야 한다.
Acknowledgments
이 논문은 김태형(2020)의 박사논문 일부를 발췌·수정하여 게재한 논문임.
References
- Ahn SM(2016). A Study of the Effect of Sustainability Management on Organizational Performance in Public Sector Organizations. Master thesis, Seoul National University.
- Ahn YG(2019). A Study on the Prediction of the World Seaborne Trade Volume through the Exponential Smoothing Method and Seemingly Unrelated Regression Model. Korea Trade Rev, 44(2), 51~62.
- Baek EY, Lee HD, Lee KY and Kim DY(2017). Purple Laver, Semiconductors of The Sea, 1 Trillion Won Export Strategy. KMI, Weekly Report, 61.
- Baek EY, Noh AH, Kim KW and Lee NS(2020). High Water Temperatures could Disrupt the Supply of Seaweed, The Supply and Demand Management System Needs to be Reorganized. KMI, Weekly Report, 166.
- Baek EY(2020). A Study on the Current State and Problems of Laver Drying-Processing. JFMSE, 32(3), 713~724. [https://doi.org/10.13000/JFMSE.2020.6.32.3.713]
- Box, GE., Jenkins, GM. and Reinsel GC(1994). Time series analysis : Forecasting and control. 3rd Prentice Hall, Englewood Cliffs NJ, 614.
- Choi BO and Choi IC(2007). Monthly Price Forecasting of Fruit-type Vegetables Using Time-Series Analysis. KREI, 30(1), 129~148.
- Ha JH, Seo ST and Kim SW(2019). Evaluation on the Performance of Onion and Garlic Forecasts. KFMA, 2019(0), 559~572.
- Han DJ and Park CH(2018). Comparative Analysis on the Forecasting Power of Squid Retail Price Forecasting Models by Processing Types Considering Seasonality. JFMSE, 30(4), 1471~1483. [https://doi.org/10.13000/JFMSE.2018.08.30.4.1471]
- Hong ES(2017). A Study on the Hybrid National Technical Qualification Demand Forecasting Model through Analysis of Foreign Workforce Policy - Focusing on Foreign Nationality Compatriot(H-2 visa). Doctoral thesis, Myoung-ji University.
- Hwang HM, Song EJ, Park NW and Lee WJ(2016). Analyzing Precipitation Data With Zeroes Using Compound Poisson Distribution. JKDAS, 18(1), 129~140.
- Hyeon SY, Son YH and Yu SU(2015). A Study of the Change Structure and Forecasting of Tourist Demand in Jeju island. JKOS, 19(0), 1~24.
- Hyndman RJ and Athanasopoulos G(2018). Forecasting : Principles and practice. OTexts.
- ISUSANIN(2020). Efforts are Picking Up Speed to Develop a System to Grade the Quality of Korean Purple Laver. http://www.isusanin.com/news/articleView.html?idxno=38160
- Jeong DB(2015). Eviews Solution for Time Series Analyst. Seoul, Korea, Bulls Book, 340.
- Kim Ch and Nam JO(2018). A Study on Asymmetry Effect and Price Volatility Spillover between Wholesale and Retail Markets of Fresh squid. KSFBA, 49(2), 21~35. http://db.koreascholar.com/article.aspx?code=350840 [https://doi.org/10.12939/FBA.2018.49.2.021]
- Kim DJ(2016). A Study on the Convergence Belt of Marine Fisheries. GJERI, 148.
- Kim HJ(2011). The Application of Time Series Analysis under R Environment. JKDAS, 13(1), 331~341.
- Kim JK(2017). Design of Zp-EWMA Control Charts for Very Small Fraction of Nonconforming and Small Shifts. Doctoral thesis, Sungkyunkwan University.
- Kim SG and Kim HY(2016). A New Metric of Absolute Percentage Error for Intermittent Demand Forecasts. International Journal of Forecasting, 32(3), 669~679. [https://doi.org/10.1016/j.ijforecast.2015.12.003]
- Kim TH(2020). A Causality Analysis Regarding the Effects of Climate Change on Laver Production and Examination of Forecast Model for Laver Producer Price. Doctoral thesis, Chonnam National University.
- KMI, Fisheries Outlook Center. https://www.foc.re.kr/
- Ko BH, Kang GC and Kang YS(2012). A Study on the Jeju-do Regional Economic Forecasting Model. KRDA, 24(5), 21~39.
- KOSIS(2020). Fishery Production Survey.
- Lee HY, Yeo MS, and Hong SJ(2017). Comparison of Time Series Forecasting Models in Garlic's Wholesale Price. KREI, 40(2), 55~73.
- Lee JG(2017). R Program Recipes for Time Series Data Analysis. Seoul, Korea, Bulls Book, 472.
- Lee KY, Baek EY and Kim DY(2018). Increased Purple Laver Inventory, The Urgent Need to Prepare Overproduction Measures. KMI, Weekly Report, 94.
- Lee SK(2018). Prediction Tools in the Age of Big Data, How to Use Machine Learning Correctly. POSRI Issue Report, 2018(12), 1-11.
- MOF(2018). A Study on the Improvement of the System for the Quality Development of Dried laver. http://dl.nanet.go.kr/law/SearchDetailView.do?cn=MONO1201909459
- Nam JO and Jeong MJ(2017). Comparison on Forecasting Power and Monthly Producer Price Forecast of Jeju Olive Flounder. Ocean Policy Research, 32(2), 1~21. [https://doi.org/10.35372/kmiopr.2017.32.2.001]
- Nam JO and Noh SG(2011). Forecast and Demand Analysis of Oyster as Kimchi’s Ingredients. KSFBA, 42(2), 69~83.
- Nam JO, BaeK EY and Noh SG(2014). Forecast for Laver Producer Price Using Time Series Models. Ocean Policy Research, 29(2), 271~303. [https://doi.org/10.35372/kmiopr.2014.29.2.010]
- Nam JO, Noh, SG and Baek EY(2012). A Study on Forecasting Oyster Price with Time Series Analysis. Ocean Policy Research, 27(1), 65~94. [https://doi.org/10.35372/kmiopr.2012.27.1.003]
- Ock YS, Kim ST and Ko BH(2007). A Study on the Price Fluctuation and Forecasting of Aquacultural Flatfish in Korea. The Journal of Fisheries Business Administration, 38(2), 41~62.
- Park JS(2015). An Empirical Study on Time Series Analysis of Air Pollutants and Heath Effect : Comparison of GAM and ARIMAX Models. Doctoral thesis, Seoul National University.
- Park TY(2018). A Study on the Short-Term Demand Forecasting Model of Jeju Airport Passenger Using Internet Search Traffic. Master thesis, Seoul National University.
- Rho HJ(2011). An Easy-to-Understand Time Series analysis by Excel and SPSS. Gyeonggi, Korea, Hakhyunsa, 369.
- Um SM(2014). A Study on Marketing Strategy For Regional Airport - Focusing on Induced Demand. Master thesis, Seoul National University.
- Yim ES(2007). A Forecasting Restaurant Sales : Exponential Smoothing Models and ARIMA Model. KJHT, 16(3), 139~154.