티스토리 뷰


* 본 연구 내용은 한국해양학회의 2017년 춘계학술대회에서 발표한 초록을 옮긴 것입니다.


인공신경망 딥러닝(Deep Learning)을 이용한 엘니뇨 예측성 연구


인공신경망(Neural Networks, NN)을 깊게 구성한 것을 심층신경망(Deep NN, DNN)이라고 부르며 최근의 심층신경망은 새로운 패러다임을 맞이하여 딥러닝(Deep Learning)이라는 신조어로 불리운다. 심층신경망은 그 방법에 따라서 합성곱신경망(Convolutional NN, CNN)과 순환신경망(Recurrent NN, RNN), 심층신뢰망(Deep Belief Network, DBN) 등으로 나누어 진다

CNNDBN은 이미지 인식과 같은 독립자료의 처리에 적합하며, RNN은 언어 인식과 같이 자료의 순서가 중요한 시계열 자료의 처리에 적합하다. 따라서, 시계열의 연속성을 고려하기 위하여 본 실험에서는 RNN의 방법을 사용하였으며, 특히 엘니뇨 예측에 사용되는 전지구 SST 월별 시계열 자료가 38년간(19792016)의 자료이므로 RNN에서 장기 기억을 반영할 수 있는 GRU (Gated Recurrent Unit) 방법을 사용하여 엘니뇨 3.4 지역의 SST를 예측해 보았다

사용된 도구는, 알파고를 개발한 구글이 개방형으로 제공하는 딥러닝 라이브러리인 Tensorflow를 사용하였다.


RNN-GRU는 입력층과 은닉(hidden), 출력층으로 구성되는데 입력층에 필요한 입력자료는 ERA-Interim 전지구 월별 시계열 SST 자료 (19792016, 38년간)를 위경도 방향으로 20도씩 bin으로 나누어 사용하였다. bin은 육지가 포함되어 있는 지역과 예측 대상지역인 엘니뇨 3.4 지역을 제외한 지역에 대해서 평균 시계열 자료를 사용하였다

또 다른 방법으로 전지구 주요 해역을 5개 지역으로 나누어 각 지역에 대하여 EOF 분석 시계열자료를 사용한 실험도 함께 수행하였으나, 2015년과 같은 엘니뇨가 강했던 해는 예측성이 떨어졌으며 그 원인은 원 자료를 2차로 가공하면서 딥러닝 모델의 예측성능을 떨어뜨리는 것으로 판단되었다.


본 실험에서 예측한 기간은 지난 2년간(20152016)으로 매월마다 예측을 하였으며 각 예측에 대하여 미래 8개월까지 예측을 하였다. 예측 기간을 제외한 1979년부터 20145년까지 367년간의 자료는 RNN-GRU의 학습에 사용하였으며 최근의 기후변화에 대한 영향을 고려하기 위하여 딥러닝 학습기간을 최근을 기준으로 36년간과 20년간, 10년간으로 나누어 각각 실험을 하였다. 딥러닝으로 학습된 예측모형은 내부적으로 랜덤함수를 사용하기 때문에 같은 실험이라도 최종 결과에 편차를 발생하므로 동일 실험에 대하여 각각 3번의 앙상블 실험을 하여 평균값으로 그 예측 결과를 대신하였다.


최근의 주요 이슈기간에 대하여 예측결과를 미국 NOAA에서 제공하는 유수 연구소들의 예측결과들과 비교해 보았으며, 2015년 가을의 강한 엘니뇨 뿐만 아니라 최근의 경향을 잘 모의 하는 것으로 나타났다.


그림1. 미국 NOAAClimate Prediction Center에서 제공하는 모델별 앙상블 예측 결과들

(:20157, :20163, :20171)

그림2. 동일 기간에 대하여 관측값(굵은실선)과 순환신경망(RNN)을 이용하여 예측한 결과들 

(:20157, :20163, :20171)