논문 정보
- 제목: 딥러닝을 이용한 센서 패턴의 이상 탐지 성능 평가
(Performance Evaluation of Seonsor Pattern Anomaly Detection Using Deep Learning) - 저자: 인천대학교 정보기술대학원 임베디드시스템전공 김영섭 (지도교수: 강우철)
- 2018년 12월 (석사학위논문)
- https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE10583102
제 1 장 Abstract
최근, 다양한 연구 분야에서 자동화 기계 운영을 위해 센서로부터 실시간 데이터를 수집하고 분석하고 있다. 하지만 기기의 고장 및 환경의 변화 그리고 센서 오작동 등의 문제로 수집 데이터에 비정상적인 값, 즉 이상치가 포함된다면 경제적 손실뿐만 아니라 안전에도 큰 위험을 끼칠 수 있다. 따라서 센서의 시계열 데이터에 대한 실시간 모니터링 및 이상 탐지는 자동화 공정에 필수적인 요소 중 하나이다.
본 논문에서는 여러 산업 분야에서 센서의 이상 탐지(Anomaly Detection)를 딥러닝 기술을 기반으로 탐구한다. 수집되는 센서 데이터가 시계열 데이터임을 감안하여 순환 신경망 모델(RNN, Recurrent Neural Network)을 활용하며, 이를 통해 현시점의 출력값에 이전 시점의 데이터가 영향을 미치도록 한다.
전반적은 논문의 구성은 아래와 같다.
논문의 제2장에서는 실험에서 사용한 딥러닝 모델의 구조와 센서 그리고 이상 탐지에 대한 이론적인 배경에 대해 설명하였으며, 제3장에는 센서의 패턴을 학습하고 예측 한 후 이상 탐지를 측정하는 전반적인 실험 방법을 제시했다. 제4장에서는 3장에서 제시한 실험 방법을 이용하여 각각의 센서 패턴의 특성에 따라 이상 탐지의 측정을 진행하였으며 딥러닝 모델, Unit size, Window size를 기준으로 이상 탐지율의 변화를 평가 및 분석하였다. 마지막으로 제5장에서 실험의 전체적인 결론으로 마무리하였다. (논문 4페이지, '1.3. 논문의 구성')
제 2 장 이 론 적 배 경
2.1. 딥러닝 모델
2.1.1. RNN (Recurrent Neural Network)
RNN(Recurrent Neural Network)은 현재 시점과 다음 시점을 연결하여 여러 개의 데이터가 순서대로 입력 되었을 때 이전 시점의 데이터가 유지 되도록 반복(Recurrent)의 개념이 추가된 것으로, hidden state에 이전 시점의 데이터를 기억하여 학습이 진행되므로 시계열 데이터에 내재되어 있는 패턴과 특성을 파악하는데 적합한 모델이다. 이는 기존의 feed-forward neural networks의 확장으로 변동이 심한 시계열 길이의 입력을 처리하는데 적합하다.
RNN은 이전 시점의 출력값이 현재 시점의 값에 영향을 주기 때문에 시계열 데이터에 적합하다는 장점이 있지만, 만약 입력값이 길어지게 되면 출력값들이 곱해지는 단계가 반복되기 때문에 누적값이 증가하는 explode 문제 또는 0으로 수렴하는 vanish 문제가 발생하여 학습이 어려워진다.
이러한 RNN의 장기의존성(Long-Term Dependency) 문제를 해결하기 위해 변형된 형태가 LSTM과 GRU 모델이다.
2.1.2. LSTM(Long Short-Term Memory)
LSTM 모델은 RNN과 비슷한 구조를 가지고 있지만 세 개의 gate(forget, input, output)라는 요소를 이용하여 정보를 제어하며 이를 cell-state를 통해 각 gate의 연산된 값을 전달하게 된다. 그렇기 때문에 각 단계에서 content를 덮어쓰는 기존의 RNN 과는 다르게 LSTM은 gate들을 통해 기존의 memory를 유지할 것인지, 아니면 삭제할 것인지의 여부를 결정하기 때문에 long-term의 정보를 쉽게 전달할 수 있게 된다.
Cell-State는 LSTM 모델에서 장기 기억을 유지한다. 정보가 흐르는 경로로서, 필요에 따라 게이트들이 이 정보를 수정하거나 삭제할 수 있다. 또한 이전 상태의 정보가 얼마나 많이 남아 있을지, 그리고 새로운 정보가 얼마나 추가될지가 결정되며, 이는 시퀀스 전체에서 중요한 정보를 오랜 시간 동안 유지하는 데 도움이 됩니다.
그럼 LSTM의 세 가지 gate(Forget, Input, Output)에 대해 알아보자.
1) Forget Gate
Forget Gate는 현재 입력과 이전 숨겨진 상태(히든 상태)를 기반으로 0과 1 사이의 값을 출력하여, Cell State에서 어떤 정보를 잊어야 할지 결정한다.
2) Input Gate
Input Gate는 새로운 정보를 cell-state에 추가할지 여부를 결정하며, 중요한 정보를 업데이트한다. 그리고 이를 통해 현재 입력된 정보를 cell-state에 얼마나 반영할지 결정한다.
3) Output Gate
Output Gate는 Cell State에서 어떤 부분이 다음 단계로 출력될지 선택하여, 다음 hidden state로 어떤 정보를 출력할지 결정한다.
2.1.3. GRU(Gated Recurrent Unit)
GRU는 LSTM의 계산 복잡성을 간단하게 만든 Cell 구조이며, gate는 update와 reset 두 가지로 구성되어 있다. Update Gate는 LSTM의 Forget Gate와 Input Gate를 결합한 것으로 별도의 Cell-State와 Hidden State를 하나로 합친 구조로 이루어져 있다.
아래는 GRU의 구조를 모형화한 것으로, LSTM의 모형 구조와 유사하지만 gate의 수를 줄이고 복잡한 구조를 단순화 시켜 학습 시간이 더 짧게 걸리고 보다 적은 데이터로도 학습이 가능하다.
2.2. 센서 이론
본 실험에서는 다양한 센서 패턴의 이상 탐지 활용도를 실험하고자 각각 모양, 범위, 크기가 다른 온도(Temperature), ECG(Electrocardiography), 진동(Vibration) 센서 패턴을 구성하여 실험을 진행하였다.
2.2.1. 온도 센서
온도 센서는 물체의 온도를 감지하여 진기 신호로 바꾸어 주는 센서로, 주로 온도의 변화에 따른 환경 관리와 제어 등을 목적으로 사용되는 부품이다. 온도 센서를 분류하는 방법에는 감지 원리, 센서 종류, 측정 방법 등 여러 가지 분류 방법들이 있으며, 가장 보편적인 '측정 방법에 의한 분류' 방식에는 접촉식과 비접촉식 두 가지가 있다.
2.2.2. Electrocardiography(ECG, 심전도) 센서
ECG(심전도)는 사람의 몸에 전극을 부착하여 일정 시간 동안 심장 박동이 이루어지는 순차적인 전기적 활동을 증폭하여 기록한 패턴이다. 심장의 상태를 측정하는데 널리 사용되고 있으며, ECG 패턴이 정상적인 경우에는 거의 일정한 주기와 규칙적인 리듬을 발생하기 때문에 심장의 비정상적인 리듬을 측정하고 진단하는 가장 좋은 방법으로 꼽힌다.
2.2.3. Vibration(진동) 센서
진동을 계측하는 것은 진동상태를 평가하기 위한 단순 계측으로부터 기계, 구조물 등의 동특성을 파악하고 작동 상태를 알기 위한 복잡한 계측까지 다양한 산업체에서 광범위하게 사용되고 있는 기술이다. 진동은 동역학적인 현상이므로 운동학적인 관점에서 시간에 따른 변위의 변화 또는 속도, 가속도 및 운동학적인 관점에서 힘 등의 양으로 나타낼 수 있다.
다음 내용이 궁금하시다면 아래 링크를 참고해주시기 바랍니다.
https://sunnybae1023.tistory.com/22
'Paper Review' 카테고리의 다른 글
[Paper Review] 딥러닝을 이용한 센서 패턴의 이상 탐지 성능 평가(김영섭) 논문리뷰 2 (0) | 2024.08.26 |
---|---|
[Paper Review] Deep Learning (Yann LeCun, Yoshua Bengio & Geoffrey Hinton) 논문 리뷰 1 (4) | 2024.02.12 |