해당 논문은 IoT 및 웨어러블 기기에서 수집된 시계열 데이터의 주석 작업의 어려움을 강조하면서 여기서 (사람이) 인식 가능한 패턴을 찾는 것이 어렵다는 것에 대해 문제를 야기합니다.
지도 학습 기반의 딥러닝 방법은 일반적으로 훈련에 많은 양의 주석이 달린 데이터를 필요로 하기 때문에, 시계열 데이터에 이를 적용하는 것은 어려움이 있습니다. 자기 지도 학습(Self-supervised Learning)은 주석이 없는 데이터로부터 효과적인 표현을 추출하기 위한 방법으로 주목받고 있습니다. 자기 지도 학습으로 훈련된 사전 훈련 모델은 제한된 주석이 달린 데이터로도 비슷한 성능을 달성할 수 있습니다. 여러 가지 자기 지도 학습 접근 방식은 퍼즐을 푸는 것이나 이미지 회전을 예측하는 것과 미리 정해진 태스크를 기반으로 사전 학습하는데 이러한 방식은 학습된 표현의 일반성을 제한할 수 있습니다.
대조 학습은 증강된 데이터로부터 불변한 표현을 학습하는 자기 지도 학습 기법으로, 동일 샘플의 다른 관점 간 유사성을 극대화하고 다른 샘플의 관점과의 유사성을 최소화합니다. 그러나 기존의 이미지 기반 대조 학습 방법은 시계열 데이터에는 잘 작동하지 않습니다. 이는 시계열 데이터의 시간적 종속성을 다루지 못하고 이미지 증강 기술과 시계열 데이터 간의 불일치 때문입니다. 시계열 데이터에 대한 대조 학습 방법은 몇 가지 제안되었지만, 특정 응용 프로그램을 위한 것이 주로이며 일반화가 부족합니다.
이러한 도전을 극복하기 위해 저자들은 시계열 데이터에 맞춰진 단순하고 효율적인 데이터 증강을 사용하는 "시계열 및 문맥 대조를 통한 시계열 표현 학습 프레임워크(TS-TCC)"를 제안합니다.
이 프레임워크는 입력 데이터의 두 가지 상관된 관점을 만들기 위해 데이터 증강을 활용합니다.
시간 대조 모듈을 도입하여 견고한 표현을 학습하기 위한 어려운 교차 관점 예측 작업을 설계합니다. 이 모듈은 한 시간 단계에 대해 한 증강의 과거 잠재 특징을 다른 증강의 미래를 예측하는 데 사용하여 모델이 다른 시간 단계와 증강에 의해 도입되는 견고한 표현을 학습하도록 합니다.
또한, 시간 대조 모듈에 의해 학습된 견고한 표현을 기반으로 판별적인 표현을 학습하기 위해 문맥 대조 모듈을 제안합니다. 이 문맥 대조 모듈은 동일한 샘플의 다른 문맥 간 유사성을 극대화하고 다른 샘플의 문맥 간 유사성을 최소화하는 것을 목표로 합니다.
https://arxiv.org/pdf/2106.14112.pdf
'Time Series' 카테고리의 다른 글
[NeuraIPS' 23] Self-supervised Contrastive Pre-training for time series via Time-Frequency Consistency 공부 (0) | 2023.05.17 |
---|