호돌찌의 AI 연구소
article thumbnail

퀀트에서 주로 활용되는 데이터라 하면 간단하게는 개별종목이나 시장 지수에 대한 등락이나 차트 데이터를 떠올릴 수 있습니다. 조금 더 범위를 확장하면 원자재나 채권이 있을 것이고 올해 시장에 상승 및 하락의 핑계로 가져다 붙이기 좋은 소재이면서 주기적으로 발표하는 신규 실업수당 청구건수나 CPI와 같은 거시경제 지표들을 떠올릴 수 있습니다. 즉, 전통적으로 사용하는 재무제표나 주식 가격 등의 데이터들이 금융업계에서 주로 사용되는 데이터들입니다. 

금융자산 시장이 살아있는 한 항상 다양한 시장 참여자들은 항상 시장 초과 수익(편의상 Alpha)를 찾고자 노력을 했었습니다. 하지만 방금 언급한 여러 자산군 데이터(편의상 금융 데이터)에서 나온 논문들은 Alpha가 몇 개월 가지도 못하고 사라지는 현상이 지속되고 있습니다. 특히 시장 평균 수익(편의상 Beta)이 강한 미국 시장은 더욱 그러한 경향을 가지고 있습니다. 이번 글에서는 전통적인 금융 데이터 대신 초과수익을 뜻하는 Alpha를 더욱 창출하기 위해 공수를 들이고 있는, 새로운 종류의 데이터를 바로 대안 데이터(Alternative Data)에 대해 이야기하고자 합니다.

 

 

 

대안 데이터(Alternative Data)의 예시


위에서 전통적인 금융 데이터들에 대한 설명을 했다면 대안 데이터들의 예시 & 활용은 간단하게 이렇게 정리가 가능할 수 있습니다.

 

Ex1) 인공위성을 바탕으로 월마트 주차 사진을 파악하여 자동차의 수를 세어 트렌드를 파악하여 매출을 예측, 그 이후 기업의 다음 분기 어닝이 좋을 것인지 아닌지 예측하기

Ex 2) 익명화 처리가 된 사람들의 이동 데이터를 바탕으로 매장 방문 횟수를 추정하여 신규 출시된 상품들(ex. 아이폰 vs 갤럭시) 매출 및 승자 예측하기

Ex 3) 레딧이나 트위터와 같은 SNS 텍스트 데이터 또는 뉴스 데이터를 바탕으로 기업 및 종목, 가격 등에 대한 감성 분석(Sentiment)을 하여 시장의 Trend를 파악하면서 활용하기

Ex 4) GPS를 이용하여 유동인구 데이터, 웹 트래픽과 클릭을 이용한 각종 웹 행동 데이터(인간의 행동 데이터)

Ex 5) 스마트 워치와 같은 기기에서 측정되는 신체데이터,  그 이외에 각종 사물인터넷(IoT)에 적재되는 데이터

 

이외에도 여러 대안 데이터 예시들을 그림으로 나타낸 것은 아래처럼 나타낼 수 있을 것 같습니다. 

 

https://smallake.kr/?p=22814

 

 

대안 데이터(Alternative Data)의 활용


대안 데이터 이외에 보통 금융 데이터를 바탕으로 기존 로보어드바이저에서 활용되는 머신러닝이나 AI는 아래와 같은 경우입니다. 자산배분 한정해서만 소개하면 아래와 같습니다. 

 

https://www.sktechsummit.com/exhibition  (SK㈜ C&C 금융 AI 플랫폼 '마켓캐스터')

 

위에서 대안 데이터들을 바탕으로 개별종목의 특정 성과 등을 예측할 수도 있겠지만, 매매나 투자에 있어 새로운 의사결정 요소로도 활용을 하거나 종합적인 모델링의 Input으로도 활용을 할 수 있습니다. 아래 그림에서 뉴스 데이터를 모델의 Input으로 활용하여 자산군 예측 또는 이벤트 모델에 활용되는 것을 알 수 있습니다.

 

https://www.sktechsummit.com/exhibition  (SK㈜ C&C 금융 AI 플랫폼 '마켓캐스터')

 

 

마무리


 이러한 대안 데이터들이 트렌드라고 하여도 수익을 가져다준다는 보장이 없습니다. 대안 데이터를 어떻게 활용할지는 파일럿에 따라 천차만별이기 때문입니다. 이러한 대안 데이터는 대부분 아마 AI 모델링을 위해 활용이 될 것인데, 사람들의 생각처럼 복잡도가 높은 모델링을 할수록 그에 맞는 복잡도가 높은 알고리즘을 사용해야 하고, 그에 맞게 수많은 데이터들을 수집해야 합니다. 모델에 활용하는 것이 아니면, 또 투자 의사결정에 있어 색다르고 Edge로 활용이 되는 지표로도 사용이 될 수도 있습니다. 이러한 허들을 뛰어넘어 Alpha를 창출한다면 그 기쁨은 배가 될 수 있을 것입니다. 하지만 그 초과 수익이 Alpha가 아닌 수익을 거두었던 시기 내에서 리스크가 높았던 팩터로만 그칠 수도 있기 때문에 많은 검증이 필요하기도 합니다. 항상 남들보다 평균 이상으로 돈 버는 것은 상당히 어려운 숙제인 것 같습니다. 

 

추후에 이러한 데이터들로 수익을 가져다 주었다는 논문들이나 디테일한 사례들을 소개하는 글들로 찾아뵙겠습니다.

 

* 출처 

1. https://www.sktechsummit.com/

 

SK TECH SUMMIT

SK 그룹의 새로운 기술적 성취와 의미 있는 경험을 공유합니다. 지금 바로 등록하세요!

www.sktechsummit.com

2. https://smallake.kr/?p=22814 

 

Alternative data is the new alpha | 그대안의 작은 호수

트레이딩전략, 핀테크와 블록체인 1. 기술의 시대를 대변했던 고빈도매매가 잦아들면서 등장한 데이타. 전통적인 의미의 데이타와 다름을 강조하기 위하여 사용하였던 빅데이타가 시대의 흐름

smallake.kr

3. https://youtu.be/ami4JyGjMmg?list=PLE1Uaw0WKBCzGK0-N6TnpSEAJ3DXFNX-4  (Alpha, Beta)

4. "당신의 삶에, 버려 마땅한 기억은 없다" 비매품 도서 참고

profile

호돌찌의 AI 연구소

@hotorch's AI Labs

포스팅이 도움이 되셨다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!