호돌찌의 AI 연구소
728x90
article thumbnail
[퀀트 논문 간단 리뷰] Buy Tesla, Sell Ford: Assessing Implicit Stock Market Preference in Pre-trained Language Models

두 번째 리뷰 Paper는 "Buy Tesla, Sell Ford: Assessing Implicit Stock Market Preference in Pre-trained Language Models"입니다. 제목을 간단하게 번역하면 "(테슬라 사고 포드 파세요~) 사전 훈련된 언어 모델(PLM)에서 내재된 언어 모델 주식 선호도 평가"라고 해석이 가능합니다. 언어 모델이 발달함에 따라서 여러 도메인에 많이 보급이 되었고, 이전에 소개한 논문리뷰 "FinBERT" 언어 모델 또한 그렇습니다. 여기 논문에서는 언어 모델이 전반적으로 주식 시장에 선호하는 편향을 가지고 있으며, 섹터들끼리 또는 섹터 내에서 선호도 차이가 상당하다는 것을 발견했다는 논문입니다. 이러한 문제에 대한 인식을 가져봐야 한다는 논문입..

article thumbnail
[퀀트 논문 간단 리뷰] FinBERT - A Large Language Model for Extracting Information from Financial Text

퀀트 전략 관련하여 간접적으로 도움이 될 만한 논문들을 여유가 될 때마다 리뷰하고자 합니다. 하지만 그냥 일반적으로 유명하다고 알려진 논문보다는 필자가 직무는 AI 쪽에 조금 더 가깝고 퀀트는 취미이기 때문에 조금 색다른 내용들 위주로 소개할 예정입니다. 이전에 대안 데이터 관련 글을 작성하였는데, 이와 NLP를 결합한 컨텐츠를 하고자 합니다. 첫 번째 리뷰 Paper는 "FinBERT—A Large Language Model for Extracting Information from Financial Text"입니다. 제목 그대로 Financial Text를 바탕으로 언어 모델을 만든 것인데, 2020년 7월에 첫 버전이 나오고 올해 final revised 된 paper입니다. 참고로 FinBERT라는..

article thumbnail
대안 데이터란 (What is alternative data?)

퀀트에서 주로 활용되는 데이터라 하면 간단하게는 개별종목이나 시장 지수에 대한 등락이나 차트 데이터를 떠올릴 수 있습니다. 조금 더 범위를 확장하면 원자재나 채권이 있을 것이고 올해 시장에 상승 및 하락의 핑계로 가져다 붙이기 좋은 소재이면서 주기적으로 발표하는 신규 실업수당 청구건수나 CPI와 같은 거시경제 지표들을 떠올릴 수 있습니다. 즉, 전통적으로 사용하는 재무제표나 주식 가격 등의 데이터들이 금융업계에서 주로 사용되는 데이터들입니다. 금융자산 시장이 살아있는 한 항상 다양한 시장 참여자들은 항상 시장 초과 수익(편의상 Alpha)를 찾고자 노력을 했었습니다. 하지만 방금 언급한 여러 자산군 데이터(편의상 금융 데이터)에서 나온 논문들은 Alpha가 몇 개월 가지도 못하고 사라지는 현상이 지속되고..

article thumbnail
[도서 추천] 데이터 과학 관련 도서 소개 및 추천 (비전공자 및 문과생을 위한)
도서/기술 2022. 10. 23. 19:00

데이터 과학 일을 하게 되면 눈에 흙이 들어가기 전까지 현업 직장일을 하면서 자기 계발을 끊임없이 해주어야 하는 어마 무시하면서 고통스러운 분야입니다. 하지만 그럼에도 데이터 과학 분야에 관심이 있는 주변 비전공자나 문과생분들이 있습니다. 이러한 유형의 분들을 위해 한번 제 삶을 되돌아보면서 도움이 되었던 도서 및 주변에서 추천해주는 책만을 위주로 한번 서술하고자 합니다. 분야별로 나누어서 서술해보겠습니다. 수학 - 선형대수 만약에 박사 학위까지가 아닌, 석사 학위 까지의 공부를 하여, 데이터 과학을 하는 데 있어 심화되고 깊이 있는 수학적 지식이 필요하다고 생각하지는 않습니다. 하지만 수식 없이 데이터 과학을 배울 수 있다고 약을 파는 사람들은 잘못되었다고 생각합니다. 미분은 고등학교 때 배운 미분과 ..

article thumbnail
[젠포트 전략 구현] 소형주 전략 & 신 마법공식 (Wahal, Sunil and Repetto, Eduardo)

젠포트 전략 구현하기 두 번째 Topic으로는 마법공식입니다. 마법공식으로 유명한 사람은 역시 조엘 그린블라트입니다. 여기서 핵심 컨셉으로는 저평가(가치 지표)와 고수익(수익성 지표)을 basis로 한다는 점입니다. 조엘 그린블라트의 마법공식 자세한 내용은 여기를 참고해보시는 게 좋을 것 같고, 저는 강환국 작가님의 영상에서 이야기하는 '신 마법공식' 관련해서 젠포트로 구현해보겠습니다. 전략 소개 다루고자 하는 전략은 아래 영상을 바탕으로 작성하고자 합니다. 아래 영상은 21년 6월에 나온 영상임을 참고해주시길 바랍니다. 이 글을 읽고 따라 하기 전에 한번 보시는 것을 추천드립니다. (썸네일이 상당하다는 것은 덤입니다.) https://youtu.be/_q1PF8liP48 팩터 및 논문 간단 소개 영상 ..

article thumbnail
Binance API와 ccxt를 활용한 롱/숏 포지션 잡기
Programming/Crypto 2022. 9. 26. 21:59

바이낸스 API를 이용해 선물 거래를 하는 데 있어 이번 글에서는 예시로 BTC/USDT를 대상으로 레버리지 배율을 3으로 하고, 격리 모드에서 롱/숏 포지션을 잡아보도록 하겠습니다. 현물은 매수/매도에 대한 개념이지만 선물에서는 롱(buy) 포지션을 종료하기 위해서 숏(sell)을 수행하고, 반대로 숏 포지션을 종료하기 위해서는 롱을 수행하는 개념입니다. (추후에 여유가 되면 양방향으로 동시에 수행하는 헷지 모드에 대해서도 다루어볼 예정이기도 합니다.) 업비트에서 시장가/지정가 매수/매도 하는 것과 비슷한 맥락을 가지고 있습니다. 아래 글을 참고하면 될 것 같습니다. 2022.06.15 - [Programming/Crypto] - pyupbit 활용 - 코인 매수/매도하기 pyupbit 활용 - 코인 ..

article thumbnail
Binance API와 ccxt를 활용한 선물 계좌 조회 및 선물 거래 시작하기
Programming/Crypto 2022. 9. 19. 21:58

바이낸스 API를 활용해서 선물 거래 잔고를 확인하며 각종 세팅값(격리 유무 및 레버리지 배율 조정) 지정하는 내용을 다룹니다. 또한 롱/숏 포지션을 잡고 포지션을 종료하는 글을 작성해보려 합니다. 이번 글에서 거래하고자 하는 코인은 BTC/USDT로 하려고 합니다. 이를 따라 하기 위해서는 먼저 USDT(테더)를 선물 거래 계좌에 옮겨놔야 하고, 혹시 선물 거래가 처음인 경우에는 거래소에서 위험성을 거래하는 사람에게 알려주기 위해 퀴즈를 풀게 시킵니다. (퀴즈 내용은 주기적으로 바뀌기 때문에 따로 구글에 리서치하는 것을 권장합니다.) 이와 관련된 내용은 URL로 남기겠습니다. 또한 원하는 암호화폐와 타임프레임에 맞는 데이터를 부르는 내용은 아래 글을 참고하시면 됩니다. - Binance 암호화폐 데이터..

article thumbnail
[젠포트 전략 구현] 소형주 전략 & 유진 파마(Eugene Fama)

개인 투자자가 퀀트 투자를 시작하는 데 있어 제일 난이도가 높은 부분은 양질의 주식 종목의 데이터 수집과 품질 검수 부분이라고 생각합니다. 이 부분에 있어 양질의 데이터와 백테스팅을 하는데 도움을 주는 플랫폼으로 젠포트가 있습니다. 퀀트 투자 입문하는데 다양한 팩터와 조건식 함수를 바탕으로 전략을 구현 및 검증을 하고 실전 매매하는데 꽤나 간편한 도구로 평가를 받고 있는데, 유튜브 "할 수 있다! 알고 투자" 채널을 운용중이신 강환국 작가님 나오는 내용을 바탕으로 젠포트에서 구현을 시작해보겠습니다. 전략 소개 다루고자 하는 전략은 아래 영상을 바탕으로 작성하고자 합니다. 아래 영상은 21년 5월에 나온 영상임을 참고해주시길 바랍니다. 이 글을 읽고 따라하기 전에 한번 보시는 것을 추천드립니다. https..

article thumbnail
바이낸스 암호화폐 데이터 부르기 (ccxt를 활용한 binance 암호화폐 데이터 부르기)
Programming/Crypto 2022. 9. 6. 00:05

바이낸스 거래소에서 발급받은 API 키를 활용하여 암호화폐 데이터를 부르는 글을 소개하고자 합니다. 업비트에서는 pyupbit 라는 라이브러리를 활용했었습니다. 이번에는 여러 거래소들의 API 들을 활용하기 좋게 wrapper시킨 ccxt(CryptoCurrency eXchance Trading Library) 라는 라이브러리를 활용할 예정입니다. (또한 이 글은 python을 기준으로 작성할 예정입니다.) ccxt 는 아래 github를 한번 참고해보시면 좋겠습니다. 글의 맥락은 업비트 때와 비슷하다고 볼 수 있습니다. 아래 글들도 한번 참고하면 좋겠습니다. https://github.com/ccxt/ccxt GitHub - ccxt/ccxt: A JavaScript / Python / PHP cryp..

article thumbnail
바이낸스(Binance) API Key 발급하기
Programming/Crypto 2022. 9. 2. 17:39

이번 글은 암호화폐 거래소 중, 압도적인 거래대금 1순위인 바이낸스를 기준으로 작성하고자 합니다. 바이낸스는 API가 다른 거래소에 비해 다루기가 상대적으로 좋다고 알려져 있습니다. 각자 바이낸스 거래소 가입과 인증이 되어있다고 가정하에 API를 발급받는 내용을 기술하겠습니다. 업비트 거래소에서 API 발급을 받는 맥락과 과정이 비슷합니다. 아래 글도 한번 참고해보시면 좋겠습니다. 2022.06.12 - [Programming/Crypto] - Upbit API Key 발급하기 Upbit API Key 발급하기 가상 거래소에서 한국 사람들에게 제일 친숙한 거래소는 Upbit입니다. 옛날에는 상위권에 있었는데 요새는 업비트가 순위가 부쩍 많이 밀려났습니다. 다른 거래소 API를 발급받는 방식이 거의 비 h..