# Load Library > library(tidyverse) > library(httr) > library(rvest) > library(jsonlite) 공공데이터 포털에서 발급받은 인증키를 복사한 다음 R 환경변수에 추가 # usethis::edit_r_environ() ## DATAGOKR_TOKEN = '자신의 인증키를 여기에 붙여넣기' ## 이제 '.Renviron' 파일을 저장한 다음 RStudio Restart Session myKey에 R 환경변수를 지정 > myKey main oper res # 응답 결과 확인 > print(x = res) Response [http://openapi.airkorea.or.kr/openapi/services/rest/ArpltnInforInqireSv..
전 세계에는 다양한 유형의 시장 참여자와 금융 상품이 많이 존재합니다. 다양한 시장 참여자들이 존재하는데 국내 주식 시장 한정하여 참여 플레이어들로는 저희와 같은 개인투자자부터 기관, 외국인, 연기금, 신탁, 사모펀드, 기타법인 등 많은 유형의 참여자들이 있습니다. 대표적인 금융 상품 대략적으로 나열을 해보면 부동산, 채권, 주식, 원자재, 외환, 채권, 암호화폐, 귀금속, 산업금속, 원유 등 많이 존재합니다. 대표적인 것만 공부 제대로 해두면 좋다고 생각했지만 공부를 하다보니 금융상품끼리 서로 영향을 많이 준다는 것을 깨닫고 저는 아직도 공부해야 할 것이 많다고 생각합니다. 일단은 제 작은 시드를 운용하면서 아직은 어느 하나 잘한다는 금융상품 영역은 없지만 나름대로 공부하면서 분산을 하려고 노력을 하고..
자산을 배분하는 이야기와는 거리가 있는 내용이지만, 저희가 요리를 하려면 재료를 손질을 해야 하듯이 어떤 데이터를 손질할지 다루는 내용을 이번에 이야기하고자 합니다. 처음에는 종목을 부르는 방법을 서술을 하고자 했지만, 채권이나 다른 나라 지수, 재무제표 등 다소 확장된 금융데이터를 수집하는 방법에 대해 이야기하고자 합니다. 구글에 먼저 'python 개별종목' 이런 식으로 검색하면 아래와 같은 결과가 나타납니다. 조금씩 읽다보면 다양한 패키지(FinanceDatabase, quantstats, yfinance, mplfinance, FinanceDataReader 등)와 API(Naver Finance API, FMP API 등)들을 소개해줍니다. 이번 글에서는 작년부터 제가 여러 가지 다양한 Tool..
2019년에 Crawling 공부하면서 정리를 했었던 내용의 일부입니다. 일단 한 페이지 추출 해보기 Load Packages 조회연도 설정 & HTML 요청 실행 응답 결과 확인 Window를 사용하고 있기 때문에 잠시 Locale 변경 HTML에서 Table 태그를 찾아 데이터 일괄 수집 Locale 복구 & Table 출력 이제 loop이용해서 모두 긁어 보기 빈 데이터 프레임 생성 후 반복문 실시 긁은 거 구조 확인 및 마지막 까지 뽑혔는지 확인 일단 한 페이지 추출 해보기 Load Packages library(httr) library(rvest) library(jsonlite) library(tidyverse) 조회연도 설정 & HTML 요청 실행 year % html_node(css = 't..
정규표현식에 대한 이해 하는 만큼 실력이 느는 Part, 많이 연습하면 외워지겠지만, 매번 검색해서 찾아보는 것을 추천. 패턴(규칙)을 갖는 문자열의 집합을 표현하는 데 사용하는 언어 복잡한 문자열에서 특정한 패턴과 일치하는 문자열을 찾고, 대체하기 위해 사용됨 정규표현식 기능을 많은 프로그래밍 언어에서 제공하지만, 문법에 있어선 프로그래밍 언어간 다소 차이가 있음 R에서 사용되는 정규표현식의 특징은 escape 문자가 두번(\\) 사용된다는 것임 정규표현식 내에서 띄어쓰기 하면 인식 X 정규표현식 기본 문법 1 한 글자만 해당됨 정규표현식 포함되는 패턴 \\w 숫자 \\s \\w의 반대 \\D \\s의 반대, 대문자는 모두 반대로 생각하면 된다. \\p{Hangul} 모든 문자 (공백 포함, 단, \r..
저도 주식을 시작한 지 곧 1년이 다되어가지만, 주변에 많은 사람들이 주식을 시작하는데 무엇부터 해야 할지 모르겠다고 많은 질문을 받습니다. 저도 체계적으로 배운 것은 아니지만, 여가 시간에 책이나 유튜브를 보면서 많이 공부해서 여기까지 온 것 같습니다! 유튜브에 수많은 주식 유튜버들 있습니다. 하지만 제 수익과 멘탈, 마인드를 잡는 데 있어서 큰 기여를 한 유튜버들을 정했습니다. (선정하고 보니, 계좌인증도 하셨던 유튜버들이 많네요. 그만큼 실력이 출중하시다는 것이죠!) 일단 제 나름의 기준대로 나누어서 한번 추천을 해보겠습니다. 여기에 작성한 유튜버들은 아무런 관계가 없으며, 저만 알고 싶어하는 유튜버지만 글을 읽으시는 분들에게 알려드리고자 합니다. 1. 월가 아재의 행복한 투자(21.7.13일 기준..
stringr 패키지 소개 stringr 패키지 주요 함수 1 : 패턴 포함 여부 확인 stringr 패키지 주요 함수 2 : 패턴을 한 번 또는 모두 삭제 stringr 패키지 주요 함수 3 : 패턴을 한 번 또는 모두 교체 stringr 패키지 주요 함수 4 : 패턴을 한 번 또는 모두 추출 stringr 패키지 주요 함수 5 : 문자열 인덱스로 자르기 stringr 패키지 주요 함수 6 : 문자열 하나로 묶음 stringr 패키지 주요 함수 7 : 문자열 구분자로 분리 stringr 패키지 주요 함수 8 : 양 옆의 공백 제거 stringr 패키지 소개 R에서 문자 데이터를 다루는 데 필요한 주요 함수를 담고있음 다음과 같은 기능들 가능 패턴을 포함하고 있는지 확인 (str_detect) 패턴을 삭..
'현대 포트폴리오 이론'이라는 단어를 들어보셨나요? 구글에 검색하면 많은 자료들이 나옵니다. 나무 위키에서는 이렇게 정의를 합니다. 핵심은 아래와 같습니다. 해리 마코위츠가 1952년 발표한 재무관리 이론. High Risk, High Return이란 말이 의미하듯이 어떤 자산으로 높은 수익을 얻고 싶다면 높은 위험을 감수해야 하고 낮은 위험을 원한다면 낮은 수익밖에 얻지 못한다. 즉 위험과 수익은 서로 간에 상충관계를 가지고 있다. 하지만 여러 가지 자산을 섞어서 투자하게 되면 동일한 수익률을 유지하면서도 위험을 특정 하한선까지 줄이는 것이 가능하다. 분산투자라는 단어를 정말 많이 들어보셨을 겁니다. 근데 그 의미를 제대로 이해하고 실천하는 사람들은 상당히 적습니다. 자산군 여러 곳에 분산해서 투자하라..
2019년에 Crawling 공부하면서 정리를 했었던 내용의 일부입니다. Selenium 이해 Java JDK 설치 RSelenium 패키지 소개 크롬 드라이버 버전 확인 크롬 드라이버 설정 Rselenium 패키지 주요함수 1 : remote driver 설정 Rselenium 패키지 주요함수 2 : remote web browser 제어 Rselenium 패키지 주요함수 3 : 웹사이트 접속 Rselenium 패키지 주요함수 4 : HTML 요소 찾기 Rselenium 패키지 주요함수 5 : 글자 입력 Rselenium 패키지 주요함수 6 : 버튼 클릭 Rselenium 패키지 주요함수 7 : 페이지 이동 Rselenium 패키지 주요함수 8 : 창 이동 및 팝업 제거 Rselenium 패키지 주요함..
2019년에 Crawling 공부하면서 정리를 했었던 내용의 일부입니다. Contents Contents JavaScript 사용된 파일 찾기 Step 날짜데이터 활용 - 매우 기초 현재 날짜 반환 현재 날짜 속성 확인 현재 날짜를 숫자 값으로 변환, 1970-01-01로 부터의 누적일 수가 반환됨 현재 날짜를 특정 형태로 변환하려면 format() 함수 사용 Date 객체에 정수를 더하면 미래 일자, 빼면 과거 일자 반환 문자열을 날짜로 변환 'x' 인자에 숫자 0을 할당하면 'origin'인자에 지정된 날짜가 반환 생일을 입력해서 지금까지 살아온 일 수 계산 가능 날짜 데이터 활용 - 크롤링에 활용하기위해 날짜 벡터 생성 시작일자와 종료일자를 각각 지정 후 1, 2일 간격으로 생성 1주일, 1달, 1..