데이터 과학 일을 하게 되면 눈에 흙이 들어가기 전까지 현업 직장일을 하면서 자기 계발을 끊임없이 해주어야 하는 어마 무시하면서 고통스러운 분야입니다. 하지만 그럼에도 데이터 과학 분야에 관심이 있는 주변 비전공자나 문과생분들이 있습니다. 이러한 유형의 분들을 위해 한번 제 삶을 되돌아보면서 도움이 되었던 도서 및 주변에서 추천해주는 책만을 위주로 한번 서술하고자 합니다. 분야별로 나누어서 서술해보겠습니다.
수학 - 선형대수
만약에 박사 학위까지가 아닌, 석사 학위 까지의 공부를 하여, 데이터 과학을 하는 데 있어 심화되고 깊이 있는 수학적 지식이 필요하다고 생각하지는 않습니다. 하지만 수식 없이 데이터 과학을 배울 수 있다고 약을 파는 사람들은 잘못되었다고 생각합니다. 미분은 고등학교 때 배운 미분과 +alpha로 편미분 정도까지 알아도 괜찮다고 생각합니다. 하지만 하나의 숫자가 아닌, 병렬된 여러 행과 열의 숫자를 연산하는 수학인 선형대수는 매우 중요한 영역입니다. (현재 고교 교육과정에서 행렬과 벡터가 빠져있는 것이 AI 시대에 잘못되었다고 생각합니다.) 이 선형대수 부분은 추후에 머신러닝 분야에서 상당히 중요한 선행 과목의 포지션에 있습니다. 유튜브에 대학교 1학년 수준인 기초적인 선형대수 과목 하나를 듣는 것도 좋다고 생각합니다.
1. 프로그래머를 위한 선형 대수
다소 옛날에 나온 책이지만 쉽게 설명한 책은 못본 것 같습니다. 직관적인 설명에 포커싱 되어있는 책이라 문과생들도 쉽게 이해할 수 있을 것입니다.
2. 코딩 더 매트릭스
위에 소개한 책보다는 확실히 어렵고 두께가 상당합니다. 프로그래밍 경험이 많은 사람들에게 조금 더 이해하기 쉬우며, 영어로 된 용어들이 한국어로 번역이 되어 나타나서 조금 딱딱하게 느껴질 수 있는 책이지만 다루는 내용들은 빠짐없이 다루고 있어서 괜찮다고 생각되는 책으로 선정하였습니다. 분명 읽으시면 지루함이 생기기 마련이라, 코딩을 조금 더 깊게 알고자 하는 분들에게 추천합니다.
통계
빅데이터 및 딥러닝 시대가 오면서 통계학을 상대적으로 컴퓨터과학보다 낮게 평가하는 사람들도 있지만, 생각보다 적은 수의 데이터를 다루는 일도 꽤 많이 부딪힐 수 있습니다. 적은 데이터를 다룰수록 전통적인 통계 방법론이나 검정방법을 쓰는 일이 잦아지기 때문에 기초를 잘 다져 놔야 합니다.
1. 세상에서 가장 쉬운 통계학 입문, 베이즈통계학 입문
대학교 1학년 수준의 기초 통계 수업을 들어도 좋지만 더더욱 쉬운 수준의 책을 소개하자면 다음과 같습니다. 두 개의 책은 정말 필요한 부분만 간추려 쉽게 이해한 부분이 있고 중요한 항목을 단 시간에 이해할 수 있게 포커싱을 한 도서라고 생각합니다.
2. 데이터 과학을 위한 통계
작년에 2판으로 나오고, R과 Python 예제를 동시에 지원해주는 도서입니다. 위의 도서는 정말 초보에게 포커싱 된 책이라면, 이 책은 조금의 통계에 대한 basis가 있으면서 데이터 과학 업무를 하다 remind 하면서 기초를 닦을 수 있는 좋은 책이라 생각합니다.
코딩, Python
개인적으로 코딩에서 새로운 언어를 책으로 공부하는 것을 반대하는 편입니다. 그 이유는 의지가 정말 안 생기는 게 제일 크기 때문입니다. 개인적으로 프로그래밍 언어의 시작은 유튜브에서 6시간, 9시간 짜리 영상으로 시작하여 기본기를 따라하고 실용적인 것을 만들면서 흥미와 실력을 같이 키우는 것이 제일 좋다고 생각합니다. 하지만 그나마 전반적으로 중요한 것을 전부 다루며 공부할 분량을 잘 나누어 놓았다고 생각하여 아래 python 도서를 추천합니다.
통계 관련 교양 서적
위에 구성한 교재들이 내용면이나 이해도 측면에서 집중하여 소개를 했지만 다소 정말 딱딱한 책들로 구성이 되었다고 생각합니다. 환기를 시켜줄 만한 교양 느낌의 서적들을 추천하면 다음과 같습니다.
1. 린 분석
다소 오래된 책(2014)이지만 데이터로 분석 하는 것이 어떤 것인지, 사례들을 통해 알려주는 괜찮은 도서라고 생각합니다.
2. 팩트풀니스
평소의 인지 과정을 데이터를 통해 잘못된 길로 이끌 수 있는 책을 보여주는 도서입니다.
이 글을 마치며 (명심할 부분)
여기 글에서 머신러닝과 딥러닝과 도서는 제외하였습니다. 그 이유는 처음 들어보면 멋있어 보이고 Fancy 해 보이는 알고리즘, 기술이나 논문들은 오히려 장기적인 실력에 노이즈가 생긴다고 생각하기 때문입니다. 수년간 훈련된 수학과 통계 같은 기초 체력이 훨씬 중요하다는 것을 해를 거듭할수록 느끼고 있습니다. 데이터 과학 분야에 입문하시는 분들도 꼭 기초체력을 다진 후에 전진하셨으면 좋겠습니다. 작성자는 이과를 나왔고 데이터에 종사한 경력도 그렇게 길지는 않은 사람이라 공감 능력이 다소 떨어질 수 있지만, 훗날 이 글이 입문하시는 분들에게 도움이 될 것이라고 자부합니다.
* 유사한 글
2020.07.12 - [AI/NLP] - 자연어 강좌 추천(2020)
2020.07.12 - [AI/NLP] - 자연어 관련 도서 및 블로그 소개(2020)
'도서 > 기술' 카테고리의 다른 글
[도서리뷰] 복붙 개발자의 벼락 성공기 (0) | 2023.06.23 |
---|---|
[도서리뷰] 직장인을 위한 챗GPT (0) | 2023.05.14 |
[도서리뷰] AWS 비용 최적화 바이블 - 핀옵스를 위한 최적의 기술 활용부터 운영 노하우까지 (0) | 2023.04.17 |
[도서리뷰] 파이썬 기반 금융 인공지능 (Artificial Intelligence in Finance) (0) | 2023.03.13 |
[도서리뷰] 프로덕트 매니저는 무슨 일을 하고 있을까 (2) | 2023.02.20 |