이번에 리뷰할 책은 '쉽고 빠르게 익히는 실전 LLM' 입니다.
'쉽고 빠르게 익히는 실전 LLM' 책 목차
목차는 아래와 같습니다. 크게 9개 챕터와 부록으로 이루어져 있으며 용어와 개념 초반에 간단하게 설명합니다. 예전 자연어처리 같으면 Transformer부터 차근차근 빌드업하면서 책이 쓰여있었는데, 최근에 AI 기술 서적은 LLM부터 시작하니 더 빠르게 세상이 변화하고 있다는 것을 느낍니다.
Part 1 LLM 소개
Chapter 1 LLM
_1.1 LLM이란?
_1.2 현재 많이 사용되는 LLM
_1.3 도메인 특화 LLM
_1.4 LLM을 이용한 애플리케이션
_1.5 마치며
Chapter 2 LLM을 이용한 의미 기반 검색
_2.1 들어가는 글
_2.2 작업
_2.3 솔루션 개요
_2.4 구성 요소
_2.5 통합
_2.6 클로즈드 소스 구성 요소의 비용
_2.7 마치며
Chapter 3 프롬프트 엔지니어링의 첫 번째 단계
_3.1 들어가는 글
_3.2 프롬프트 엔지니어링
_3.3 여러 모델과 프롬프트 작업하기
_3.4 ChatGPT와 Q/A 챗봇 만들기
_3.5 마치며
Part 2 LLM 활용법
Chapter 4 맞춤형 파인튜닝으로 LLM을 최적화하기
_4.1 들어가는 글
_4.2 파인튜닝과 전이학습: 기초 안내서
_4.3 OpenAI 파인튜닝 API 살펴보기
_4.4 OpenAI CLI로 맞춤형 예제 준비하기
_4.5 OpenAI CLI 설정하기
_4.6 첫 번째 파인튜닝 LLM
_4.7 사례 연구 2: Amazon 리뷰 카테고리 분류
_4.8 마치며
Chapter 5 고급 프롬프트 엔지니어링
_5.1 들어가는 글
_5.2 프롬프트 인젝션 공격
_5.3 입력/출력 유효성 검사
_5.4 배치 프롬프팅
_5.5 프롬프트 체이닝
_5.6 연쇄적 사고 프롬프트
_5.7 퓨샷 학습 다시 보기
_5.8 테스트와 반복적 프롬프트 개발
_5.9 마치며
Chapter 6 임베딩과 모델 아키텍처 맞춤화
_6.1 들어가는 글
_6.2 사례 연구: 추천 시스템 만들기
_6.3 마치며
Part 3 고급 LLM 사용법
Chapter 7 파운데이션 모델을 넘어서
_7.1 들어가는 글
_7.2 사례연구: VQA
_7.3 사례 연구: 피드백 기반 강화 학습
_7.4 마치며
Chapter 8 고급 오픈 소스 LLM 파인튜닝
_8.1 들어가는 글
_8.2 예시: BERT를 이용한 애니메이션 장르 다중 레이블 분류
_8.3 예시: GPT-2를 이용한 LaTeX 생성
_8.4 시난의 현명하면서도 매력적인 답변 생성기: SAWYER
_8.5 끊임없이 변화하는 파인튜닝의 세계
_8.6 마치며
Chapter 9 LLM을 프로덕션 환경에서 사용하기
_9.1 들어가는 글
_9.2 클로즈드 소스 LLM을 프로덕션 환경에 배포하기
_9.3 프로덕션 환경에 오픈
소스 LLM 배포하기
_9.4 마치며
Part 4 부록
APPENDIX A LLM 자주 묻는 질문(FAQ)
APPENDIX B LLM 용어 해설
APPENDIX C LLM 애플리케이션 개발 고려사항
책 내용 구조
우선 마인드 세팅부터 짚고 넘어가는데, 책 초반이 기대되었습니다.
쿼리가 주어졌을 때 코사인 유사도가 문서를 검색하는 데 어떻게 도움이 되는지 설명해 주는 내용입니다. 비유를 들어서 쉽게 설명합니다.
이 책이 참 좋은 것이 기획이나 문제 정의 부분에 대해서 쉽게 도식화를 해서 설명해 줍니다. 위 그림은 ChatGPT와 QA Chatbot을 만드는 과정과 만들기 위해 해야 할 일을 설명하는 내용입니다.
저도 ChatBot의 동작 방식을 강의하거나 설명할 때 옵시디언의 Excalidraw와 같은 플러그인을 사용하는데, 위 그림을 보니 정말 쉽게 설명한 내용입니다. 멀티턴과 knowledge base를 동반하여 대화 흐름을 turn 기반으로 설명한 내용입니다.
프롬프트 안에 수많은 요구사항이 반영되어 있어 스터핑 현상, 노이즈가 끼이면 답변 품질에 대한 이슈를 제기하는 내용입니다. 저도 Prompt Engineering을 가르치면서 많은 수강생들이 처음 하는 실수가 하나의 요구사항에 수많은 내용을 담는 것인데요.
Task를 Decomposition, 문제를 분해하여 단계별로 프롬프트들을 전달하고 양질의 응답을 사용자에게 전달하는 Workflow를 그린 내용입니다.
Transformer 아키텍처를 설명할 때, Query, Key, Value 개념을 처음 듣는 사람들은 이해하기 어려워하고 몇 년 전에 강의자료를 만드는데 고생했던 기억이 납니다. 어텐션 스코어를 뽑고 softmax를 적용하고 contextual embedding을 뽑는 과정을 아주 쉽게 설명한 내용입니다.
RLF에 대한 전체적인 프로세스와 훈련 과정을 설명한 내용입니다.
LLM을 Fine-Tuning 하는데 layer를 freezing 하는 내용입니다. 근래 본 기술 서적 중에 이렇게 친절하게 도식화된 책은 처음 봅니다!
LLM 관련된 자주 묻는 질문 FAQ을 부록에 정리하고, LLM 용어 해설 또한 부록에 정리가 되어있어 글을 읽다가 부록을 살펴보면서 이해하기 쉽고 친절한 책으로 구성되어 있습니다.
'쉽고 빠르게 익히는 실전 LLM' 도서 총평
우선 시중에 LLM 책들이 마구 쏟아지고 있는데, AI 분야의 입문자들에게 단계적으로 접근할 수 있도록 쓰인 친절한 책이라고 생각이 들었습니다. LLM 자체가 진입장벽이 높은데 도식화 형태로 설명하여, 자신감을 갖고 시작할 수 있게 한다고 생각합니다. Python 코딩을 조금이라도 해보신 실무자들을 에게 많은 가이드를 줍니다. 또한 고급 프롬프팅과 Fine-Tuning 영역에서는 제가 놓친 부분들이 많았는데 점검하기 좋았다는 생각이 듭니다.
독자들이 실제로 LLM을 활용하여 문제를 해결하는 데 필요한 기술과 지식을 습득할 수 있는 부분들이 많습니다. 특히 Fine-Tuning, Semantic Search, 고급 프롬프트 엔지니어링 등의 주제는 제가 하는 AI 교육 및 컨설팅 분야에 좋은 교보재가 된다고 생각이 들었습니다. 또한, LLM을 파인튜닝하는 과정에서 레이어를 프리징 하는 방법이나 ChatBot QA 도식화되는 부분, 그리고 자주 묻는 질문과 용어 정리 Appendix 등 정말 친절하게 쓰여서 유튜브에도 없는 디테일한 부분까지 다루어서 근래 들어 흡족스러운 책이었습니다.
오래간만에 좋은 개발 서적을 Get 한 것 같아서, 종종 개념공부하고 점검하고, 교육하는데 활용하기 좋은 교보재라는 생각이 들었습니다. LLM을 입문하면서 Python Code를 다룰 줄 아시는 분들이라면 필수 도서라고 생각합니다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
'도서 > 기술' 카테고리의 다른 글
[도서리뷰] 뇌를 쓰지 않는 만만한 PPT (2) | 2024.07.28 |
---|---|
[도서리뷰] GPT-4를 활용한 인공지능 앱 개발 (1) | 2024.02.25 |
[도서리뷰] 개발자를 넘어 기술 리더로 가는 길 (3) | 2023.10.22 |
[도서리뷰] 코딩 뇌를 깨우는 파이썬 (0) | 2023.09.10 |
[도서리뷰] 육각형 개발자 (0) | 2023.08.27 |