저자소개
저 : 아키바 신야 (Akiba Sinya,秋庭 伸也)
2012년에 와세다대학교 기간이공학부를 졸업하고, 2015년에 와세다대학교 이공학술원 기간이공학연구과 기계과학전공 석사 과정을 수료했습니다. 지금은 리크루트 통신의 기술 리드로 근무하고 있습니다.
저 : 스기야마 아세이 (Sugiyama Asei,杉山 阿聖)
제조업체의 IT 자회사에서 3년간 iOS 앱을, 2년간 채팅 봇을 개발했습니다. 현재는 SENSY의 연구원으로 머신러닝을 이용한 개발 업무를 담당하고 있습니다. 엔지니어 대상의 스터디 그룹에 참가하거나 다른 개발자와 지식 나누기를 좋아합니다.
저 : 테라다 마나부 (Terada Manabu,寺田 ?)
파이썬 웹과 관련된 컨설팅 및 구축 업무를 하고 있습니다. 2010년부터 일본 파이썬 커뮤니티에서 적극적으로 활동하면서 ‘파이콘 일본’ 콘퍼런스 개최에 도움을 주고 있으며, 2013년 3월부터는 파이콘 일본의 대표이사를 맡고 있습니다. 또한, 다른 오픈 소스 소프트웨어 관련 커뮤니티를 주관하거나 멤버로 활동하기도 합니다. 아울러 파이썬 엔지니어 육성 추진 협회의 고문이사로 활동하면서 파이썬의 매력을 전달하는 교육 활동에도 많은 관심을 두고 있습니다. 최근에는 파이썬과 머신러닝 입문자를 대상으로 강의를 시작했습니다.
『파이썬으로 배우는 새로운 데이터 분석의 교과서』(쇼에이샤, 2018년 9월)를 함께 썼으며, 『거침없이 이해하는 파이썬』(쇼에이샤, 2017년 8월)을 감수했습니다.
목차
CHAPTER 1 머신러닝 기초 1
1.1 머신러닝 소개 3
머신러닝 3
머신러닝의 유형 4
머신러닝의 활용 10
1.2 머신러닝 준비하기 11
데이터의 중요성 11
지도 학습(분류)의 예 14
구현 방법 17
비지도 학습의 예 19
시각화 23
그래프의 종류와 표현 방법: matplotlib을 이용한 그래프 출력 29
판다스를 이용해 데이터를 이해하고 다루기 38
마치며 45
CHAPTER 2 지도 학습 47
01 선형회귀 49
기본 개념 49
알고리즘 50
더 나아가기 53
02 정규화 58
기본 개념 58
알고리즘 61
더 나아가기 64
03 로지스틱 회귀 67
기본 개념 67
알고리즘 69
더 나아가기 71
04 서포트 벡터 머신 74
기본 개념 74
알고리즘 75
더 나아가기 77
05 커널 기법을 적용한 서포트 벡터 머신 80
기본 개념 81
알고리즘 81
더 나아가기 83
06 나이브 베이즈 분류 86
기본 개념 86
알고리즘 89
더 나아가기 93
07 랜덤 포레스트 94
기본 개념 94
알고리즘 95
더 나아가기 99
08 신경망 101
기본 개념 101
알고리즘 104
더 나아가기 108
09 k-최근접 이웃 알고리즘(kNN) 110
기본 개념 110
알고리즘 112
더 나아가기 113
CHAPTER 3 비지도 학습 117
10 주성분 분석 119
기본 개념 119
알고리즘 121
더 나아가기 124
11 잠재 의미 분석 125
기본 개념 125
알고리즘 127
더 나아가기 131
12 음수 미포함 행렬 분해 132
기본 개념 132
알고리즘 134
더 나아가기 136
13 잠재 디리클레 할당 139
기본 개념 139
알고리즘 141
더 나아가기 143
14 k-평균 알고리즘 146
기본 개념 146
알고리즘 147
더 나아가기 149
15 가우시안 혼합 모델 151
기본 개념 151
알고리즘 152
더 나아가기 156
16 국소 선형 임베딩 157
기본 개념 157
알고리즘 158
더 나아가기 161
17 t-분포 확률적 임베딩 163
기본 개념 163
알고리즘 164
더 나아가기 168
CHAPTER 4 평가 방법과 여러 가지 데이터 처리 171
4.1 평가 방법 173
지도 학습의 평가 173
분류 문제의 평가 방법 174
회귀 문제의 평가 방법 183
평균제곱오차와 결정계수의 차이 188
다른 알고리즘을 이용할 때와 비교 188
하이퍼 파라미터 설정 190
모델의 과적합 191
과적합을 막는 방법 192
학습 데이터와 검정 데이터 나누기 193
교차 검증 196
하이퍼 파라미터 탐색하기 198
4.2 문서 데이터의 전처리 202
단어 빈도 수를 이용한 변환 202
TF-IDF를 이용한 변환 203
머신러닝 모델에 적용 204
4.3 이미지 데이터 변환하기 207
픽셀 밝기 값 활용하기 207
변환한 벡터 데이터로 머신러닝 모델 만들기 209
CHAPTER 5 파이썬 개발 환경 211
5.1 파이썬 3 설치 213
윈도우 10 213
macOS 214
리눅스 215
아나콘다를 윈도우 10에 설치 216
5.2 가상 환경 218
표준 개발 환경에서 가상 환경 설정하기 218
아나콘다 220
5.3 외부 라이브러리 설치 221
외부 라이브러리 221
외부 라이브러리 설치 221
참고문헌 223
APPENDIX 부록 225
읽으면 도움 되는 수학 개념 몇 가지 226
이 책의 주요 용어 230
찾아보기 237