책소개
개발자를 구원하는 실용 수학 안내서
기초 수학부터 회귀 모델, 신경망 그리고 진로 조언까지
데이터 과학, 머신러닝, 통계학에서 탁월한 능력을 발휘하는 데 필요한 수학을 이해하고 여러분의 것으로 만들어보세요. 이 책에서는 미적분, 확률, 통계, 선형대수학을 설명하고 선형 회귀, 로지스틱 회귀, 신경망과 같은 기술에 수학이 어떻게 적용되는지 안내합니다. 그 과정에서 데이터 과학의 현황과 통찰력을 깨우쳐 여러분의 가치를 극대화하는 방법과 실용적인 인사이트도 얻을 수 있습니다.
아마존 선형대수학, 미적분 분야 베스트셀러
개발자라면 꼭! 짚고 넘어가야 할 수학 개념 101
데이터 과학과 머신러닝 세계를 정복하고 싶으신가요? 그 여정의 첫걸음은 바로 수학입니다. 머신러닝의 핵심 원리와 알고리즘은 사실 수학적 개념에 뿌리를 두고 있습니다. 이 책은 미적분, 확률, 통계, 선형대수학의 기초부터 데이터 과학에 적용하는 방법까지 체계적으로 안내합니다. 파이썬을 활용한 실습을 통해 선형 회귀부터 신경망에 이르기까지, 실무에서 수학이 어떻게 녹아드는지를 생생하게 배울 수 있습니다. 데이터 과학자로서의 여정을 시작하는 데 이보다 더 완벽한 안내서는 없습니다. 이 책과 함께 데이터 과학의 무한한 가능성을 탐험해보세요. 탄탄한 수학 개념 이해로 시작하는 데이터 과학 첫걸음, 지금 바로 시작하세요!
대상 독자
- 데이터 과학과 머신러닝에 사용되는 수학 개념과 도구, 알고리즘을 이해하고 싶은 개발자
- 데이터 분석 실무를 맡고 있는 데이터 엔지니어, 데이터 과학자, 머신러닝 엔지니어, 통계 전문가
주요 내용
- 파이썬 코드와 라이브러리로 살펴보는 기초 수학 개념
- 기술 통계와 가설 검정으로 p 값과 통계적 유의성 해석하기
- 선형 회귀, 로지스틱 회귀, 신경망에 수학 개념 적용하기
- 탄탄한 데이터 과학 경력을 쌓는 방법과 진로 조언
- 각 장에서 배운 개념을 복습하는 워크북 제공
저자소개
닐드 컨설팅 그룹(Nield Consulting Group)의 설립자이자 오라일리 미디어와 서던 캘리포니아 대학교의 강사입니다. 기술 콘텐츠에 익숙하지 않거나 두려움을 느끼는 사람들이 공감할 수 있는 콘텐츠를 만드는 것을 즐깁니다. 정기적으로 데이터 분석, 머신러닝, 수학적 최적화, AI 시스템 안전, 실용적인 인공지능에 관해 강의합니다. 두 권의 책, 『Getting Started with SQL』(오라일리, 2016)과 『Learning RxJava』(팩트, 2020)를 저술했습니다. 또한 비행 시뮬레이션 및 무인 항공기를 위한 범용 핸드헬드 컨트롤을 개발하는 회사인 Yawman Flight의 설립자이자 발명가이기도 합니다.
목차
1장 기초 수학과 미적분
_1.1 정수론
_1.2 연산 순서
_1.3 변수
_1.4 함수
_1.5 합계
_1.6 거듭제곱
_1.7 로그
_1.8 오일러 수와 자연로그
_1.9 극한
_1.10 미분
_1.11 적분
_1.12 마치며
2장 확률
_2.1 확률 이해하기
_2.2 확률 계산
_2.3 이항 분포
_2.4 베타 분포
_2.5 마치며
3장 기술 통계와 추론 통계
_3.1 데이터란 무엇인가요?
_3.2 기술 통계와 추론 통계
_3.3 모집단, 표본, 편향
_3.4 기술 통계
_3.5 추론 통계
_3.6 t 분포: 소규모 표본 처리
_3.7 빅 데이터 고려 사항과 텍사스 명사수 오류
_3.8 마치며
4장 선형대수학
_4.1 벡터란 무엇인가요?
_4.2 선형 변환
_4.3 행렬 곱셈
_4.4 행렬식
_4.5 특수 행렬
_4.6 연립 방정식과 역행렬
_4.7 고유 벡터와 고윳값
_4.8 마치며
5장 선형 회귀
_5.1 기본 선형 회귀
_5.2 잔차와 제곱 오차
_5.3 최적의 직선 찾기
_5.4 과대적합 및 분산
_5.5 확률적 경사 하강법
_5.6 상관 계수
_5.7 통계적 유의성
_5.8 결정 계수
_5.9 추정 표준 오차
_5.10 예측 구간
_5.11 훈련/테스트 분할
_5.12 다중 선형 회귀
_5.13 마치며
6장 로지스틱 회귀와 분류
_6.1 로지스틱 회귀 이해하기
_6.2 로지스틱 회귀 수행하기
_6.3 다변수 로지스틱 회귀
_6.4 로그 오즈 이해하기
_6.5 R2
_6.6 p 값
_6.7 훈련/테스트 분할
_6.8 오차 행렬
_6.9 베이즈 정리와 분류
_6.10 ROC 곡선과 AUC
_6.11 클래스 불균형
_6.12 마치며
7장 신경망
_7.1 언제 신경망과 딥러닝을 사용할까요?
_7.2 간단한 신경망
_7.3 역전파
_7.4 사이킷런 사용하기
_7.5 신경망과 딥러닝의 한계
_7.6 마치며
8장 경력 조언과 앞으로의 진로
_8.1 데이터 과학의 재정의
_8.2 데이터 과학의 간략한 역사
_8.3 나만의 강점 찾기
_8.4 데이터 과학 직무에서 주의해야 할 사항
_8.5 꿈의 직업이 존재하지 않나요?
_8.6 이제 어디로 가야 하나요?
_8.7 마치며
부록 A 보충 학습
A.1 심파이로 수학식 표현하기
A.2 밑바닥부터 이항 분포 구현하기
A.3 밑바닥부터 베타 분포 구현하기
A.4 베이즈 정리 유도하기
A.5 밑바닥부터 CDF와 역CDF 구현하기
A.6 e를 사용해 시간 경과에 따른 사건 확률 예측하기
A.7 언덕 오르기와 선형 회귀
A.8 언덕 오르기와 로지스틱 회귀
A.9 선형 계획법에 대한 간략한 소개
A.10 사이킷런을 사용한 MNIST 분류기
<별책 부록> 워크북