책소개
재미와 지혜로 가득찬 96가지의 통계 이야기!
중국에서 가장 많이 판매되는 통계/인공지능 교양 서적!
이 책은 통계학부터 시작하여 데이터와 수학, 그리고 데이터 시각화까지 논의한다. 당연히 통계 모델과 방법뿐만 아니라 빅데이터 기술과 데이터의 함정에 관해 기술하는 것도 잊지 않고 있다. 각 장마다 포함하고 있는 의미는 매우 독특하며, 현존하는 그 어떤 전문 서적이나 교재와는 차원이 다르다. 책의 구조 설계는 휘황찬란하고, 토론하는 문제는 심오하고도 소박하며, 내용은 과거부터 미래까지 모두 아울렀다. 각 장 말미에는 짧고 간결하며 고전적이면서도 심오한 이야기와 사례가 담겨 있다. 이야기에는 통계학의 지혜와 지식이 넘쳐난다. 이런 간결하고 고전적인 이야기를 통해 사람들은 비로서 통계의 아름다움을 느낄 수 있을 것이다.
저자소개
저 : 리찌엔
통계학 학사, 소프트웨어 공학 석사, 상업학 박사
데이터 사이언스 분야에서 다년간 근무하였다. 통계학이 냉대받던 시절부터 인기 과목이 된 현재까지의 산 증인인 ‘통계의 도시(https://cosx.org/)’ 핵심 회원 중 한 명이다. 오픈소스 커뮤니티에서도 활발하게 활동하고 있으며, 데이터 사이언스가 업계에서 제대로 응용될 수 있도록 힘쓰고 있다.
저 : 하이언
실리콘밸리에 있는 유명 인터넷 업체에서 데이터 분석 업무를 맡고 있다. 시간이 날 때는 각종 데이터를 모아 재미있는 분석을 하며 지낸다.
역 : 김슬기
현재 LG CNS 스마트팩토리사업부에서 스마트물류 구축 프로젝트를 하고 있다. 북경대학교를 졸업하고 바이탈힌트 차이나에서 정량 마케팅 업무를 하며 데이터 분석을 시작했다. 약 15년간 중국에서 거주하였고, 다양한 분야에서 수년간 통역 및 번역 일도 하였다.
감수 : 김재광
서울대학교 계산통계학과 학사 및 석사, 미국 아이오와 주립대학교 통계학 박사(2000), 미국 통계청 근무, Westat 선임 연구원,한국외국어대학교 정보통계학과 조교수(2002~2003), 연세대학교 응용통계학과 조교수 및 부교수(2004~2008), 카이스트 수리과학과 정교수(2016~2019), 미국 통계학회(ASA) 및 세계 수리통계학회(IMS) 석학회원(fellow), 현재 미국 아이오와 주립대학교 통계학과 정교수(endowed professor)이다.
목차
1장 통계와 과학
1.1 스토캐스틱 세상
1.1.1 포켓볼 치는 물리학자
1.1.2 신은 주사위를 던지는가?
1.1.3 연쇄살인범의 체포
1.1.4 동전을 던지는 수학자들
1.2 확률의 이해
1.2.1 게임 상금의 배분
1.2.2 6연속 숫자와 14연속 숫자
1.2.3 사회자 뒤의 염소
1.2.4 실종된 잠수함을 찾아라
1.3 통계적 사고와 모델
1.3.1 차를 맛보는 여인
1.3.2 ‘쓰레기 같은 남자’ 꺼져
1.3.3 식스시그마의 기적
1.3.4 뉴턴의 사과
1.4 통계와 과학
1.4.1 지다성과 신기군사
1.4.2 딥블루와 알파고
1.4.3 중약과 양약
1.4.4 모든 모델은 잘못되었다
2장 데이터와 수학
2.1 데이터와 공간
2.1.1 다차원 세계의 벌레
2.1.2 매트릭스와 트랜스포머
2.1.3 구장산술과 선형방정식
2.1.4 이십팔수와 황도십이궁
2.2 확률변수와 분포
2.2.1 베르누이의 동전
2.2.2 몇 번의 만남과 신기한 37
2.2.3 드무아브르의 정규분포
2.2.4 술고래의 걸음걸이
2.3 데이터 알아가기
2.3.1 테세우스의 배
2.3.2 성별부터 체중까지
2.3.3 만 나이와 일반 나이
2.3.4 신체검사 기록표
2.4 수리통계의 기초
2.4.1 관중규표와 일엽지추
2.4.2 악질 도박꾼의 계략
2.4.3 평균화된 급여
2.4.4 소이비도와 공작 깃
3장 데이터 시각화
3.1 역사 속 통계 그래프
3.1.1 하도와 낙서
3.1.2 런던 콜레라 방역
3.1.3 나이팅게일의 장미
3.1.4 나폴레옹 원정
3.2 데이터와 시각화
3.2.1 여왕의 드레스
3.2.2 캔버스와 화선지
3.2.3 심수 왕자와 다래끼 화가
3.2.4 우주왕복선 ‘챌린저호’
3.3 기초 통계 그래프
3.3.1 올드 페이스풀 간헐천의 비밀
3.3.2 통계 그래프의 창시자
3.3.3 오래된 국가의 시운
3.3.4 비상하는 모션 차트
3.4 데이터 간의 관계
3.4.1 포리마의 궤도
3.4.2 50개 주의 최고봉
3.4.3 타이타닉호의 생존자
3.4.4 체르노프의 얼굴
4장 모델과 방법
4.1 자주 쓰는 통계 모델
4.1.1 천양과 사조
4.1.2 차원축소 공격
4.1.3 고객은 왕
4.1.4 주식의 동향
4.2 머신러닝
4.2.1 맥주와 기저귀의 전설
4.2.2 ‘엄친딸’ 찾기
4.2.3 차라리 잘못 죽이는 것과 절대 놓치지 않는 것
4.2.4 나무와 숲
4.3 인공지능
4.3.1 인공지능의 2전 3기
4.3.2 딥러닝의 전생과 현재
4.3.3 신비로운 신경
4.3.4 아름다운 필터
4.4 그 외의 분석 방법
4.4.1 차, 술, 펩시콜라
4.4.2 몬테카를로와 원자폭탄
4.4.3 의사의 필적
4.4.4 사막의 나비
5장 빅데이터 시대
5.1 기술의 변천사
5.1.1 통계학의 기원
5.1.2 정보 시대의 도래
5.1.3 데이터 마이닝과 비즈니스 인텔리전스
5.1.4 빅데이터 시대의 신기원
5.2 분석 도구
5.2.1 누가 풋내기는 데이터 분석을 할 줄 모른다고 했는가?
5.2.2 자웅을 겨루는 분석 소프트웨어
5.2.3 풀스택 개발자의 최애
5.2.4 필자가 가장 사랑하는 R
5.3 컴퓨팅 프레임워크
5.3.1 냉장고 속 코끼리
5.3.2 병사 지휘와 장수 지휘
5.3.3 전기 호랑이와 전기 개미
5.3.4 무어의 법칙의 미래
5.4 빅데이터 업계의 응용
5.4.1 인터넷의 부흥
5.4.2 트래픽의 시작점
5.4.3 소득의 출처
5.4.4 좋아할 만한 상품과 비위 맞추기
6장 데이터의 함정
6.1 나뭇잎에 가려 숲을 보지 못하다
6.1.1 신기한 전갈자리
6.1.2 승자의 저주
6.1.3 비행기를 격추하는 유가
6.1.4 여신과의 인연
6.2 상관과 인과
6.2.1 방화와 뜨거운 음료
6.2.2 인기 게시물의 비밀
6.2.3 눈과 불의 도시
6.2.4 이름이 그렇게 중요한가?
6.3 표본과 조사
6.3.1 예측할 수 없는 미국 대선
6.3.2 비대칭 듀렉스 데이터
6.3.3 행운아의 전설
6.3.4 하버드 총장의 해고
6.4 도형의 오도
6.4.1 소득의 변화
6.4.2 톨게이트와 정류장
6.4.3 동관의 도주
6.4.4 독이 있는 피팅
참고문헌
찾아보기