상세정보
미리보기
인사이드 머신러닝 인터뷰 : 빅테크에서 자주 묻는 194가지 문제로 ML 면접 완벽 대비하기
- 저자
- 펑 샤오 저/정원창 역
- 출판사
- 한빛미디어
- 출판일
- 2024-03-18
- 등록일
- 2024-04-30
- 파일포맷
- PDF
- 파일크기
- 3MB
- 공급사
- YES24
- 지원기기
-
PC
PHONE
TABLET
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
ML 면접을 위한 기본기부터 실무를 위한 실용적인 접근법까지ML 면접에서 어떤 질문에도 자신 있게 대처하려면 전체 ML 워크플로와 관련 핵심 개념을 명확히 정리해야 한다. 이 책은 ML 기본 지식과 코딩 면접부터 시스템 및 인프라 설계 면접까지 단계별로 따라가며 지원자가 꼭 준비해야 할 문제와 해결 전략을 살펴본다. 저자는 아마존과 트위터, AI 스타트업을 거치며 천 명에 가까운 지원자를 면접한 경험을 바탕으로 빅테크 ML 면접에서 자주 묻는 질문 194가지와 최선의 답변을 구성하는 노하우를 풀어낸다. 책에서 제시하는 키워드 중심의 명쾌한 답변과 면접 관련 팁을 활용해 자신 있는 부분은 보강하고 부족한 부분은 충실히 보완해 면접을 성공으로 이끌어보자.
저자소개
15년 동안 소셜 미디어, 광고 기술, 핀테크, 전자 상거래 등 다양한 분야에서 ML 리더십 직책을 맡아 천 명에 가까운 지원자를 면접했다. 트위터(현재 X)에서 스태프 ML 엔지니어로 근무하면서 추천 알고리즘과 광고 예측 및 랭킹을 위한 ML 시스템을 설계했으며 그 전에는 록시(Roxy)라는 AI 스타트업을 공동 창업해 벤처 캐피탈에서 수백만 달러의 투자를 받았다. 경력 초기에 아마존과 팩트셋(FactSet)에서 ML 팀을 이끌며 기계 번역, 표 형식 정보 추출, 개체명 인식, 토픽 모델링 등 다양한 ML 시스템의 개발을 감독했다.
목차
1장 ML 면접에 임하기테크니컬 폰 스크린ML 기본 지식 면접ML 코딩 면접ML 시스템 설계 면접기타 면접우수한 답변의 필수 요소2장 ML 기본 지식Q2.1 데이터셋 수집 단계Q2.2 데이터 수집 시 문제Q2.3 데이터 수집 시 고려 사항Q2.4 레이블 불균형 처리Q2.5 누락된 레이블 처리Q2.6 입력 피처 유형Q2.7 피처 선택과 중요도Q2.8 피처 선택 방법Q2.9 누락된 피처값Q2.10 모델링 알고리즘Q2.11 로지스틱 회귀 작동 방식Q2.12 로지스틱 회귀 손실 함수Q2.13 경사하강법 최적화Q2.14 하이퍼파라미터 튜닝Q2.15 모델 과적합 처리Q2.16 정규화 기법Q2.17 선형 회귀와 로지스틱 회귀Q2.18 신경망 활성화 함수Q2.19 의사 결정 트리, 랜덤 포레스트, 그래디언트 부스팅 결정 트리Q2.20 부스팅과 배깅Q2.21 비지도 학습 기법Q2.22 k-평균 작동 방식Q2.23 준지도 학습 기법Q2.24 손실 함수 유형Q2.25 손실 함수 볼록성Q2.26 분류 모델 평가 지표Q2.27 회귀 모델 평가 지표Q2.28 모델 최적화Q2.29 모델 성능 개선3장 ML 코딩Q3.1 k-평균Q3.2 k-최근접 이웃Q3.3 의사 결정 트리Q3.4 선형 회귀Q3.5 평가 지표Q3.6 저수지 샘플링Q3.7 확률 문제Q3.8 해시 테이블과 분산 프로그래밍 문제Q3.9 그래프 문제Q3.10 문자열 문제Q3.11 배열 문제4장 ML 시스템 설계 1 - 추천 시스템Q4.1 시스템 목적Q4.2 시스템 지표Q4.3 추천 콘텐츠 유형Q4.4 추천 콘텐츠 혼합Q4.5 시스템 운영 매개변수Q4.6 시스템 구성 요소Q4.7 콜드 스타트 문제Q4.8 데이터셋 유형Q4.9 데이터셋 수집 기법Q4.10 데이터셋 편향Q4.11 서빙 편향 완화Q4.12 위치 편향 완화Q4.13 추천 후보 출처Q4.14 추천 후보 생성 단계Q4.15 추천 후보 생성 알고리즘Q4.16 임베딩 기술Q4.17 대규모 추천 시스템의 후보 스코어링Q4.18 신규 콘텐츠 색인화Q4.19 추천 후보 병합 및 정리Q4.20 사전 랭킹 모델 학습Q4.21 사전 랭킹 모델 평가 지표Q4.22 사전 랭킹 모델 알고리즘Q4.23 사전 랭킹 모델 최적화Q4.24 랭킹 모델 주요 피처Q4.25 텍스트 또는 ID 기반 피처Q4.26 횟수 기반 피처Q4.27 헤비 랭킹 모델 학습Q4.28 헤비 랭킹 모델 알고리즘Q4.29 랭킹 모델 아키텍처Q4.30 랭킹 모델 예측값 보정Q4.31 랭킹 모델 평가 지표Q4.32 다중 작업 모델과 개별 모델Q4.33 모델 서빙 시스템Q4.34 캐싱Q4.35 모델 업데이트Q4.36 온라인 실험Q4.37 모델 로드Q4.38 모델 실험 고려 사항Q4.39 오프라인 평가 지표Q4.40 온라인 성능 저하5장 ML 시스템 설계 2 - 응용Q5.1 문서 파싱Q5.2 감성 분석Q5.3 토픽 모델링 기법Q5.4 문서 요약Q5.5 자연어 이해Q5.6 지도 학습 레이블Q5.7 비지도 학습 피처Q5.8 판별적 문제 피처Q5.9 생성 모델 피처Q5.10 정보 추출 모델 구축Q5.11 정보 추출 평가 지표Q5.12 분류 모델 구축Q5.13 회귀 모델 구축Q5.14 토픽 할당Q5.15 토픽 모델링 평가 지표Q5.16 문서 클러스터링 모델 구축Q5.17 클러스터링 평가 지표Q5.18 텍스트 생성 모델 구축Q5.19 텍스트 생성 평가 지표Q5.20 모델링 워크플로Q5.21 오프라인 예측6장 ML 인프라 설계Q6.1 모델 개발 가속화Q6.2 모델 학습 가속화Q6.3 모델 학습 분산Q6.4 모델 학습 파이프라인 평가Q6.5 분산 학습 오류Q6.6 모델 업데이트Q6.7 모델 최적화Q6.8 서빙 시스템 구성 요소Q6.9 서빙 시 문제Q6.10 피처 수화 개선Q6.11 지연 시간 개선Q6.12 많은 요청 처리하기Q6.13 서빙 시 모델 업데이트Q6.14 모델 배포와 롤백Q6.15 서버 모니터링Q6.16 서빙 시 성능 저하7장 고급 ML 문제Q7.1 지연된 레이블Q7.2 레이블 없이 학습하기Q7.3 가격 모델부록 A 생성 모델: 노이지 채널 모델에서 LLM까지A.1 기계 번역(MT)A.2 자동 음성 인식(ASR)A.3 트랜스포머로의 수렴A.4 현실의 과제를 위한 미세 조정참고자료찾아보기