인공지능 수학 공부, 어떤 책으로 시작할까? MML로 스터디 해봤습니다
⏳5min
AI를 공부하다 보면 자연스럽게 수학을 공부해야겠다는 생각을 많이 하는데요. 이러한 갈증을 가진 스터디원들과 함께 ‘Mathmatics for Machine Learning’ 책으로 함께 인공지능 수학 스터디를 진행했습니다. 5개월이라는 긴 시간동안 꾸준히 조금씩 개념을 이해하고 함께 진행 중인 프로젝트에 적용시키는 스터디였습니다. 앞으로 MML 책을 통해 인공지능 수학을 공부하시려는 분들, 스터디를 준비하시는 분들께 좋은 정보가 될 것 같아서 글을 써봤습니다.
1. MML, 무슨 책인가요?
MML(Mathmatics for Machine Learning) 책은 머신러닝 분야에서 인공지능 수학 공부의 정석이라고 알려진 책입니다. 해외 커뮤니티 레딧에서도 상당수의 추천을 받은 책인 것을 볼 수 있습니다. 레딧에서 추천 100 이상을 받기 쉽지 않은데, 해당 책은 600이라니 엄청난 수의 추천을 받은 것이죠.
레딧 내에서 인공지능 수학은 이 책만 공부하면 된다며, 원스탑이라고 표현한 글도 찾아볼 수 있습니다. 책은 여기를 클릭하시면 무료로 보실 수 있습니다. 2023년 초 한국어 번역서도 발간 되었는데요. 저는 원서와 번역서 모두 구매해서 보았습니다.
2. MML 목차 알아보기
(출처: MML)
책은 크게 두 파트로 나뉩니다.
PART 1은 수학에 관련된 내용으로, 위 그림의 기둥을 받치고 있는 아래 기반들에 해당하는 내용입니다.
PART 1
2장: 선형대수학, 벡터와 행렬의 집합
3장: 유사성과 거리의 개념, 해석 기하학
4장: 행렬과 행렬 분해
5장: 벡터의 미분
6장: 불확실성을 정량화하는 확률 이론
7장: 기울기에 관한 개념, 최적화 알고리즘
PART 2는 머신러닝에 관한 내용으로, 위 그림에서 네 개의 기둥에 해당합니다. PART 1에서 소개한 수학 개념들이 각 기둥에 어떻게 기초가 되는지 설명하고 있습니다.
PART 2
8장: 머신러닝의 세 가지 구성요소(데이터, 모델, 매개변수 추정), 지나치게 낙관적인 평가를 막는 실험적 설정(ex. Recall)
9장: 선형 회귀, 최대 우도법, 최대 사후 확률 추정법, 베이지안 선형회귀
10장: 두 번째 기둥인 차원 축소
11장: 세 번째 기둥인 밀도 추정(Density Estimation), 가우스 혼합 모델
12장: 네 번째 기둥인 분류, 서포트 벡터 머신
각 장이 모듈식으로 구성되어 있어서 다른 장에서도 관련된 장의 내용을 많이 언급합니다. 예를 들어 2장에서 아래와 같은 마인드맵을 제시합니다. 여기서 보면 이번 장에서 다루고 있는 개념 간의 관계는 물론, 다른 장과 연결되는 개념도 연결해서 설명하고 있는 것을 볼 수 있습니다. 이렇게 연결된 개념들이 어떤 장에 있는지까지 설명을 해주기 때문에 유기적으로 연결된 방식으로 이해하는 재미가 있었습니다.
(출처: mml책)
3. 스터디 진행 방식 알아보기
이 책을 활용하는 방법은 크게 두 가지가 있습니다. Bottom-up과 Top-down입니다.
1️⃣ Bottom-up: 선제적으로 수학의 기초적인 개념을 쌓는 방식입니다. 장점으로는 이전에 배운 개념에 더해서 배워나갈 수 있다는 점이 있고, 단점으로는 실무자들에게는 수학 개념을 배우는 게 동기부여가 되지 않을 수 있고 따라서 빨리 잊는다는 점이 있습니다.
2️⃣ Top-down: 실용적으로 필요한 부분만 학습하는 방식입니다. 장점으로는 특정 개념이 왜 필요한지 항상 인지하면서 배울 수 있다는 점이 있습니다. 단점으로는 불완전하게 개념을 학습하기 때문에 이해할 수 없으면 외워야 한다는 점이 있습니다.
책은 모듈식으로 구성되어 있어서, 두 방식 모두 가능합니다.
저희 스터디 구성원들 모두가 실무를 하고 있긴 하지만, 스터디의 목적이 전체적인 수학 기초를 다지는 것이었기 때문에 Bottom-up 방식으로 진행되었습니다. 스터디를 진행했던 기간은 2023년 7월부터 2023년 12월 말입니다. 점심시간을 이용했기 때문에 주어진 시간이 한정적이라, 긴 기간 동안 진행되었습니다. 스터디 방식은 각 분량을 읽고, 이해하기 쉬운 형태로 가공하여 발표하는 방식이었습니다. 같은 방식으로 인공지능 수학 스터디를 운영하실 분들께 도움이 되기 위해서 말씀드리자면, 저희는 하루에 3절(ex. 2.1, 2.2, 2.3)씩 진행했습니다. 스터디 일정은 아래와 같았습니다.
PART 1: 2023.07 ~ 2023.09 (일주일에 두 번)
PART 2: 2023.10 ~ 2023.12 (일주일에 한 번)
4. 스터디에 도움이 되었던 자료들
MML은 인공지능 수학 공부에 더할나위 없이 좋은 책이지만 그 내용이 쉽고 친절한 것은 아니었습니다. 적어도 저희에게는요. 번역서도 구매해서 읽었지만, 번역이 매끄럽게 되어 있는 것은 아니어서 반드시 원서와 비교해서 읽어야 했습니다. 또한 개념에 대한 배경지식 없이는 한 번에 이해하기 힘들어서, 여러 자료를 참고하면서 스터디를 진행했습니다.
📑 참고 자료
1️⃣ 공식 깃헙
2️⃣ 이전에 인공지능 수학 스터디를 진행하셨던 다른 분들 자료: 큰 방향성을 잡기 좋았습니다.
3️⃣ 별준님의 블로그: 마찬가지로 책보다 쉽게 풀어주셔서 책과 병행해서 보면 이해에 도움이 되었습니다.
4️⃣ 챗GPT
이 중 가장 많이 참고했던 것은 ChatGPT입니다. 원서 내용을 그대로 캡처해서 넣고 “쉽게 설명해 줘"라는 프롬프트를 수없이 작성했던 것 같아요. 또한 잘 이해되지 않는 개념을 찾아보다 보면 꼬리에 꼬리를 물며 깊이 들어가게 되는 경우가 많은데, 이러한 경우에 ChatGPT의 도움을 많이 받았습니다.
5. 정리하며
쉽지 않은 내용이었지만, 발표 자료를 만들고 쉽게 전달하기 위해 노력하면서 혼자 공부할 때보다 훨씬 많은 내용이 흡수된 것 같습니다. 함께 공부했던 스터디원분들도 ‘함께 해서 끝까지 할 수 있었다'라는 말을 많이 하셨어요. MML로 인공지능 수학 스터디를 진행하면서 이 개념이 각 실무에서 어떻게 쓰이는지도 나눌 수 있는 좋은 경험을 했습니다.
이 아티클은 AI 히어로즈 전문 필진
무니(AI 엔지니어)
님의 글입니다.