[서평] 대규모 머신러닝 시스템 디자인 패턴

2024. 12. 31. 11:03Insight/서평

728x90

대규모 머신러닝 시스템 디자인 패턴 / 위안 탕 지음 / 한빛미디어


거시적
인 관점에서의 분산 머신러닝 파이프라인 설계 지침서

머신러닝 기술이 발전하며 모델링에 대한 책은 많았지만, 실제로 현업에서 이를 서비스로 서빙하려면 고려할 사항이 굉장히 많다. 다른 무엇보다 데이터가 차지하는 용량, 그리고 그로 인해 연산 중 메모리 자원을 효율적으로 사용해야만 하고, 이로 인해 분산 컴퓨팅은 선택이 아닌 필수가 되고 있다. 저자는 특정한 기술 스택의 활용 방법을 제시하기 보다는, 본질적으로 문제를 어떻게 해결할 수 있는가에 대한 전체적인 청사진을 제시하고 있다.

 

나 또한 시스템을 구축하는 것에 흥미가 있어서 이 책을 읽으며 실제로 간단한 실습을 진행해보았다. 물론, 데이터 수집 단계에서부터 시간이 오래 걸려, 시간 내에 모든 구성 요소를 온전히 구현하지는 못했지만... 향후에 틈틈이 구현할 예정이다 (링크)

 

 

🙆‍♂️ 실무에서 마주하는 문제에 대한 방향성 제시

 

이 책은 미래에 앞둔 또는 당장 마주한 성능적 결핍을 어떻게 해소할 수 있는지, 또 그 방법은 특히 어떤 상황에서 사용하면 좋은지 설명하고 있다. 시스템의 청사진을 간명하게 제시하고 있다는 점에서 머신러닝 모델링 능력은 뛰어나나, 백엔드 개발에는 경험이 부족한 연구원들이라면 이 책을 통해서 빠르게 방향성을 잡아나갈 수 있을 것이라 생각한다. 그리고 작은 규모의 데이터를 기반으로 머신러닝 서비스를 운영하던 업체가 성장하여, 보다 큰 규모의 데이터셋을 기반으로 안정적인 운영을 시도할 때 참고하면 좋을만한 책이다.

 

🙅‍♂️ 구체적인 기술 활용 방법에 대해서는 다루지 않는다

하둡과 같이 주로 활용되는 스택에 대한 내용은 없고, Kubernetes/KubeFlow/ArgoCD 같이 언급된 기술에 대한 구체적인 활용 방법도 부족하다. 엄연히 굉장히 큰 관점에서 문제를 어떻게 해결할 수 있을지 인사이트를 주는 책이라고 보면 된다.

 

마치며...

실제로 실습을 해보며 느낀 점은, 방향성을 잡는 데에는 많은 도움이 되었지만, 실질적인 개발 경험이 부족한 사람이 이 책만을 가지고 개발하는 것은 어려울 것이라는 점이다. 그래서인지 책에서도 1년 이상의 개발 경험을 필요로 한다고 명시하고 있다. 그것만 제외하면 전체적인 흐름을 파악하는데에는 좋다. 그림도 많고 원리도 설명하기 때문이다. 제시한 방법이 어떻게 효율을 높이는지 잘 설명하고 있다.

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.
728x90