본문 바로가기

일상/서평

머신러닝 프로젝트 구축 추천도서 머신러닝 엔지니어링 인 액션

반응형

인공지능 시대에 살고 있어 AI 하면 바로 인공지능을 떠올리게 합니다.

그리고 AI 인공지능 프로그램 중에서 머신러닝은 요즘 가장 핫한 이슈 가운데 하나이기도 합니다.

머신러닝 엔지니어링 인 액션 책은 머신러닝 엔지니어링 개념부터 프로덕션까지 성공적인 머신러닝 프로젝트 구축하기 위한 가이드를 제공해 주는 책입니다.

일단 저자가 수많은 시행착오를 겪으면서 터득한 내용들을 중심으로 실어 놓았기 때문에 현장에서 인공지능을 다루는 머신러닝 엔지니어, 데이터 과학자, 소프트웨어 아키텍트 등 머신러닝 프로젝트를 계획하시는 분들에게 추천되는 책인데요.

벤 윌슨은 반도체 공정 엔지니어로 ML 프레임워크 코드를 빌드 한 머신러닝 엔지니어입니다.

머신러닝 시스템을 구축하는 것은 결코 쉽지 않습니다.

모델 성능 외에도 고려해야 할 부분들이 많은데요.

이 책 머신러닝 엔지니어링에서는 바로 이런 부분에 대해 설명해 주고 있습니다.

자원 및 비용 관리 : 대규모 모델 훈련 및 배포에는 컴퓨팅 자원과 비용이 많이 들어갑니다. 자원을 효율적으로 관리하고 한정된 예산 안에서 ML 시스템을 구축해야 합니다.

데이터 수집 및 정제 : ML 모델에는 종종 정제된 대용량 데이터가 필요합니다. 데이터 수집 및 전처리에 많은 인력과 노력이 필요합니다.

보안 및 규정 준수 : 데이터 및 보안 문제와 관련해서 고려해야 할 사람이 많으며 특히 민감한 정보를 다루는 모델의 보안 및 규정 준수를 관리하는 것은 매우 어려운 과제입니다.

모델 품질 관리 : 드리프트에 따른 모델의 성능 및 품질을 지속해서 모니터링하고 개선하려면 성능 저하, 편향, 오류 등을 관리하고 수정해야 합니다.

문서화 및 협업 : 모델과 데이터에 대한 문서화를 유지하고 다양한 이해관계자와 협력해야 합니다.

 
 

이 책은 ML에 관심 있는 분들을 위한 책입니다.

ML 엔지니어만을 위한 어려운 내용도 아니고 일반인만을 위한 개략적인 내용도 아닙니다.

이 책의 목표는 ML을 사용해 비즈니스 문제를 해결하는 과정에 프로젝트 참여자들이 모두 쉽게 접근할 수 있도록 하는 것입니다.

 

ML 엔지니어의 소프트웨어 개발 역량은 단지 모듈화된 코드를 설계하고, 단위 테스트를 구현할 수 있는 정도의 수준만 갖추면 충분합니다. 그리고 모델 개발에 필요한 피처 데이터 셋을 만들 수 있는 정도의 데이터 엔지니어링 기술만 있어도 됩니다. 조금 더 나아가 그들의 연구에 필요한 도표나 차트를 만들 수 있는 정도의 시각화 기술까지 있다면 더할 나위 없겠죠.

파트 1에서는 ML을 사용해 문제를 해결하는 데 가장 위험 요소가 적은 설루션을 정의하기 위해서는 어떤 평가 기준이 필요하고 계획하고 검증해야 하는지 청사진을 살펴봅니다. 팀장, 매니저, 프로젝트 리더 관점에서 ML 프로젝트의 관리 측면을 살펴보고, 설루션 구축 시 빠지기 쉬운 함정을 피할 수 있도록 범위 설정, 실험, 프로토 타이핑에 대한 피드백이 포함됩니다.

 

ML 엔지니어는 실제 문제 해결에 집중하면서 응용 ML 프로젝트가 효율적으로 개발되고 유지 관리될 수 있도록 해야 합니다.

이를 위해서는 데이터 과학, 기존 소프트웨어 엔지니어링, 프로젝트 관리 측면을 파악하고 있어야 합니다.

응용 ML 프로젝트의 여섯 가지 주요 단계는 계획, 범위 설정 및 조사, 실험, 개발, 배포, 평가 순입니다.

기술 구현의 세부 사항, 도구, 새로운 접근 방식에 대한 우려를 덜어내어야 프로젝트 업무를 진행함에 가장 중요한 요소는 실질적인 문제 해결에 집중할 수 있습니다.

 
 

프로젝트 성공률을 높이는 방법 : 프로세스를 적용해 복잡한 전문성 강화하기

데이터 과학자의 업무는 데이터에 수학을 창의적으로 적용해 문제를 해결하는 것입니다.

그래서 문제를 해결하는 행위를 중요시합니다.

데비 옵스는 소프트웨어 개발의 성공적인 엔지니어링 작업에 대한 지침과 입증 가능한 패러다임을 가져왔습니다.

애자인 선언의 등장으로 숙력된 업계 전문가들은 기존 소프트웨어 개발 방식의 결함을 인식하게 됐습니다.

ML 방식이 애자일 방식과 유사하다고 해요.

 
 
 
 

책은 머신러닝의 기본 개념부터 머신러닝 프로젝트에 필요한 설계 원칙, 좋은 ML 코드 작성법, 프로덕션 배포 전 고려해야 할 심화 주제까지 설명해 줍니다.

수십 년간 축적된 훌륭한 소프트웨어 엔지니어링 경험 위에 세워진 머신러닝 엔지니어링은 ML 시스템의 복원력과 적응력, 프로덕션 환경에서의 성능을 보장하게 되는데요.

 
 

프로토타입으로 테스트하고, 모듈식 설계를 통해 탄력적인 아키텍처 구축 노하우를 배우수 있고요.

협업 시 일관된 커뮤니케이션을 제공하는 소프트웨어 엔지니어링 기술을 배울 수 있습니다.

성공적인 머신러닝 프로젝트의 비밀이 궁금한 분들에게 이 책이 좋은 가이드를 제공해 줄 것 같네요.

 
 

아래는 책에 대한 추천사입니다.

머신러닝 프로젝트를 구축하는 모든 과정을 안내하는 완벽한 지침서로 귀중한 지식과 경험으로 가득합니다. - 루이 리우 (오라클 기술 자문 위원)

한 단계씩 올라갈 때마다 노련한 전문가의 조언을 들을 수 있는 책입니다. - 존 바실 (오디오 네트워크 CTO 겸 CPO)

주니어부터 숙련된 전문가까지, 모두에게 유용한 내용을 소개합니다. - 요안니스 아트소니오스 (FemTec Health 데이터 과학 엔지니어)

반응형