BLOG

AWS re:Invent 2022 세션 후기 #63 – AI/ML
작성일: 2022-12-06
[AIM321] Productionize ML workloads using Amazon SageMaker MLOps, feat. NatWest

연사 : Shelbee Eigenbrode, Greig Cowan, Usman Anwer

일시: 2022.11.30 16:45 ~ 17:45

장소: Level 1 North, Islander F, Mandalay Bay

작성자 : 메가존클라우드 Data Business Center 김윤희 매니저

 

 

MLOps 도구는 ML 라이프사이클 전반에 걸쳐 프로세스를 자동화 및 표준화하여, ML 모델을 보다 신속하게 생산하고 생산 시 모델 품질을 유지할 수 있도록 지원합니다.

Amazon SageMaker는 ML 모델을 규모에 맞게 교육, 테스트, 문제 해결, 배포 및 관리할 수 있는 다양한 MLOps 도구를 제공합니다.

이 세션에서는 SageMaker Pipeline, SageMaker Projects, SageMaker Experimentals, SageMaker Model Registry 및 SageMaker Model Monitor를 비롯한

Amazon SageMaker MLOps 기능을 살펴보면서 자동화를 높이고 ML 워크플로우의 품질을 개선하는 방법에 대해 알아 보았습니다.

 

 

MLOps는 규모에 맞는 고성능 ML 모델을 지속적으로 더 빠르게 제공함으로써 다음과 같은 이점들을 갖게됩니다.

  • Agility : 더 빠른 반복 및 사용 편의성
  • Quality : 고성능 모델
  • Economy : 시간 및 비용 절감

 

 

MLOps 사용 사례 중 하나는 다음과 같이 Develop, Deploy 단계로 이루어져 있습니다.

Develop 단계에서는 환경 프로비저닝, 실험 수행이 이루어집니다.

Deploy 단계에서는 모델 학습 자동화, 모델 패키지 및 테스트, 모델 배포 및 모니터링을 수행하게 됩니다.

 

 

고객에게 제공되는 실질적 이점들은 다음과 같습니다.

  • 출시시간을 약 4배 빠르게 단축 가능
  • 약 85% 재사용이 가능한 ML 솔루션 및 아티팩트
  • 약 8배 감소된 FTE 오버헤드

 

 

템플릿을 사용하여 표준화하는 방식은 다음과 같습니다.

 

[데이터 사이언티스트를 위한 원클릭 환경 프로비저닝]

  • Best practices에 따라 소스 제어 작업 방향 표준화
  • 데이터 사이언티스트에게 노트북 및 시드 코드 제공
  • 개발 계정을 위한 CI/CD 파이프라인 설정 (“코드로서의 ML Infrastructure”)

 

[Github에서 사용자 정의 템플릿 라이브러리 증가]

 

 

ML 실험을 관리하는 방식은 다음과 같습니다.

[Top 피드백]

  • IDE에서 로깅 사용
  • 개념 단순화 (Experiments/Trials/Trial Components)
  • 실험 시각화, 비교, 공유
  • HPO 실험 지원 (parallel coordinate 차트 등)
  • Model Registry/MLOps와 더 나은 통합

 

 

모델 개발 자동화하는 방식은 다음과 같습니다.

[모델 학습 워크플로우 자동화]

  • ML 관련 : 데이터 처리, 모델 학습, 모델 평가
  • 서버리스 : 인프라를 관리할 필요가 없음
  • 내결함성 : 내장된 캐싱, 재시도 및 오류 처리
  • 통합성 : 감사성과 재현성을 위해 SageMaker에 기록된 파이프라인 실행

 

 

[새로운 기능들]

  • SageMaker 파이프라인 로컬 모드
  • SageMaker Autopilot 단계
  • 교차 계정 검색과 활성화
  • 간소화된 Python SDK

 

 

[테스트를 위한 로컬 모드]

로컬 모드의 SageMaker Job 내에서 적은 데이터셋으로 전처리 후 모델 학습하고 적은 데이터셋으로 배치 변환하는 과정을 통해

파이프라인을 테스트할 수 있습니다. SageMaker 로컬 모드 테스트의 이점은 다음과 같습니다.

  • Agility : 시작 시간을 발생 없이 파이프라인 정의를 신속하게 테스트
  • Economy : 클라우드 인스턴스 실행 비용 없이 파이프라인 정의 테스트

 

 

[AutoML 지원]

AWS의 다양한 서비스들은 SageMaker AutoML을 더 유연하고 확장 가능 하도록 지원합니다. (ex. AWS Lambda, S3, 등)

 

[교차 계정 공유]

교차 계정 공유의 이점은 다음과 같습니다.

  • Agility : 여러 계정에 로그인할 필요 없이 AWS 계정 전반에 걸쳐 자동화 가능
  • Economy : 엔터프라이즈 계정 간 파이프라인 중복으로 인한 “Pipeline jungles” 부채 방지

[SDK 단순화]

 

 

[운영 모델 모니터링]

운영중인 데이터와 모델들을 다양한 지표를 통해 모니터링이 가능합니다. 운영 모델 모니터링을 통해 데이터 품질, 모델 품질 모니터링이 가능하며

추가로 Amazon SageMaker Clarify와의 통합으로 모델 편향, 모델 설명력까지 모니터링이 가능합니다.

 

 

[배치 추론]

정의된 스케줄에서 배치 추론을 위한 모델 품질, 편향, 피쳐 드리프트를 모니터링합니다. 배치 추론 모니터링을 통해 얻을 수 있는 이점은 다음과 같습니다.

  • Agility : 배치 추론 결과를 지속적으로 모니터링하여 성능이 저하될 때 팀에 알리거나 최신 데이터로 모델을 재 학습
  • Economy : 모델 성능 저하가 애플리케이션에 미치는 다운스트림 영향 최소화

 

 

규모에 맞는 ML 채택을 위한 지표들은 다음과 같습니다.

  • End-to-end 솔루션의 신속한 제공
  • 데이터 검색 및 접근 간소화
  • 단순화된 ML모델의 경로로 작동
  • 최종 사용자의 셀프서비스 환경 조성

 

MLOps 워크로드를 실질적으로 조직에 반영하기 위해 고려해야할 부분, 실질적 이점과 기대효과 등을 배울 수 있었습니다.

 

 

👉본 세션 내용 관련하여 추가 문의나 요청 사항이 있으시다면? 우측 링크로 이동하셔서 편하게 의견을 남겨주세요! https://www.megazone.com/contact/

 

👉 다른 세션 후기글이 궁금하시다면? 아래 링크를 통해 확인해 주세요!

🔷Keynote Report #1. Day1 Monday Night Live with Peter DeSantis 확인하기

🔷Keynote Report #2. Day2 Adam Selipsky Keynote 확인하기

🔷Keynote Report #3. Day3 Swami Sivasubramanian Keynote 확인하기

🔷Keynote Report #4. Day4 Dr.Werner Vogels Keynote 확인하기

 

✅1. 데이터 보호 세션 후기 확인하기

✅2. 마이그레이션 세션 후기 확인하기

✅3. 현대화 (Modernization)세션 후기 확인하기

✅4. SAP 세션 후기 확인하기

✅5. 쿠버네티스 세션 후기 확인하기

✅6. 마이그레이션2 세션 후기 확인하기

✅7. 분석 세션 후기 확인하기

✅8. AI/ML 세션 후기 확인하기

✅9. AI/ML 2 세션 후기 확인하기

✅10. 현대화 (Modernization) 2 세션 후기 확인하기

✅11. 현대화 (Modernization) 3 세션 후기 확인하기

✅12. Data Lakes 세션 후기 확인하기

✅13. 네트워킹 세션 후기 확인하기

✅14. 마이그레이션3 세션 후기 확인하기

✅15.비용 최적화 세션 후기 확인하기

✅16. 보안 세션 후기 확인하기

✅17. SAP 2 세션 후기 확인하기

✅18. 마이그레이션4 세션 후기 확인하기

✅19. DevOps 세션 후기 확인하기

✅20. 신규업데이트 세션 후기 확인하기

✅21. 스토리지 세션 후기 확인하기

✅22. Amazon 세션 후기 확인하기

✅23. 신규업데이트2 후기 확인하기

✅24. 거버넌스 후기 확인하기

✅25. 거버넌스2 후기 확인하기

✅26. DevOps 2 후기 확인하기

✅27. AI/ML 3 세션 후기 확인하기

✅28. 분석2 세션 후기 확인하기

✅29. 쿠버네티스2 세션 후기 확인하기

✅30. 분석 3 세션 후기 확인하기

✅31. 서버리스 컴퓨팅 세션 후기 확인하기

✅32. 신규 업데이트 3 세션 후기 확인하기

✅33. 신규 업데이트 4 세션 후기 확인하기

✅34. 보안 2 세션 후기 확인하기

✅35. 분석 4 세션 후기 확인하기

✅36. 모니터링 세션 후기 확인하기

✅37. AI/ML 4 세션 후기 확인하기

✅38. 운영 세션 후기 확인하기

✅39. 운영 2 세션 후기 확인하기

✅40. 데이터베이스 세션 후기 확인하기

✅41. 데이터베이스 2 세션 후기 확인하기

✅42. 보안 3 세션 후기 확인하기

✅43. SaaS 세션 후기 확인하기

✅44. 컴퓨팅 세션 후기 확인하기

✅45. 신규 업데이트 : AWS SnapStart 세션 후기 확인하기

✅46. 신규 업데이트 : 네트워크 최적화 인스턴스와 최신 Amazon EC2 네트워킹 세션 후기 확인하기

✅47. 아키텍처 세션 후기 확인하기

✅48. SAP 3 세션 후기 확인하기

✅49. 고객사례 세션 후기

✅50. SAP 4 세션 후기 확인하기

✅51. 데이터베이스, 마이그레이션 세션 후기 확인하기

✅52. 보안 4 세션 후기 확인하기

✅53. 보안 규정 세션 후기 확인하기

✅54. 데이터베이스 3 세션 후기 확인하기

✅55. 신규 업데이트 5 세션 후기 확인하기

✅56 .DevOps 3 세션 후기 확인하기

✅57. 분석 5 세션 후기 확인하기

✅58. AI/ML 5 세션 후기 확인하기

✅59. DevOps 4 세션 후기 확인하기

✅60. 신규업데이트 6 세션 후기 확인하기

✅61. 분석 6 세션 후기 확인하기

✅62. 데이터 보호 세션 후기 확인하기

✅63. AI/ML 6 세션 후기 확인하기

✅64. DevOps 5 세션 후기 확인하기

✅65. 신규업데이트 7 세션 후기 확인하기

✅66. 신규 업데이트 8 세션 후기 확인하기