BLOG

메가존클라우드가 들려주는 AWS re:Invent 2021 리얼 세션 후기 #8
작성일: 2021-12-02

#ML #DataExchange #SageMaker

 

지환 : 여러분 안녕하십니까. 라스베이거스 현지에 나와 있는 메가존클라우드 현지환 이라고 합니다. 리인벤트 첫 날 머신러닝과 관련된 많은 워크샵이 있었습니다. 장시간의 소요 시간에도 많은 사람들이 참석해서 주목을 끌었는데요. 어떤 이유로 인기가 있었는지 참가자를 모시고 이야기를 들어 보고자 합니다.

 

리포터 이성인님을 모셔서 잠시 이야기를 나눠 보겠습니다.

 

안녕하세요 성인님.

 

성인 : 안녕하세요. 이성인 입니다.

 

지환 : 오늘 리인벤트 첫 날 세션은 어떠셨나요?

 

성인 : 오늘 하루에만 여러번의 워크샵이 열리는 것을 확인하고 처음부터 워크샵을 중심으로 참여하기로 했습니다. 버추얼로 공개되는 세션은 많지만 워크샵은 현장의 경험을 그대로 살리기 어렵다는 조언을 듣고 결정했습니다. 막상 참여해보니 잘 한 결정이었다는 생각이 드는데요. 그 중에서 소개하고 싶은 워크샵이 있어서 추천해 드리고자 합니다.

 

지환 : 상당히 전략적으로 접근하셨네요. 과연 어떤 선택이었을지. 어떤 재미가 숨어있었는지. 어떤 것을 배우셨는지 정말 궁금하네요. 그럼 소개해 주시겠습니까?

 

성인 :Build secure and compliant ML and data-backed applications’라는 워크샵입니다.

 

고객이 보안에 대해서는 신경쓰지 않고 원하는 머신 러닝 모델을 빨리 배포할 수 있도록 하기 위해서 이 워크샵을 제작하였다고 합니다. Service Catalog를 이용해 사용자가 프로비저닝할 수 있는 서비스를 통제 합니다. AWS Data Exchange에서 Shutterstock 데이터셋 구독, AWS Marketplace에서 사전 학습된 머신 러닝 모델(ResNet-18) 구독 합니다. 구독한 모델을 SageMaker 엔드포인트로 배포하여 사용하는 방식으로 진행 됩니다.

 

 

지환 : 모델을 구독한다니 재미있는 구조군요!

 

성인 : 네 그렇지요. 실제로 직접 데이터를 모아서 직접 모델을 학습시키는 것보다 사전 학습된 써드파티 모델을 사용함으로써 노동력과 시간을 절약할 수 있습니다. AWS Marketplace에서 써드파티 머신 러닝 모델을 구독하면 Network Isolation Mode를 통해 VPC 내에서만 ML 모델을 사용하도록 설정하고, VPC Flow Logs를 통해 모델 사용에 대한 가시성을 확보하는 등 보안적인 이점을 얻을 수 있습니다. 또한, 실제 데이터 수집에 들어가는 시간도 함께 줄일 수 있어서 매우 좋은 방식이 아닐까 싶습니다.

 

지환 : 장점이 뚜렷한 만큼 실제로 더 활성화되면 더 많은 유스케이스와 더 많은 구독 가능한 모델이 생겨서 선순환 구조가 늘어갈 것 같네요.

 

성인 : 맞습니다. 그렇기 떄문에 워크샵을 통해서 미리 확인해 보시면 꽤 재미있는 컨셉이고 더 발전할 것이라는 점을 느끼실 수 있을 것 입니다.

 

지환 : 워크샵 하나하나가 이렇게 의미 있기도 쉽지 않을 것 같습니다. 덕분에 좋은 간접 경험을 하는 것 같습니다. 마지막으로 해당 세션에 대해서 정리 해주시겠습니까?

 

성인 : 데이터를 수집하고 머신 러닝 모델을 학습하는 작업을 처음부터 하는 것은 매우 어려운 일입니다. AWS Data Exchange와 Marketplace에 있는 써드파티 데이터와 모델을 이용하면 쉽게 머신 러닝을 비즈니스에 적용할 수 있으니 적극적으로 활용해 보시기 바랍니다.

 

 

MKT301 : Build secure and compliant ML and data-backed applications

 

연사 : Lauren Mullennex,  Om Patri, Kanchan Waikar

일시: 2021.11.29 10:00 ~ 12:15

장소: Venetian, Level 2, Bellini 2006

 

지환 : 네, 소개 감사합니다. 해당 워크샵은 아래 링크에서 체험해 보실 수 있습니다.

https://catalog.us-east-1.prod.workshops.aws/v2/workshops/928b27c0-45d7-4463-8263-23e0343141de/en-US

앞서 말씀드린 대로 버추얼 리인벤트에서는 워크샵을 상영하지 않으니 꼭 링크로 들어가서 경험해 보시기를 권장 드립니다.

아, 그런데 순모님이 참가하신 워크샵에 성인님도 참가하셨다고 들었습니다. 같은 워크샵을 체험하는 관점에서 다른 인사이트가 있었을 것 같은데 어떠셨나요?

 

성인 : 네 저도 함께 참여했습니다. ‘Using Hugging Face models on Amazon SageMaker’라는 워크샵이었습니다.

 

NLP(Natural Language Processing, 자연어처리)는 큰 데이터를 가지고 큰 모델을 학습시키기 때문에 시간이 많이 소요되는 분야입니다. 모델을 배포하고 모니터링 하는 것은 모델 학습과 또 다른 문제인데요. 그래서 오픈소스로 여러 사전학습된 모델을 가져다 쓸 수 있는 Hugging Face가 생겨났다고 합니다. Hugging Face와 SageMaker가 협업하여 자연어 처리 파이프라인을 자동화할 수 있도록 지원합니다. SageMaker의 HuggingFace estimator를 사용하여 Hugging Face에 등록된 모델을 간단하게 불러올 수 있는데요. 별도의 학습용 인스턴스를 띄워 별도의 환경에서 모델을 학습할 수도 있습니다. 이때 스팟 인스턴스를 통한 학습으로 비용을 절감할 수 있습니다. 큐 기능을 이용한 비대칭 추론 기능이 새로 출시되었으니 이 점도 살펴 보시면 좋을 것 같습니다.

 

지환 : 스팟 인스턴스를 통한 비용 절감이라는 부분도 중요한 것 같습니다. 그럼 마지막으로 해당 세션에 대해서 정리 해주시겠습니까?

 

성인 : NLP의 경우 데이터와 모델의 방대함으로 인해 직접 모델을 학습시키는 것이 특히나 힘든 분야 중 하나입니다. 사전 학습된 오픈소스 모델을 제공하는 Hugging Face와 엔드-투-엔드 머신러닝 파이프라인을 쉽게 구축할 수 있는 SageMaker를 활용한다면 간단한 파인튜닝을 통해 NLP 모델을 쉽게 활용할 수 있을 것이라고 생각됩니다.

 

 

AIM416 : Using Hugging Face Models on Amazon SageMaker

 

연사 : Mani Khanuja, Pallavi Nargund

일시: 2021.11.29 16:45 – 19:00

장소: Wynn, Upper Level, Cristal 1

 

지환 : 역시 같은 워크샵에서도 다른 관점이 보이는 것 같아서 경험을 나누는 것은 매우 좋은 나눔이라는 생각이 듭니다.

 

https://catalog.us-east-1.prod.workshops.aws/v2/workshops/74da6491-2f74-466a-86a5-3bcce6541904/en-US

해당 워크샵은 위에서 즐겨 보시기 바라며, 같은 워크샵을 체험한 순모님의 이야기는 여기(https://www.megazone.com/techblog-reinvent2021-06/)서 보실 수 있습니다.

 

다른 관점에 대해서 인사이트를 주셔서 재미있는 시간 이었던 것 같습니다.

 

짧게 나마 성인님과 리인벤트 첫 날 세션 이야기를 들어 보았습니다. 앞으로 남은 3일간 성인님의 활약을 기대해 주시고요. 저는 다른 리포터와 함께 또 다른 이야기로 찾아오겠습니다. 감사합니다!

 

👉 본 세션 내용 관련하여 추가 문의나 요청 사항이 있으시다면? 우측 링크로 이동하셔서 편하게 의견을 남겨주세요!  https://www.megazone.com/contact/

👉 다른 세션 후기글이 궁금하시다면? 아래 링크를 통해 확인해 주세요❗

1️⃣ #Amazon #S3 #ECR 관련 세션 후기 확인하기

2️⃣ #Amazon EC2 관련 세션 후기 확인하기

3️⃣ #AWS CloudFormation #AWS CDK 관련 세션 후기 확인하기

4️⃣ #Cloud Migration #Amazon Braket 관련 세션 후기 확인하기

5️⃣ #Machine Learning 관련 세션 후기 확인하기

6️⃣ #Amazon SageMaker 관련 세션 후기 확인하기

7️⃣ #graphdatabase #neptune #usecase 관련 세션 후기 확인하기

8️⃣ #ML #DataExchange #SageMaker 관련 세션 후기 확인하기

9️⃣ #Public #AMD 관련 세션 후기 확인하기

🔟 #ECR #container #S3 #MRAP 관련 세션 후기 확인하기

1️⃣1️⃣ #Adam #Selipsky #Keynote 관련 세션 후기 확인하기

1️⃣2️⃣ #Athena #LakeFormation #AWSGluePartitionIndexes 관련 세션 후기 확인하기

1️⃣3️⃣ #Serverless #SAMAccelerate #Lambda 관련 세션 후기 확인하기