BLOG

라이프사이클 구성과 인터넷 액세스를 비활성화하는 옵션을 사용하여 Amazon SageMaker 노트북 인스턴스를 커스터마이즈합니다.
작성일: 2018년 3월 30일

Amazon SageMaker는 데이터 탐색 및 사전 처리를 위해 Jupiter 노트북을 실행하는 완벽하게 관리되는 인스턴스를 제공합니다. 고객은 한번의 클릭만으로 사전 구성된 노트북 인스턴스를 얼마나 쉽게 시작할 수 있는지를 잘 알고 있습니다. 현재는 노트북 인스턴스를 커스터마이즈하여 프로세스를 자동화하는 라이프 사이클 구성 및 노트북 인스턴스에 통제된 보안 설정을 적용할 수 있도록 공용 인터넷에서 노트북 인스턴스의 연결을 끊는 기능 등의 두 가지 옵션을 제공하여 노트북을 더욱 커스터마이즈할 수 있도록 하고 있습니다.

 

노트북 인스턴스의 라이프사이클 구성하기

Amazon SageMaker는 현재 노트북 인스턴스에 추가적인 라이브러리를 수동으로 설치하는 기능을 제공하고 있습니다. 하지만 노트북 인스턴스가 종료되면 이러한 추가된 커스터마이즈 항목도 제거되어 노트북 인스턴스를 다시 시작할 때 수동으로 다시 추가해야 합니다. Amazon SageMaker의 새로운 라이프사이클 구성 기능을 사용하면 이제 이러한 커스터마이즈를 자동화하여 인스턴스 라이프사이클의 여러 단계에서 적용할 수 있습니다. 예를 들어, 스크립트를 작성하여 라이브러리 목록을 설치하고 라이프사이클 구성 기능을 사용하여 노트북 인스턴스가 시작될 때마다 스크립트가 자동으로 실행되도록 구성할 수 있습니다. 마찬가지로, 노트북 인스턴스가 생성될 때 스크립트를 자동으로 한번만 실행하도록 선택할 수 있습니다.

 

TurboTax 및 QuickBook과 같은 글로벌 제품 및 플랫폼을 제공하는 것으로 알려진 Intuit는 라이프사이클 구성을 사용하여 보안 스캐너 배포 및 라우팅 규칙을 재구성하는 등 노트북 인스턴스의 보안 설정을 커스터마이즈합니다. Intuit는 또한 노트북 인스턴스에 대한 직접적으로 인터넷 액세스를 비활성화하고, VPC에 배포된 전용 패키지 색인을 활용하여 부트스트랩 패키지를 설치하기 위해 라이프사이클 구성을 사용합니다.

 

노트북 인스턴스에 대한 직접적인 인터넷 액세스를 비활성화하는 옵션

지금까지 모든 Amazon SageMaker 노트북 인스턴스에는 기본적으로 인터넷에 직접적으로 액세스 할 수 있는 기능이 있었으며 이는 사용하지 않도록 설정할 수 없습니다. 이를 통해 인기 있는 패키지, 노트북 및 데이터세트를 다운로드하고 공용 인터넷을 통해 다른 Amazon SageMaker 구성 요소에 액세스 할 수 있습니다. 그러나, 노트북 인스턴스를 VPC(Virtual Private Cloud)에 연결하는 경우 노트북 인스턴스 보안에서 설명하는 것처럼, 이 인스턴스를 통해 데이터에 액세스 할 수 있는 추가적인 방법을 제공할 수 있습니다. 결과적으로, 일부 고객들은 특히, 그들의 VPC와 연결된 노트북 인스턴스에 대한 인터넷 접속을 제어할 수 있는 능력을 요구해 왔습니다. 이제 Amazon SageMaker 노트북 인스턴스에 대한 기본적으로 인터넷에 직접적으로 액세스를 사용하지 않도록 설정할 수 있습니다. 이렇게 하면 노트북 인스턴스가 인터넷에 액세스 할 수 있는지 여부를 조절하기 위해 VPC 구성을 활용할 수 있습니다.

 

이러한 새로운 기능을 시작하려면 Amazon SageMaker 콘솔을 열고 노트북 인스턴스를 생성합니다. 페이지 아래쪽에 있는 라이프사이클 구성으로 이동합니다. 계정에 아직 라이프사이클 구성이 없으므로 처음 사용 시 라이프사이클 구성 생성을 선택합니다.

 

 

모달 대화상자가 나타나면 첫 번째 라이프사이클 구성을 생성합니다. 더 많은 라이프사이클 구성을 생성할 때 여기의 기존 구성에 대한 드롭다운 목록에서 선택할 수 있습니다.

 

이 팝업 창에서 라이프사이클 구성에 이름을 지정하고, 사용자의 특정 필요에 따라 노트북 시작 또는 노트북 생성 아래의 텍스트 상자에 사용자 지정 스크립트를 넣은 다음, 구성 생성을 선택합니다. 이 예시에서는 노트북 인스턴스가 시작될 때마다 yaml 패키지가 자동으로 설치되어 사용할 수 있도록 준비됩니다. 이 때 첫 번째 라이프사이클 구성이 생성됩니다. 그런 다음 노트북 인스턴스 생성을 선택합니다. 노트북 인스턴스가 생성되어 시작되고, 사용자가 구성한 대로 스크립트가 실행됩니다. 그럼 됩니다!

 

 

사용자의 라이프사이클 구성을 관리하는 것도 매우 쉽습니다. 왼쪽 탐색 창의 노트북 인스턴스에서 라이프사이클 구성을 선택하십시오.

 

 

여기서는 사용자가 생성한 모든 라이프사이클 구성을 볼 수 있습니다. 새 라이프사이클 구성을 생성하거나 기존 라이프사이클 구성을 편집/삭제할 수 있습니다.

 

AWS SDK도 사용하면 동일한 목표를 달성할 수 있지만 Amazon SageMaker 콘솔을 통해 직접적으로 인터넷에 액세스 할 수 없는 노트북 인스턴스를 만드는 과정을 살펴보겠습니다.

 

먼저, Amazon SageMaker 콘솔에서 탐색 모음의 노트북 인스턴스를 선택하고 노트북 인스턴스 생성을 선택합니다.

 

 

그런 다음 노트북 인스턴스 설정에 필요한 모든 필드를 입력하고 노트북 인스턴스 연결에 사용할 VPC를 선택합니다. 다른 필드 중 몇 개가 사용하도록 설정되어 있습니다. VPC 설정의 일부로 서브넷보안 그룹을 선택합니다. 직접적으로 인터넷 액세스를 사용하지 않도록 설정하려면 직접적인 인터넷 액세스에서 VPC에만 사용을 하도록 설정을 선택하고 아래쪽에 있는 노트북 인스턴스 생성 버튼을 선택합니다. 이제 다 되었습니다!

 

 

몇 분 후에, 노트북 인스턴스가 인터넷에 직접 접속하지 않고 작동될 것입니다. 이 경우에는 VPC에 NAT 게이트웨이가 있고 보안 그룹에서 아웃바운드 연결을 허용하지 않는 한 이 노트북 인스턴스에서 모델을 교육하거나 배포할 수 없습니다. VPC에 NAT 게이트웨이를 설정하는 방법에 대한 자세한 내용은 Amazon Virtual Private Cloud 사용자 가이드에서 NAT 게이트웨이 작업을 참조하십시오. 보안 그룹에 대한 자세한 내용은 VPC의 보안 그룹을 참조하십시오.

 

결론
간략하게 요약하면, Amazon SageMaker 노트북 인스턴스에 대한 라이프사이클 구성 옵션과 인터넷 액세스를 비활성화하는 기능이 현재 미국 동부(버지니아 북쪽), 미국 동부(오하이오), 유럽 연합(Ireland)및 미국 서부(오리건) 지역에서 제공됩니다. 자세한 내용을 보려면 Amazon SageMaker 노트북 인스턴스 설명서를 참고하십시오.

 

 

원문 URL: https://aws.amazon.com/ko/blogs/machine-learning/customize-your-amazon-sagemaker-notebook-instances-with-lifecycle-configurations-and-the-option-to-disable-internet-access/

** 메가존 TechBlog는 AWS BLOG 영문 게재글중에서 한국 사용자들에게 유용한 정보 및 콘텐츠를 우선적으로 번역하여 내부 엔지니어 검수를 받아서, 정기적으로 게재하고 있습니다. 추가로 번역및 게재를 희망하는 글에 대해서 관리자에게 메일 또는 SNS페이지에 댓글을 남겨주시면, 우선적으로 번역해서 전달해드리도록 하겠습니다.