BLOG

이제 Amazon Comprehend는 크기가 큰 문서의 비동기 작업을 지원합니다.
작성일: 2018-07-12

Amazon Comprehend는 기계 학습을 사용하여 텍스트에서 통찰력과 관계를 찾는 자연 언어 처리 (NLP) 서비스입니다. 새로운 비동기 작업 서비스를 사용하여 Amazon S3 버킷에 저장된 문서를 분석할 수 있는 옵션이 있습니다. REST API에 대한 단일 또는 여러 문서 동기화 호출 외에도 애플리케이션 요구 사항에 가장 적합한 다양한 옵션을 제공합니다.

 

비동기 작업은 애플리케이션에 서비스의 동기 응답이 필요하지 않을 때 대용량 데이터셋을 분석하는 데 특히 유용합니다. 예를 들어 이러한 작업을 매일, 매주 또는 매월 텍스트 분석 배치 실행으로 실행할 수 있습니다.

 

새로운 비동기 작업은 엔티티 및 키 구문 탐지를 위해 최대 100KB, 언어 감지를 위해 1MB, 감정 감지를 위해 5KB의 개별 문서를 지원합니다. 배치에 있는 모든 파일의 전체 크기는 5GB 미만이어야 하며 배치당 100만개 이상의 개별 파일을 제출할 수 없습니다.

 

자연 언어 처리를 응용 프로그램에 통합하는 것은 쉽습니다. Amazon Comprehend는 핵심문구 추출, 감정 분석, 엔티티 인식, 주제 모델링 및 언어 탐지 API를 제공합니다.

 

이 릴리스에서 Amazon Comprehend는 이제 다음 작업을 제공합니다.

  • 동기식 단일 문서 작성—단일 문서로 Amazon Comprehend에 호출해 동기식 응답을 받습니다.
  • 동기식 다중 문서(요청에 따라 25개)—최대 25개의 문서 모음으로 Amazon Comprehend에 호출해 동기식 응답을 받습니다.
  • 비동기 배치 작업(5GB 작업 크기 제한, 100KB 문서 크기)—Amazon S3 버킷에 저장된 문서 모음을 사용하고 비동기 작업을 시작하여 문서를 분석합니다. 분석 결과는 S3 버킷에 반환됩니다.

 

문서 모음을 분석하려면 일반적으로 다음 단계를 수행합니다.

 

  1. 문서를 Amazon S3 버킷에 저장합니다.
  2. 하나 이상의 작업을 시작하여 문서를 분석합니다.
  3. 분석 작업의 과정을 모니터링합니다.
  4. 작업이 완료되면 분석 결과를 조회하십시오.

 

비동기 처리 작업을 시작하는 방법에 대해 알아보려면 Amazon Comprehend 설명서를 읽어 보십시오.

 

원문 URL: https://aws.amazon.com/ko/blogs/machine-learning/amazon-comprehend-now-supports-asynchronous-processing-along-with-larger-document-sizes/

** 메가존 TechBlog는 AWS BLOG 영문 게재글중에서 한국 사용자들에게 유용한 정보 및 콘텐츠를 우선적으로 번역하여 내부 엔지니어 검수를 받아서, 정기적으로 게재하고 있습니다. 추가로 번역및 게재를 희망하는 글에 대해서 관리자에게 메일 또는 SNS페이지에 댓글을 남겨주시면, 우선적으로 번역해서 전달해드리도록 하겠습니다.