BLOG

Amazon Comprehend가 이제 Syntax Analysis를 지원합니다.
작성일: 2018-08-03

Amazon Comprehend가 Syntax API를 제공함을 알려드리게 되었습니다. 이를 통해 텍스트(ex) 단어 경계 추출용) 및 각 단어의 해당 part of speech (PoS)을 토큰화하여 사용할 수 있습니다.

Amazon Comprehend는 고객 의견이 부정적인지 긍정적인지를 파악하고 “Amazon”과 같은 고유 명사를 “조직”으로 식별하는 것과 같은 분석 유스 케이스를 가능하게 합니다. 새로운 Syntax API를 통해 고객은 가장 상세한 수준의 텍스트와 단어 자체의 구문론적 의미를 분석할 수 있으므로 더 다양한 범위의 유스 케이스를 다루는 텍스트 문서를 보다 세밀하게 분석할 수 있습니다.

예를 들어 지금 방금 주방 믹서기 제품을 출시했다고 가정해 봅시다, 그리고 여러분은 고객 의견을 분석하여 가장 많이 언급된 색상을 확인하려고 합니다.

그렇다면, API에 대해 다음 문자열을 제안할 수 있습니다.

“나는 내 새로운 빨간색 믹서기에 너무 만족해”

응답은 각 단어, 토큰 ID, 단어 자체, 오프셋 (텍스트 내의 단어 위치), 품사 태그 (단어가 형용사, 명사 또는 동사인지 여부) 및 신뢰도 점수(품사 태그에서 정확한 서비스 신뢰도) 등을 통하여 돌아옵니다.

다음은 응답의 예입니다.

{

    “SyntaxTokens”: [

        {

            “Text”: “It”,

            “EndOffset”: 2,

            “BeginOffset”: 0,

            “PartOfSpeech”: {

                “Tag”: “PRON”,

                “Score”: 0.8389829397201538

            },

            “TokenId”: 1

        },

        {

            “Text”: “is”,

            “EndOffset”: 5,

            “BeginOffset”: 3,

            “PartOfSpeech”: {

                “Tag”: “AUX”,

                “Score”: 0.9189288020133972

            },

            “TokenId”: 2

        },

        {

            “Text”: “raining”,

            “EndOffset”: 13,

            “BeginOffset”: 6,

            “PartOfSpeech”: {

                “Tag”: “VERB”,

                “Score”: 0.9977611303329468

            },

            “TokenId”: 3

        },

        {

            “Text”: “today”,

            “EndOffset”: 19,

            “BeginOffset”: 14,

            “PartOfSpeech”: {

                “Tag”: “NOUN”,

                “Score”: 0.9993606209754944

            },

            “TokenId”: 4

        },

        {

            “Text”: “in”,

            “EndOffset”: 22,

            “BeginOffset”: 20,

            “PartOfSpeech”: {

                “Tag”: “ADP”,

                “Score”: 0.9999061822891235

            },

            “TokenId”: 5

        },

        {

            “Text”: “Seattle”,

            “EndOffset”: 30,

            “BeginOffset”: 23,

            “PartOfSpeech”: {

                “Tag”: “PROPN”,

                “Score”: 0.9940338730812073

            },

            “TokenId”: 6

        },

        {

            “Text”: “.”,

            “EndOffset”: 31,

            “BeginOffset”: 30,

            “PartOfSpeech”: {

                “Tag”: “PUNCT”,

                “Score”: 0.9999997615814209

            },

            “TokenId”: 7

        }

    ]

}

 

이 서비스는 요청당 단일 문서에 대한 DetectSyntax API 조치 또는 요청당 최대 25 개의 문서에 대한 BatchDetectSyntax API 조치를 사용하여 동기 요청 지원을 제공합니다.

예를 들어 AWS CLI를 사용하면 이전 요청은 다음과 같습니다.

[user]$ aws comprehend detect-syntax –text “I love my red kitchen blender” –language-code en

 

Syntax API 및 나머지 Comprehend API는 AWS SDK (https://aws.amazon.com/tools/)에서 사용할 수 있습니다.

Amazon Comprehend에 대한 자세한 내용을 보려면 https://aws.amazon.com/comprehend/를 방문해 주세요.

 

원문 URL: https://aws.amazon.com/ko/blogs/machine-learning/amazon-comprehend-now-supports-syntax-analysis/

** 메가존 TechBlog는 AWS BLOG 영문 게재글중에서 한국 사용자들에게 유용한 정보 및 콘텐츠를 우선적으로 번역하여 내부 엔지니어 검수를 받아서, 정기적으로 게재하고 있습니다. 추가로 번역및 게재를 희망하는 글에 대해서 관리자에게 메일 또는 SNS페이지에 댓글을 남겨주시면, 우선적으로 번역해서 전달해드리도록 하겠습니다.