Apache Spark 및 Hadoop을 Amazon EMR로 마이그레이션하여 비용 절감하기

BLOG Apache Spark 및 Hadoop을 Amazon EMR로 마이그레이션하여 비용 절감하기 작성일: 2019-01-11 Apache Spark와 Hadoop은 종종 기존 접근 방식의 비용보다 훨씬 적은 비용으로 분석을 위한 데이터를 처리하는 인기 있는 프레임워크이지만, 규모가 커지면 여전히 값비싼 제안이 될 수 있습니다. 이 글은 총 소유 비용을 절감하는 동시에 직원 생산성을 향상시키는 방법에 대해 논의합니다. 이는 사내 워크로드를 Amazon EMR로…

Amazon EMR의 Amazon S3에서 Apache HBase로 마이그레이션: 지침 및 모범 사례

BLOG Amazon EMR의 Amazon S3에서 Apache HBase로 마이그레이션: 지침 및 모범 사례 작성일: 2018-10-12 이 글은 HDFS의 Apache HBase에서 Amazon EMR의 Amazon S3의 Apache HBase로 마이그레이션하는 방법에 대한 지침과 모범 사례를 제공합니다.   Amazon EMR의 Amazon S3에 있는 Apache HBase Amazon EMR 버전 5.2.0 이상을 사용하면 Amazon S3에서 Apache HBase를 실행할 수 있습니다. Amazon S3을…

Amazon EMR의 크기 조정 및 자동 스케일링 모범 사례

BLOG Amazon EMR의 크기 조정 및 자동 스케일링 모범 사례 작성일: 2018-07-11   Amazon EMR에서 제공하는 동적 스케일링 기능을 활용하여 비용 절감 효과를 높일 수 있습니다. 클러스터에서 노드 수를 빠르게 늘리거나 줄이는 기능은 Amazon EMR을 탄성 있게 만드는 주요 특징들입니다. 워크로드가 거의 없거나 없을 때 클러스터의 크기를 조정하여 EMR의 스케일링을 활용할 수 있습니다. 작업이 너무…

AWS Glue Data Catalog를 사용하여 Amazon EMR에서 Presto를 실행하기 위한 테이블 메타데이터를 손쉽게 관리하기

BLOG AWS Glue Data Catalog를 사용하여 Amazon EMR에서 Presto를 실행하기 위한 테이블 메타데이터를 손쉽게 관리하기 작성일: 2018-03-23 Amazon EMR은 Apache Spark, Apache HBase, Presto및 Apache Flink과 같은 널리 사용되는 분산 프레임워크를 사용하여 많은 고객이 빅 데이터 처리 애플리케이션을 빠르고 비용 효율적으로 구축하도록 지원합니다. Amazon EMR를 기반으로 분석 애플리케이션을 만들고 있는 조직의 경우, 데이터 자산을 자동으로…