Back
Key Takeaway
Databricks에서 BigQuery로의 전환으로 분석 성능과 비용 효율을 동시에 개선
Databricks 환경의 테이블·쿼리·노트북을 BigQuery로 성공적으로 이전해 쿼리 성능을 향상시키고, 서버리스 아키텍처 기반의 비용 효율적이고 확장 가능한 데이터 분석 환경을 구축했습니다.
Fandom platform (H Company)
고객사 :Fandom platform (H Company)
산업군 :Telco / Media / Software
서비스 영역 :Data & AI
적용 솔루션 :AIR
1. Overview (프로젝트 배경)
본 프로젝트는 데이터 파이프라인과 관련 프로세스를 전반적으로 최적화하여
데이터 활용성과 분석 효율을 극대화하는 것을 목표로 추진되었습니다.
기존 환경에서는 분석 쿼리 성능, 운영 복잡성, 비용 측면에서 지속적인 개선 요구가 있었으며,
이를 해결하기 위해 데이터 관리 비용을 장기적으로 절감하고 분석 속도를 향상시킬 수 있는
보다 효율적인 데이터 플랫폼 전환이 필요했습니다.
특히 쿼리 성능 개선, 마이그레이션을 통한 비용 효율 확보,
운영 관리 부담 완화와 함께 GCP의 다양한 서비스와의 연동 용이성이 중요한 고려 요소로 작용했습니다.
2. Solution (해결 방안)
본 프로젝트에서는 Databricks 플랫폼에 저장되어 있던 데이터를 GCP BigQuery로 이전하는 것을 핵심 목표로 설정하고,
기존 분석 환경을 BigQuery 기반으로 안정적으로 전환하는 작업을 수행했습니다.
이를 위해 Databricks 환경에서 사용되던 테이블, 쿼리, 노트북 자산을 BigQuery 환경에 맞게 재구성했으며,
주요 수행 내용은 다음과 같습니다.
BigQuery 환경에 맞는 테이블 구조를 새롭게 정의하고 생성
Databricks에서 사용 중이던 코드와 SQL 쿼리를 BigQuery 문법에 맞게 수정 및 변환
변환된 코드와 쿼리를 실제 BigQuery 환경에서 실행하여
에러 발생 여부와 결과 정확성을 확인하는 검증 절차 수행
이를 통해 데이터 이전 과정에서의 안정성과 신뢰성을 확보했습니다.
3. Result (성과)
주요 개선 사항
BigQuery의 서버리스 아키텍처와 최적화된 쿼리 엔진을 활용함으로써
대규모 데이터 분석 쿼리의 처리 속도가 개선되었고,
인프라 운영 및 관리에 소요되던 비용과 부담이 함께 감소했습니다.
또한 Google Cloud의 강력한 보안과 안정적인 인프라를 기반으로
안정적이면서도 확장 가능한 데이터 플랫폼 환경을 구축할 수 있었으며,
향후 데이터 증가에도 유연하게 대응할 수 있는 구조를 확보했습니다.
BigQuery를 중심으로 데이터 분석과 처리에 필요한 기능을 일원화함으로써,
데이터 기반 의사결정을 보다 빠르고 효율적으로 수행할 수 있는 환경을 마련했습니다.








