bg

AI WebRTC (H Company)

Back

Key Takeaway

Legacy 데이터 구조를 표준화해 분석 신뢰도를 높인 데이터 품질 개선

파편화된 사용자·대시보드 데이터를 Base–Middle–Aggregated 구조로 재설계하고, Fact 테이블과 사용자 데이터 보정을 통해 데이터 활용 범위와 분석 신뢰도를 크게 향상시켰습니다.

AI WebRTC (H Company)

고객사 :AI WebRTC (H Company)

산업군 :Telco / Media / Software / Data & AI

서비스 영역 :Data & AI

적용 솔루션 :AIR

1. Overview (프로젝트 배경)

본 프로젝트는 대시보드 기반 분석 환경에서 사용 중이던 레거시 테이블 구조로 인해 발생하던 데이터 품질 저하와 관리 복잡성을 개선하기 위해 추진되었습니다.
기존에는 대시보드별로 서로 다른 Fact 테이블과 사용자 관련 데이터가 파편화되어 있어, 데이터 활용 범위와 일관성에 한계가 있었습니다.

이에 따라 레거시 테이블을 DWH 관점의 Base → Middle → Aggregated 구조로 재정비하고,
user 관련 데이터 통합 관리, user_ft/cohort 대체 테이블 구성, 모니터링 파이프라인 구축을 통해 데이터 품질과 재사용성을 동시에 확보하는 것을 목표로 했습니다.


2. Solution (해결 방안)

데이터 구조 표준화와 활용 범위 확장을 중심으로 개선 작업을 수행했습니다.

  • Fact 테이블 구조 개선
    대시보드별로 분리되어 있던 Fact 테이블을 정리하고, 공통 Middle·Aggregated 테이블 구조로 재설계

  • 데이터 활용 범위 확대
    모수 기준 조정 및 컬럼 추가를 통해 분석 가능한 데이터 범위 확장

  • Azar Web 데이터 통합
    기존 Legacy 테이블을 Base·Middle 테이블 구조로 통합

  • User 데이터 보정 작업
    users, azar_user_dm 테이블의 누락·불일치 데이터 보정 및 컬럼 의미 정정


3. Result (성과)

데이터 구조 개선을 통해 분석 환경의 일관성과 활용성이 크게 향상되었습니다.

  • Fact 구조 통합
    각 대시보드별로 분리되어 있던 Fact 테이블을 공통 Middle 및 Aggregated 테이블로 통합

  • azar_du_match_ft 개선
    특정 대시보드 기준으로만 사용되던 데이터를 전체 대시보드에서 활용 가능하도록 데이터 범위 확장

  • azar_dt_user_ft 확장
    Session, order, match, inventory, login info 데이터를 추가 적재하고, 신규 컬럼을 통해 분석 활용도 강화

  • Web 이벤트 로그 통합
    여러 웹 대시보드에서 개별 사용되던 event log를 단일 Middle 테이블에서 조회 가능하도록 설계

  • Legacy 로직 재구현 및 통합
    기존 azar_cohort_user_fact_daily 로직을 Base 테이블 기반으로 재구현하고,
    산출된 지표를 기존 Middle 테이블(azar_dt_user_ft, azar_dt_user_history_ft, azar_user_dm)에 통합

  • User 데이터 정합성 개선

    • users 테이블의 deletion_timestamp 누락 데이터 보정

    • cheero 데이터 구분이 불가능했던 app_type 로직 보완

    • reg_country_cd 컬럼을 실제 의미에 맞게 분리하여 등록 국가 코드 컬럼 신규 추가

기대효과

본 개선을 통해 다음과 같은 효과를 기대할 수 있습니다.

  • 데이터 구조 및 명명 규칙 표준화

  • 데이터 리니지 관리 체계 강화

  • 분석 결과물의 체계적 관리 및 재활용 가능

  • 변경 관리 프로세스 및 협업 효율 향상

  • 이상 데이터 사전 정제 프로세스 도입 기반 마련

이를 통해 향후 데이터 품질 개선 작업의 효율성과 성과를 더욱 안정적으로 확대할 수 있는 기반을 확보했습니다.

Related

Case Stories

Yanolja(야놀자)

Yanolja(야놀자)

분산된 SaaS를 하나로, 비용과 리스크를 동시에 관리

Read More
HANATOUR (하나투어)

HANATOUR (하나투어)

초개인화 AI 상담으로 이용자 432% 성장한 여행 서비스

Read More
Doalltech(두올테크)

Doalltech(두올테크)

컨테이너 기반 SaaS 전환으로 비용과 운영 효율을 동시에 혁신한 두올테크

Read More
Vueron Technology (뷰런테크놀로지)

Vueron Technology (뷰런테크놀로지)

GPU 집약적 LiDAR AI SaaS를 위한 확장형 클라우드 아키텍처 구축

Read More
hy(한국야쿠르트)

hy(한국야쿠르트)

생성형 AI와 하이브리드 검색 기반 구축으로 HY 제품 검색 정확도 혁신 및 고객 자연어 추천 기능 확보

Read More
Hansol Paper (한솔제지)

Hansol Paper (한솔제지)

데이터 성격에 맞는 프롬프트 튜닝의 과정을 통해 답변 정확도 95% 달성 및 기업 지식 활용 체계를 구축

Read More

Ready to unlock your data's potential?

Let's build intelligent data solutions that drive real business value through advanced analytics and AI.

정보보호 및 개인정보보호 관리체계 인증 ISMSP

인증범위메가존클라우드 서비스 운영

유효기간2025.10.22-2028.10.21

Cloud MSP, HyperBilling, 융합평생교육원, MegazonePoPs,
CloudPlex, SpaceONE, HALO, 메가버드, HyperMig

(심사받지 않은 물리적 인프라 제외)

ACT ACERTi

ISO/IEC 42001:2023
ISO/IEC 27001:2022
ISO/IEC 27018:2019

ISO/IEC 27017:2015
ISO/IEC 27701:2019
ISO 45001:2018