Back
Key Takeaway
Legacy 데이터 구조를 표준화해 분석 신뢰도를 높인 데이터 품질 개선
파편화된 사용자·대시보드 데이터를 Base–Middle–Aggregated 구조로 재설계하고, Fact 테이블과 사용자 데이터 보정을 통해 데이터 활용 범위와 분석 신뢰도를 크게 향상시켰습니다.
AI WebRTC (H Company)
고객사 :AI WebRTC (H Company)
산업군 :Telco / Media / Software / Data & AI
서비스 영역 :Data & AI
적용 솔루션 :AIR
1. Overview (프로젝트 배경)
본 프로젝트는 대시보드 기반 분석 환경에서 사용 중이던 레거시 테이블 구조로 인해 발생하던 데이터 품질 저하와 관리 복잡성을 개선하기 위해 추진되었습니다.
기존에는 대시보드별로 서로 다른 Fact 테이블과 사용자 관련 데이터가 파편화되어 있어, 데이터 활용 범위와 일관성에 한계가 있었습니다.
이에 따라 레거시 테이블을 DWH 관점의 Base → Middle → Aggregated 구조로 재정비하고,
user 관련 데이터 통합 관리, user_ft/cohort 대체 테이블 구성, 모니터링 파이프라인 구축을 통해 데이터 품질과 재사용성을 동시에 확보하는 것을 목표로 했습니다.
2. Solution (해결 방안)
데이터 구조 표준화와 활용 범위 확장을 중심으로 개선 작업을 수행했습니다.
Fact 테이블 구조 개선
대시보드별로 분리되어 있던 Fact 테이블을 정리하고, 공통 Middle·Aggregated 테이블 구조로 재설계데이터 활용 범위 확대
모수 기준 조정 및 컬럼 추가를 통해 분석 가능한 데이터 범위 확장Azar Web 데이터 통합
기존 Legacy 테이블을 Base·Middle 테이블 구조로 통합User 데이터 보정 작업
users, azar_user_dm 테이블의 누락·불일치 데이터 보정 및 컬럼 의미 정정
3. Result (성과)
데이터 구조 개선을 통해 분석 환경의 일관성과 활용성이 크게 향상되었습니다.
Fact 구조 통합
각 대시보드별로 분리되어 있던 Fact 테이블을 공통 Middle 및 Aggregated 테이블로 통합azar_du_match_ft 개선
특정 대시보드 기준으로만 사용되던 데이터를 전체 대시보드에서 활용 가능하도록 데이터 범위 확장azar_dt_user_ft 확장
Session, order, match, inventory, login info 데이터를 추가 적재하고, 신규 컬럼을 통해 분석 활용도 강화Web 이벤트 로그 통합
여러 웹 대시보드에서 개별 사용되던 event log를 단일 Middle 테이블에서 조회 가능하도록 설계Legacy 로직 재구현 및 통합
기존 azar_cohort_user_fact_daily 로직을 Base 테이블 기반으로 재구현하고,
산출된 지표를 기존 Middle 테이블(azar_dt_user_ft, azar_dt_user_history_ft, azar_user_dm)에 통합User 데이터 정합성 개선
users 테이블의 deletion_timestamp 누락 데이터 보정
cheero 데이터 구분이 불가능했던 app_type 로직 보완
reg_country_cd 컬럼을 실제 의미에 맞게 분리하여 등록 국가 코드 컬럼 신규 추가
기대효과
본 개선을 통해 다음과 같은 효과를 기대할 수 있습니다.
데이터 구조 및 명명 규칙 표준화
데이터 리니지 관리 체계 강화
분석 결과물의 체계적 관리 및 재활용 가능
변경 관리 프로세스 및 협업 효율 향상
이상 데이터 사전 정제 프로세스 도입 기반 마련
이를 통해 향후 데이터 품질 개선 작업의 효율성과 성과를 더욱 안정적으로 확대할 수 있는 기반을 확보했습니다.








