Back
Key Takeaway
将15秒的响应延迟缩短至0.02秒的服务速度革新
通过容器环境减少83%,实现平均服务响应速度20ms以下,最大化了大规模流量处理性能和运营效率。
Airlines (B Company)
Client :Airlines (B Company)
Industry :Airlines / Transportation
Service Area :Migration & Modernization / Applications & DevOps
1. Overview (项目背景)
B Company根据云采用战略,推进了将在既有IDC环境中运营的对客户系统及内部系统迁移至云端的「All-in Migration & Modernization」项目。超越了单纯的基础设施迁移,通过应用现代化(Modernization)确保系统的稳定性和可扩展性,并构建了能够在大规模流量发生的促销期间灵活应对的环境。
2. Challenge (问题定义)
B Company在云转换之前及转换过程中面临了以下技术课题和问题。
服务响应延迟问题
在旅行社(OTA, Online Travel Agency)连接服务中间歇性地发生15秒响应延迟现象,导致客户体验下降和服务质量问题持续存在。
缺乏灵活的可扩展性
在促销活动等流量激增时难以立即增加服务器,存在大规模接入处理的结构性限制。
运营低效率和可见性缺失
部署后难以回滚,版本管理复杂,需要登录到各个服务器查看日志等,运营生产率下降。
3. Solution (解决方案)
Megazone Cloud通过超越单纯迁移(Lift & Shift)的「Cloud Native Modernization」战略,对基础设施、应用程序、数据库全面进行了数字创新。
应用现代化及资源优化
将应用程序转换为基于容器的最新框架环境,轻量化性能,将主要服务容器数量从24个大幅优化至4个,最大化了资源效率。
数据库架构改进及无中断迁移
将对客户服务和OTA(Online Travel Agency)数据库分离配置以确保稳定性,利用AWS DMS的CDC功能进行实时数据同步,实现了无中断迁移。
DevOps及监控环境高度化
基于ArgoCD构建GitOps管道,实现了部署自动化和快速回滚体系,通过Grafana Loki进行日志统一监控,确保了运营可见性。
大规模流量灵活应对体系
为应对大型促销时涌入的流量,制定了ALB Pre-warming及NodeGroup Scale-out战略,确保了数分钟内灵活扩展的服务连续性。
4. Result (成果)
通过成功的云转换和架构高度化,实现了以下业务和技术成果。
服务响应速度缩短99.8%
完全解决了既有旅行社(OTA)连接服务中间歇性发生的约15秒响应延迟问题,平时基准平均响应速度保持在0.02秒以下,实现了高性能服务。
应用资源优化83%
通过应用容器化及优化,将主页、移动等主要服务的容器数量从既有24个大幅减少至4个,极大化了约83%的资源效率。
促销应对能力强化
在大规模促销活动时,可在数分钟内增加服务器,并将数据库连接容量扩展至最多6,000个,确保了业务连续性。
运营生产率提升和部署稳定性确保
将既有手动部署方式基于开源进行自动化,提高了部署准确度和速度,通过统一监控环境缩短了日志查询和故障原因分析时间,改善了运营效率。






