bg

Hotel Lotte DFS

Back

Key Takeaway

连续7年稳定运营的乐天免税店在线基础设施

基于AWS持续7年稳定运营在线基础设施,并通过应用生成式AI服务与FinOps协作,不断优化成本效率,从而强化了在线免税店的运营竞争力。

Hotel Lotte DFS

Client :Hotel Lotte DFS

Industry :Retail

1. Overview (项目背景)

 

Vueron Technology 今年在全球市场推出了全新的 SaaS型 LiDAR AI 平台 VueX。为了确保其运行的稳定性与可扩展性,公司内部构建了基于云的基础架构。

由于 VueX 平台需要处理大规模 LiDAR 数据、自动标注 (Auto-labeling) 及模型训练等高性能 GPU 工作负载,为了满足这些需求,我们在技术上采用了 Provisioning Ensemble 架构(结合了 Terraform、AWS CDK 和 Karpenter),并在 AWS 环境中成功实现。

在 VueX 发布后,MegazoneCloud 参与了确认该架构配置是否符合 AWS 最佳实践及验证其一致性的过程,承担了结构稳定性审查的角色。

随着 VueX 的发布以及在 AWS Marketplace 的上架,公司需要进一步拓展全球市场。特别是对于自动驾驶和深科技 (Deep-tech) 产业关注度极高的中东地区,获取产品宣传渠道至关重要。

在此过程中,通过 MegazoneCloud 作为主管单位参与的 “2025 AX(人工智能转型)解决方案中小企业海外拓展支援” 中东项目,Vueron 获得了参加 ADIPEC 2025 联合展馆的机会,得以向当地市场介绍并推广 VueX。

 


 

2. Challenge (问题定义)

 

1. 基础设施层与服务层之间的标准化及一致性确保

  • 基础架构(VPC, EKS, RDS 等)与应用层(API, 数据流水线)的变更及扩展速度不一致,仅凭单一의 IaC 方案难以同时满足稳定性和敏捷性。

  • 在多环境(dev/stage/prod)中,维持部署的可重现性及配置的一致性具有较高难度。

2. 基于 LiDAR·AI 工作负载特性的不可预测资源需求

  • 随着 LiDAR 数据的大量上传、自动标注 (Auto-labeling) 及模型训练等 GPU 与 CPU 混合工作负载的瞬时爆发,传统的固定节点配置难以应对。

  • 在运营多租户 (Multi-tenant) SaaS 时,不同客户间的使用量差异巨大,因此需要实时的弹性伸缩 (Scaling) 和成本控制。

3. 需满足全球 SaaS 运营的扩展性、成本及稳定性标准

  • GPU 节点的高成本结构: 若发生低效的弹性伸缩,存在运营成本骤增的风险。

  • 面向全球 OEM 及 Tier 1 客户: 必须满足高标准的运行时间 (Uptime)、安全性和扩展性要求,基础设施的不稳定将直接导致客户信任度下降。

 


 

3. Solution (解决方案)

 

Vueron Technology 与 MegazoneCloud 为了确保 VueX 的稳定供应,构建了基于 AWS 的 Provisioning Ensemble 架构,并建立了同时满足稳定性与可扩展性的 SaaS 运营体系。

 

组成要素

主要实现内容

AWS Infra

在 AWS 环境下构建了 VPC、Subnet、EKS、RDS 等 VueX 基础架构,旨在满足全球 SaaS 所需 st 的稳定性和安全标准。同时,确保了基础设施层的标准化与一致性,以支持多环境(dev/stage/prod)的高效运营。

Terraforming

通过 Terraform 将账号、网络、集群等不可变基础设施 (Immutable Infrastructure) 代码化,建立了具备高重现性的部署体系。通过实现各环境配置的自动化,降低了基础设施变更风险,并增强了运营效率。

AWS CDK

通过基于 CDK 对 VueX 的服务功能(API Gateway、Lambda、S3、数据流水线等)进行结构화处理,构建了能够让开发团队快速添加功能并进行部署的应用层。通过基于代码的管理模式,显著提升了功能的发布速度。

Karpenter

针对自动标注 (Auto-labeling) 及模型训练等需要高性能 GPU 的工作负载,通过 Karpenter 实现了实时弹性伸缩。基于 Pod 的资源需求自动选择最优实例,从而节省了 30% 至 45% 的 GPU 成本,并在流量激增的情况下确保了稳定的处理性能。

Monitoring & Cost Optimization

构建了可实时监控 EKS、GPU 节点、自动标注 (Auto-labeling) 及模型训练等核心指标的可视化仪表板,并结合资源使用情况应用了成本优化策略,从而提升了运营透明度与效率。

 


 

4. Result (成果)

 

基于 GPU 的自动标注 (Auto-labeling) 及模型训练性能得到优化,同等任务下的处理速度较以往显著提升。 通过基于 Karpenter 的实时弹性伸缩,GPU 成本节省了约 30% 至 45%,大幅提高了运营效率。 构建了基于 Terraform 和 CDK 的标准化部署体系,显著增强了各环境(dev/stage/prod)的部署稳定性与可重现性。 通过确保 AWS Marketplace SaaS 架构的一致性与合规性,强化了针对全球 OEM 及 Tier-1 客户的信誉度,使海外客户入驻过程更加顺畅。

 

 

Related

Case Stories

HANATOUR

HANATOUR

通过超个性化AI咨询实现用户增长432%的旅游服务

Read More
Able C&C

Able C&C

即使在创纪录的流量中也无中断地完成的谈判王活动

Read More
Kurly

Kurly

同时确保不断增长的Kurly服务的稳定性和安全性

Read More
SUATREE

SUATREE

全球商务平台,扩展越南手工艺品的海外销售渠道

Read More
Online Fashion Commerce (K Company)

Online Fashion Commerce (K Company)

通过AICC转换同时确保咨询运营的标准和效率

Read More
Global Online Retailer (A Company)

Global Online Retailer (A Company)

大规模全球咨询中心的稳定性中心云转换

Read More

Ready to unlock your data's potential?

Let's build intelligent data solutions that drive real business value through advanced analytics and AI.