Back
Key Takeaway
连续7年稳定运营的乐天免税店在线基础设施
基于AWS持续7年稳定运营在线基础设施,并通过应用生成式AI服务与FinOps协作,不断优化成本效率,从而强化了在线免税店的运营竞争力。
Hotel Lotte DFS
Client :Hotel Lotte DFS
Industry :Retail
1. Overview (项目背景)
Vueron Technology 今年在全球市场推出了全新的 SaaS型 LiDAR AI 平台 VueX。为了确保其运行的稳定性与可扩展性,公司内部构建了基于云的基础架构。
由于 VueX 平台需要处理大规模 LiDAR 数据、自动标注 (Auto-labeling) 及模型训练等高性能 GPU 工作负载,为了满足这些需求,我们在技术上采用了 Provisioning Ensemble 架构(结合了 Terraform、AWS CDK 和 Karpenter),并在 AWS 环境中成功实现。
在 VueX 发布后,MegazoneCloud 参与了确认该架构配置是否符合 AWS 最佳实践及验证其一致性的过程,承担了结构稳定性审查的角色。
随着 VueX 的发布以及在 AWS Marketplace 的上架,公司需要进一步拓展全球市场。特别是对于自动驾驶和深科技 (Deep-tech) 产业关注度极高的中东地区,获取产品宣传渠道至关重要。
在此过程中,通过 MegazoneCloud 作为主管单位参与的 “2025 AX(人工智能转型)解决方案中小企业海外拓展支援” 中东项目,Vueron 获得了参加 ADIPEC 2025 联合展馆的机会,得以向当地市场介绍并推广 VueX。
2. Challenge (问题定义)
1. 基础设施层与服务层之间的标准化及一致性确保
基础架构(VPC, EKS, RDS 等)与应用层(API, 数据流水线)的变更及扩展速度不一致,仅凭单一의 IaC 方案难以同时满足稳定性和敏捷性。
在多环境(dev/stage/prod)中,维持部署的可重现性及配置的一致性具有较高难度。
2. 基于 LiDAR·AI 工作负载特性的不可预测资源需求
随着 LiDAR 数据的大量上传、自动标注 (Auto-labeling) 及模型训练等 GPU 与 CPU 混合工作负载的瞬时爆发,传统的固定节点配置难以应对。
在运营多租户 (Multi-tenant) SaaS 时,不同客户间的使用量差异巨大,因此需要实时的弹性伸缩 (Scaling) 和成本控制。
3. 需满足全球 SaaS 运营的扩展性、成本及稳定性标准
GPU 节点的高成本结构: 若发生低效的弹性伸缩,存在运营成本骤增的风险。
面向全球 OEM 及 Tier 1 客户: 必须满足高标准的运行时间 (Uptime)、安全性和扩展性要求,基础设施的不稳定将直接导致客户信任度下降。
3. Solution (解决方案)
Vueron Technology 与 MegazoneCloud 为了确保 VueX 的稳定供应,构建了基于 AWS 的 Provisioning Ensemble 架构,并建立了同时满足稳定性与可扩展性的 SaaS 运营体系。
组成要素 | 主要实现内容 |
AWS Infra | 在 AWS 环境下构建了 VPC、Subnet、EKS、RDS 等 VueX 基础架构,旨在满足全球 SaaS 所需 st 的稳定性和安全标准。同时,确保了基础设施层的标准化与一致性,以支持多环境(dev/stage/prod)的高效运营。 |
Terraforming | 通过 Terraform 将账号、网络、集群等不可变基础设施 (Immutable Infrastructure) 代码化,建立了具备高重现性的部署体系。通过实现各环境配置的自动化,降低了基础设施变更风险,并增强了运营效率。 |
AWS CDK | 通过基于 CDK 对 VueX 的服务功能(API Gateway、Lambda、S3、数据流水线等)进行结构화处理,构建了能够让开发团队快速添加功能并进行部署的应用层。通过基于代码的管理模式,显著提升了功能的发布速度。 |
Karpenter | 针对自动标注 (Auto-labeling) 及模型训练等需要高性能 GPU 的工作负载,通过 Karpenter 实现了实时弹性伸缩。基于 Pod 的资源需求自动选择最优实例,从而节省了 30% 至 45% 的 GPU 成本,并在流量激增的情况下确保了稳定的处理性能。 |
Monitoring & Cost Optimization | 构建了可实时监控 EKS、GPU 节点、自动标注 (Auto-labeling) 及模型训练等核心指标的可视化仪表板,并结合资源使用情况应用了成本优化策略,从而提升了运营透明度与效率。 |
4. Result (成果)
基于 GPU 的自动标注 (Auto-labeling) 及模型训练性能得到优化,同等任务下的处理速度较以往显著提升。 通过基于 Karpenter 的实时弹性伸缩,GPU 成本节省了约 30% 至 45%,大幅提高了运营效率。 构建了基于 Terraform 和 CDK 的标准化部署体系,显著增强了各环境(dev/stage/prod)的部署稳定性与可重现性。 通过确保 AWS Marketplace SaaS 架构的一致性与合规性,强化了针对全球 OEM 及 Tier-1 客户的信誉度,使海外客户入驻过程更加顺畅。






