Back
Key Takeaway
为GPU密集型LiDAR AI SaaS构建可扩展的云架构
通过结合Terraform、AWS CDK和Karpenter的Provisioning Ensemble结构,确保了LiDAR AI SaaS(VueX)的稳定性和可扩展性,并通过GPU自动扩展将运营成本降低了约30~45%。
Vueron Technology (뷰런科技)
Client :Vueron Technology (뷰런테크놀로지)
Industry :Software / Mobility Tech
1. Overview (项目背景)
Vueron Technology今年向全球市场推出了新的SaaS型LiDAR AI Platform VueX,并在内部构建了基于云的架构以稳定且可扩展地运营该平台。
VueX是一个需要大规模LiDAR数据处理、自动标注、模型训练等高性能GPU工作负载的平台,为了满足这些需求,在技术上采用了Provisioning Ensemble结构(Terraform·AWS CDK·Karpenter组合),并在AWS环境上实现了该架构。
Megazone Cloud在VueX推出后,参与了验证该架构的构成方式是否符合AWS最佳实践以及检查一致性的过程,并发挥了结构稳定性审查的作用。
VueX推出并在AWS Marketplace上市后,需要进行全面的全球市场扩展,特别是在中东地区(对移动出行和深科技产业关注度高)需要确保产品推广渠道。
在这个过程中,通过Megazone Cloud作为主办企业参与的「2025 AX(人工智能转型)解决方案中小企业海外进出口支持」中东项目,Vueron获得了参加ADIPEC 2025联合展馆的机会,能够在当地市场介绍和推广VueX。
2. Challenge (问题定义)
① 基础设施层和服务层之间的标准化和一致性确保
基础设施(VPC、EKS、RDS等)和应用层(API、数据管道)以不同的速度变化和扩展,仅用一个IaC很难同时满足稳定性和敏捷性
在多环境(dev/stage/prod)中维持部署可重现性和配置一致性很困难
② LiDAR·AI工作负载特性导致的不可预测的资源需求
LiDAR大量上传、自动标注、模型训练等GPU·CPU混合工作负载瞬间激增,仅用固定节点配置很难应对
在多租户SaaS运营中,客户间使用量差异扩大,需要实时扩展和成本控制
③ 全球SaaS运营需要满足可扩展性·成本·稳定性标准
GPU节点成本高 → 低效扩展会导致运营成本急剧上升的风险
针对全球OEM和Tier1客户,需要满足高运营标准(如正常运行时间、安全性、可扩展性等),基础设施不稳定会直接导致客户信任度下降
3. Solution (解决方案)
Vueron Technology和Megazone Cloud为了确保VueX的稳定供应,构建了基于AWS的Provisioning Ensemble结构,建立了同时满足稳定性和可扩展性的SaaS运营体系。
构成要素 | 主要实现内容 |
AWS Infra | 在AWS环境上构建VPC、Subnet、EKS、RDS等VueX的基础设施,设计满足全球SaaS所需的稳定性和安全标准。 |
Terraforming | 使用Terraform将账户、网络、集群等不可变基础设施(Immutable Infra)代码化,建立了高可重现性的部署体系。 |
AWS CDK | 将VueX的服务功能(API Gateway、Lambda、S3、数据管道等)基于CDK进行结构化, |
Karpenter | 对于自动标注和模型训练等需要高性能GPU的工作负载,使用Karpenter实现了实时自动扩展。 |
Monitoring & Cost Optimization | 构建了可实时监控EKS、GPU节点、自动标注、模型训练等关键指标的仪表板, |
4. Result (成果)
GPU基础自动标注和模型训练性能得到优化,相同工作的处理速度相比之前大幅提升。
通过基于Karpenter的实时扩展,GPU成本降低约30~45%,运营效率大幅提升。
构建了基于Terraform·CDK的标准化部署体系,环境间(dev/stage/prod)部署稳定性和可重现性大幅提高。
通过确保AWS Marketplace SaaS结构一致性,增强了针对全球OEM·Tier-1客户的信任度,海外客户入驻变得更加顺畅。






