工业级智能数据加工及算法训练平台
TZ MLOps针对机器学习/深度学习科研、实训教学等场景提供一站式解决方案。基于PaaS+AI理念,功能完善的、适合产业化运营的人工智能开发平台。平台能提供端到端的
MLOps流程管理,涵盖数据标注、算法开发、模型训练、模型管理、模型服务、代码管理等AI全生命周期流程支持。
平台采用容器轻量级虚拟化方式作为基础,实现对多集群多节点 的GPU、CPU、内存、存储等基础设施资源池化;基于Kubernetes
定制化开发的编排调度工具,实现资源高效灵活调度;同时企业级设计理念使平台具备多租户多层级用户管理、权限管理、资源管理、vGPU 等丰富的平台能力,全方位满足用户对 AI
开发平台高可用、高可靠、高稳定要求。平台为用户提供简洁的WEB
界面,丰富的功能以及多样化工具。如开发模块提供一键式环境生成、在线交互式开发工具Mlab;模型训练提供参数调优、分布式并行训练等;模型服务提供在线模型部署推理、模型服务调用;平台同时集成数据标注工具、镜像仓库等,实现一站式AI开发。深度学习框架镜像以插件的方式接入系统,集成了多种业界常用框架,如
Tensorflow,Caffe,PyTorch和MXnet等,支持自定义扩展,极大提升整体系统 的扩展性和可维护性。管理端为管理员提供可视化的运维运营体系,如资源监控、资源计量计费、
资源配额管理、日志监控、用户及用户组管理、权限管理等,降低用户在运维上的投入。