AI算力私有云系统 – OpenI是什么
AI算力私有云系统 – OpenI是一个支持多种国产GPU的私有算力云平台,旨在快速实现数据、算法、镜像、模型与算力等资源的统一管理与使用。该平台主要面向企业客户及开发者,提供轻量化、高性价比的机器学习解决方案。通过该平台,用户可以方便地管理数据、算法、镜像、模型与算力等资源,实现一站式构建计算环境,提升计算效率。同时,平台还为集群管理人员提供了集群资源管理与监控、计算任务管理与监控等功能,方便对整体系统进行操作与分析。
该平台适用于构建大规模AI计算平台、共享计算资源、在统一环境下完成模型训练以及使用集成的插件辅助模型训练以提升效率等场景。其特点包括一站式开发,提供AI计算全链路的开发功能;方便管理,通过可视化工具降低管理成本;易于部署,支持快速部署;性能优越,提供高性能的分布式计算体验;兼容性好,支持异构硬件和多种深度学习框架。平台架构涵盖计算平台、资源管理、硬件设施和平台算力调度系统,能够实现异构设备的混合调度,提供灵活的任务队列管理和资源分组,确保高效的资源利用和任务管理。此外,平台全面兼容多种国产异构硬件资源,支持快速和灵活部署,运行可靠稳定,方便外部团队使用,并优化了资源管理和任务调度,提供了灵活且统一的异构硬件表示方法,提升了资源利用率和任务调度效率。
AiseeCloud – AI容器云平台使用示例
1. 登录平台:通过微信扫码并备注“AiseeCloud”进入平台。
2. 数据管理:上传、管理和预览数据集,平台可预置数据集。
3. 模型开发:使用JupterLab在线编程环境调试、运行和保存算法,支撑后续的模型训练。
4. 模型训练:监控训练任务,了解训练任务的情况及结果。
5. 资源管理:查看异构资源节点的统一管理,细颗粒的资源池管理,隔离集群资源,将不同的资源分配给不同的用户组织。
6. 机时管理:为单个用户和团队用户提供算力使用。
7. 镜像管理:上传、管理镜像,平台可预置镜像。
8. 算法管理:管理用户上传的算法和平台预置的算法。
9. API接口:使用平台提供的完善API接口,包括管理员端API和用户端API。