文档中心 > 概述
概述

最近更新时间:2021-06-07

1 简介

紫光云AI开发平台为AI开发者提供了从数据准备、在线代码开发调试、模型训练、模型管理到模型部署上线的端到端开发全流程,帮助您高效、快速的构建一个可用模型。

AI开发平台使用流程详解如下图。

2 过程说明

2.1 数据准备

  • 如果您的数据需要标注,则可以在数据文件 -> 数据集模块进行数据标注,平台提供了4种标注类型。标注后并发布的数据集版本可用于Notebook和训练任务。

  • 如果您的数据已经准备好,并且数据量较大,建议将数据存入对象存储。Notebook和训练任务都可以对接对象存储。

  • 如果您的数据已经准备好,并且数据量较小在5GB以下,可以将数据存入数据文件 -> 本地存储模块,Notebook和训练任务都可以对接本地存储,调试您的程序。

2.2 调试代码

  • Notebook内置了完全托管的交互式编程环境Jupyter Lab,实现数据处理和代码调试。

  • 您可以在Notebook中体验边调试边运行的效果。

  • Notebook可以挂载对象存储/本地存储/云硬盘。

2.3 模型训练

  • 经过调试的代码逻辑可以启动大规模分布式训练任务。

  • 提供了预置算法,您无需关注训练数据和代码即可一键提交训练任务。

2.4 模型管理

  • 提供了从训练任务导入和从存储中导入2种导入模式。对接本地存储和对象存储。

  • 将训练好的模型按照不同模型类别、性质、分类、版本有序进行存储和管理。

2.5 模型部署

  • 快速将训练好的模型部署为高可用的在线服务,灵活选用多种资源套餐加速预测执行,并可以通过A/B Test、灰度升级等完成模型试验迭代和服务运维管理。

机器学习的过程是连续的周期性过程,经过模型开发 -> 模型管理 -> 部署在线预测服务到生产环境,然后,您可以结合更多业务数据,根据实际使用情况,重新训练模型来提高预测准确性,持续迭代模型版本。