文档中心 > 创建数据集
创建数据集

最近更新时间:2021-06-22

在AI开发平台中,您可以在“数据文件->数据集”页面,完成创建数据集、数据导入、数据标注、数据发布等操作,为模型训练做好数据准备。

数据集中,当前支持个人标注和团队标注。

首先要创建一个数据集,后续的数据导入、数据标注、数据发布等操作,都是基于创建的数据集。

1 前提条件

  • 数据集需要获取访问对象存储权限,如果已经创建AK/SK,可以在“总览”页面单击“同步AK/SK”来获取访问对象存储的权限;如果未创建AK/SK则先创建AK/SK再进行同步。

  • 将数据放入您对象存储桶的文件夹下。并且,对象存储的桶与AI开发平台必须在同一Region(当前只支持华北1-天津)。

2 创建数据集

登录紫光云控制台,选择产品与服务->人工智能->AI开发平台。

点击左侧“数据文件” -> “数据集”,进入数据集列表页面。点击“创建数据集”,弹出创建数据集弹窗。

配置是否必填说明
名称数据集的名称,仅支持小写字母、数字和'-',且需以小写字母开头、总长度不超过32,同用户下不重复
描述128字符内
数据集输入位置选择对象存储的路径
数据集输出位置选择对象存储的路径
注意:“数据集输出位置”不能与“数据集输入位置”为同一路径,且不能是“数据集输入位置”的子目录
标注场景可选择“物体”、“音频”、“文本”三种标注场景
标注类型• 标注场景为“物体”时
○ 图像分类:识别一张图片中是否包含某种物体。
○ 物体检测:识别出图片中每个物体的位置及类别。
• 标注场景为“音频”时
○ 声音分类:对声音进行分类。
• 标注场景为“文本”时
○ 文本分类:对文本的内容按照标签进行分类处理。
添加标签集设置标签名称:在标签名称文本框中,输入标签名称。仅支持小写字母、数字和'-',且需以小写字母开头、总长度不超过32。
添加标签:单击添加按钮。

数据集创建完成后,自动跳转至数据集列表页面,针对创建好的数据集,可以执行标注数据、发布、版本管理、修改、导入和删除等操作。