文档中心 > 标注数据-声音分类
声音分类

最近更新时间:2021-08-10

在模型训练之前需对没有标签的音频文件添加标签,也可以对已标注音频修改或删除标签进行重新标注。声音分类标注的要求:

  • 声音标注支持多标签,即一段音频可添加多个标签。

  • 标签名是由中文、大小写字母、数字、中划线或下划线组成,且不超过32位的字符串。

1 开始标注

登录紫光云控制台,选择产品与服务->人工智能->AI开发平台。

点击左侧“数据文件” -> “数据集”,进入数据集列表页面。选择某个标注类型为“声音分类”的数据集,单击数据集名称进入数据集概览页。

此操作默认进入数据集当前版本的概览页,如果需要对其他版本进行数据标注,请先在“版本管理”操作中,将需要进行数据标注的版本设置为“当前版本。

在数据集概览页中,单击上方“开始标注”,进入数据集详情页。数据集详情页默认展示此数据集下全部数据。

2 同步数据源

平台会自动从数据集输入位置同步数据至数据集详情页,包含数据及标注信息。

如果数据集输入位置上传了新数据,可在数据集详情页的“未标注”页签中,单击“同步数据源”,快速将对象存储新上传的数据添加到数据集中。

3 标注音频

数据集详情页中,展示了此数据集中“未标注”“已标注”的音频,默认显示“未标注”的音频列表。单击音频上的▶,即可进行音频的试听。

  • 在“未标注”页签,选择需要进行标注的音频。

    • 手工点选:在音频列表中,单击音频,当音频出现蓝色勾选框时,表示已勾选。可勾选同类别的多个音频,一起添加标签。

    • 批量选中:如果音频列表的当前页,所有音频属于一种类型,可以在列表的右上角单击“选择当前页”,则当前页面所有的音频将选中。添加标签。

  • 添加标签

    • 在右侧的“标签”区域中,设置标签

      方式一(已存在标签):单击“标签名”右侧下拉菜单,然后选择已有的标签名称,然后单击“确定”。

      方式二(新增标签):在“标签名”的文本框中,直接输入新的标签名称,然后单击“确定”。

    • 选中的音频将被自动移动至“已标注”页签,且在“未标注”页签中,标签的信息也将随着标注步骤进行更新,如增加的标签名称、各标签对应的音频数量。


4 查看已标注音频

在数据集详情页,单击“已标注”页签,您可以查看已完成标注的音频列表。单击音频,可在右侧的“选中文件标签”中了解当前音频的标签信息。

5 修改标注

当数据完成标注后,您还可以进入“已标注”页签,对已标注的数据进行修改。

  • 基于音频文件修改:在“已标注”页面,音频列表中选择一个或者多个待修改的音频。

    • 修改标签:在“选中文件标签”区域中,单击操作列的,然后在文本框中输入正确的标签名,然后单击确定完成修改。

    • 删除标签:在“选中文件标签”区域中,单击操作列的垃圾桶按钮删除该标签。

  • 基于标签修改:在数据集详情页面,单击“已标注”页签,在音频列表右侧,显示全部标签的信息。

    • 修改标签:单击操作列的,然后在弹出的对话框中输入修改后的标签名,然后单击“确定”完成修改。修改后,之前添加了此标签的音频,都将被标注为新的标签名称。

    • 删除标签:单击操作列的垃圾桶按钮,在弹出的对话框中,二次确定。删除标签后,之前添加了此标签的音频,都将去掉此标签。

6 添加音频

除了从数据集输入位置自动同步的数据外,还可以在页面上直接添加音频,用于数据标注。

  • 在数据集详情页面,单击“未标注”页签,然后单击上方“添加音频”。弹出添加音频对话框。

  • 选择本地环境中需要上传的音频,仅支持WAV格式音频文件,单个音频文件不能超过4MB。

  • 单击“确定”,您添加的音频将自动呈现在“未标注”的音频列表中。且音频将自动存储至此“数据集输入位置”对应的对象存储目录中。

7 删除音频

在“未标注”或“已标注”页面中,选中需要删除的音频,或者选择“勾选当前页”选中该页面所有音频,然后单击上方“删除音频”。

删除音频只是删除当前版本下的音频,对象存储数据源输入路径下的音频文件不变。对其他版本也无影响。

如果当前页面无选中音频时,“删除音频”按钮为灰色,无法执行删除操作。