文档中心 > 从Manifest文件导入的规范说明
从Manifest文件导入的规范说明

最近更新时间:2021-06-07

1 前提条件

Manifest文件中定义了标注对象和标注内容的对应关系。选择导入Manifest文件时,需确保您具备Manifest文件所在对象存储路径的权限。

Manifest文件描述的是原始文件和标注信息,可用于标注、训练、推理场景。Manifest文件中也可以只有原始文件信息,没有标注信息,如用于推理场景,或用于生成未标注的数据集。Manifest文件需满足如下要求:

  • Manifest文件使用UTF-8编码。

  • Manifest文件使用json lines格式,一行一个json对象。

{"source": "/path/to/image1.jpg", "annotation": … }
{"source": "/path/to/image2.jpg", "annotation": … }
{"source": "/path/to/image3.jpg", "annotation": … }

为了说明方面,下面的Manifest例子将每行格式化为多行的json对象。

Manifest文件可以由您、第三方工具或AI开发平台数据标注生成,其文件名没有特殊要求,可以为任意合法文件名。

为了AI开发平台系统内部使用方便,数据标注发版后生成的Manifest文件名由“VersionName.manifest”组成。例如,“v0000.manifest”。

2 图像分类

Manifest文件示例:

{    
    "annotations": [{        
        "annotatedTime": 1583078400000,        
        "annotatedUserId": "564c0e43-e560-4c29-8b81-9b88b3831e73",        
        "annotatedUserName": "aios_test1",        
        "labelName": "car"
    }],    
    "id": 24217,    
    "labelType": "image_classification",    
    "source": "/test/in/car3_1583140883303.jpg"
}


配置是否必填说明
annotations标注信息,如果不设置,则表示未标注对象。
+annotatedTime标注时间
+annotatedUserId标注人ID
+annotatedUserName标注人名称
+labelName本例为图片分类名称
labelTypeimage_classification:图像分类
object_detection:物体检测
text_classification:文本分类
audio_classification:声音分类
source被标注对象的对象存储位置

3 物体检测

Manifest文件示例:

{    
    "annotations": [{        
        "annotatedTime": 1583337600000,        
        "annotatedUserId": "0dfcaea8-b454-4aa1-bd7d-56c658581185",        
        "annotatedUserName": "aitest5",        
        "detection": "{\"xmax\":264.0909090909091,\"xmin\":180.0,\"ymax\":168.63636363636363,\"ymin\":110.0}",        
        "labelName": "2"
    }],    
    "id": 24071,    
    "labelType": "object_detection",    
    "property": "{\"depth\":1,\"height\":375,\"size\":2000,\"width\":500}",    
    "source": "/test/j0302_in/car1.jpg"
}


配置是否必填说明
annotations标注信息,如果不设置,则表示未标注对象。
+annotatedTime标注时间
+annotatedUserId标注人ID
+annotatedUserName标注人名称
+detection物体检测框的四点坐标
+labelName本列为物体框的标签名称
labelTypeimage_classification:图像分类
object_detection:物体检测
text_classification:文本分类
audio_classification:声音分类
property表示图像的像素信息。
· width:必选字段,图片的宽度。
· height:必选字段,图片的高度。
source被标注对象的对象存储位置

4 文本分类

Manifest文件示例:

{    
    "annotations": [{        
        "annotatedTime": 1582214400000,        
        "annotatedUserId": "0dfcaea8-b454-4aa1-bd7d-56c658581185",        
        "annotatedUserName": "aitest5",        
        "labelColor": "#0071be",        
        "labelName": "happy"
    }],    
    "id": 8039,    
    "labelType": "text_classification",    
    "source": "手感好"
}


配置是否必填说明
annotations标注信息,如果不设置,则表示未标注对象。
+annotatedTime标注时间
+annotatedUserId标注人ID
+annotatedUserName标注人名称
+labelColor标签颜色
+labelName本例为文本分类名称
labelTypeimage_classification:图像分类
object_detection:物体检测
text_classification:文本分类
audio_classification:声音分类
source标注的文本内容

5 声音分类

Manifest文件示例:

{    
    "annotations": [{        
        "annotatedTime": 1583164800000,        
        "annotatedUserId": "0dfcaea8-b454-4aa1-bd7d-56c658581185",        
        "annotatedUserName": "aitest5",        
        "labelColor": "",        
        "labelName": "good"
    }],    
    "id": 8430,    
    "labelType": "audio_classification",    
    "source": "/test/in/v31.wav"
}


配置是否必填说明
annotations标注信息,如果不设置,则表示未标注对象。
+annotatedTime标注时间
+annotatedUserId标注人ID
+annotatedUserName标注人名称
+labelColor标签颜色
+labelName本例为声音分类名称
labelTypeimage_classification:图像分类
object_detection:物体检测
text_classification:文本分类
audio_classification:声音分类
source被标注对象的对象存储位置