文档中心 > 在线服务
在线服务

最近更新时间:2021-06-07

在完成模型训练并且导入模型管理之后,可以通过在线服务功能模块来部署发布模型在线服务。

您可以向在线服务发送请求,实时获取请求结果。

1 前提条件

  • 模型已经导入模型管理,并且模型输入输出格式解析正确。

  • 由于在线运行需消耗资源,确保账户未欠费。

2 新建在线服务

登录紫光云控制台,选择产品与服务->人工智能->AI开发平台。

选择左侧“在线服务”,点击“创建服务”,弹出创建在线服务配置页面。在弹窗中填写在线服务的基本配置。

点击“服务配置”的增加按钮,继续创建模型服务配置。

配置是否必填说明
名称仅支持小写字母、数字和'-',且需以小写字母开头、总长度不超过32,同用户下不重复
描述128字符内
模型从模型管理中选择要部署的模型名称和版本
环境变量以Key和Value的形式填写,并export到在线服务容器中
流量比例在线服务不同模型之间分流的流量比例,一个在线服务所有模型流量比例总和需要等于100%
资源池资源池可选公共资源池或者专属资源池
1. 选择公共资源池时,需要从资源规格中选择一种套餐,CPU比GPU套餐价格便宜
2. 选择专属资源池的前提是您已经创建了专属资源,在资源规格中列出了专属资源列表,您填写资源套餐后,Notebook实例会启动在您自己的专属资源池中。
注意:资源套餐填写要合理。
资源套餐选择CPU或者GPU资源,
副本数当前模型的部署副本数

点击“确认”后,等待服务部署完成,直到服务状态为“运行中”表示服务部署成功,可以响应请求。

3 修改在线服务

“在线服务”列表中,点击服务名称,进入服务详情页。

在服务详情页中,点击“修改”按钮,将打开服务配置弹窗,您可以在弹窗中修改在线服务的配置信息。

修改完配置后,会重新启动在线服务。

4 向在线服务发请求

在服务详情页中,得到在线服务访问的url。

4.1 请求方式

  • 调用地址:在线服务的url

  • 请求方式:POST

  • 返回类型:json

4.2 请求参数

Params如下:

参数说明
AccessKeyIdAccess Key值ak值
Signature签名值ak/sk生成的签名,获取签名的代码请参考SignatureUtil.java

Body如下:

{     
    "inputs": {
         <1_input_name_>: <input_strcut>, // numpy or base64
         <2_input_name_>: <input_strcut>, // numpy or base64
         <3_input_name_>: <input_strcut>, // numpy or base64
          ...
    }
}

4.3 请求示例

5 停止在线服务

“在线服务”列表页,点击“停止”按钮,停止在线服务。释放资源,节约成本。