在线服务

最近更新时间：2021-06-07

在完成模型训练并且导入模型管理之后，可以通过在线服务功能模块来部署发布模型在线服务。

您可以向在线服务发送请求，实时获取请求结果。

1 前提条件

模型已经导入模型管理，并且模型输入输出格式解析正确。
由于在线运行需消耗资源，确保账户未欠费。

2 新建在线服务

登录紫光云控制台，选择产品与服务->人工智能->AI开发平台。

选择左侧“在线服务”，点击“创建服务”，弹出创建在线服务配置页面。在弹窗中填写在线服务的基本配置。

点击“服务配置”的增加按钮，继续创建模型服务配置。

配置	是否必填	说明
名称	是	仅支持小写字母、数字和'-'，且需以小写字母开头、总长度不超过32，同用户下不重复
描述	否	128字符内
模型	是	从模型管理中选择要部署的模型名称和版本
环境变量	否	以Key和Value的形式填写，并export到在线服务容器中
流量比例	是	在线服务不同模型之间分流的流量比例，一个在线服务所有模型流量比例总和需要等于100%
资源池	是	资源池可选公共资源池或者专属资源池 1. 选择公共资源池时，需要从资源规格中选择一种套餐，CPU比GPU套餐价格便宜 2. 选择专属资源池的前提是您已经创建了专属资源，在资源规格中列出了专属资源列表，您填写资源套餐后，Notebook实例会启动在您自己的专属资源池中。注意：资源套餐填写要合理。
资源套餐	是	选择CPU或者GPU资源，
副本数	是	当前模型的部署副本数

点击“确认”后，等待服务部署完成，直到服务状态为“运行中”表示服务部署成功，可以响应请求。

3 修改在线服务

在“在线服务”列表中，点击服务名称，进入服务详情页。

在服务详情页中，点击“修改”按钮，将打开服务配置弹窗，您可以在弹窗中修改在线服务的配置信息。

修改完配置后，会重新启动在线服务。

4 向在线服务发请求

在服务详情页中，得到在线服务访问的url。

4.1 请求方式

调用地址：在线服务的url
请求方式：POST
返回类型：json

4.2 请求参数

Params如下：

参数	值	说明
AccessKeyId	Access Key值	ak值
Signature	签名值	ak/sk生成的签名，获取签名的代码请参考SignatureUtil.java

Body如下：

{     
    "inputs": {
         <1_input_name_>: <input_strcut>, // numpy or base64
         <2_input_name_>: <input_strcut>, // numpy or base64
         <3_input_name_>: <input_strcut>, // numpy or base64
          ...
    }
}

{     "inputs": {
     : , // numpy or base64
     : , // numpy or base64
     : , // numpy or base64
      ...
   }
}

4.3 请求示例

5 停止在线服务

在“在线服务”列表页，点击“停止”按钮，停止在线服务。释放资源，节约成本。

计算

存储

网络

数据库

消息中间件

大数据

安全

安全服务

CDN与IDC

视频服务

云通信

监控与管理

人工智能

物联网

通用解决方案

行业解决方案

企业办公

芯片云解决方案

软件产品

一体机产品

合作伙伴

授权业务

增值服务