最近更新时间:2021-06-07
在完成模型训练并且导入模型管理之后,可以通过在线服务功能模块来部署发布模型在线服务。
您可以向在线服务发送请求,实时获取请求结果。
模型已经导入模型管理,并且模型输入输出格式解析正确。
由于在线运行需消耗资源,确保账户未欠费。
登录紫光云控制台,选择产品与服务->人工智能->AI开发平台。
选择左侧“在线服务”,点击“创建服务”,弹出创建在线服务配置页面。在弹窗中填写在线服务的基本配置。
点击“服务配置”的增加按钮,继续创建模型服务配置。
配置 | 是否必填 | 说明 |
---|---|---|
名称 | 是 | 仅支持小写字母、数字和'-',且需以小写字母开头、总长度不超过32,同用户下不重复 |
描述 | 否 | 128字符内 |
模型 | 是 | 从模型管理中选择要部署的模型名称和版本 |
环境变量 | 否 | 以Key和Value的形式填写,并export到在线服务容器中 |
流量比例 | 是 | 在线服务不同模型之间分流的流量比例,一个在线服务所有模型流量比例总和需要等于100% |
资源池 | 是 | 资源池可选公共资源池或者专属资源池 1. 选择公共资源池时,需要从资源规格中选择一种套餐,CPU比GPU套餐价格便宜 2. 选择专属资源池的前提是您已经创建了专属资源,在资源规格中列出了专属资源列表,您填写资源套餐后,Notebook实例会启动在您自己的专属资源池中。 注意:资源套餐填写要合理。 |
资源套餐 | 是 | 选择CPU或者GPU资源, |
副本数 | 是 | 当前模型的部署副本数 |
点击“确认”后,等待服务部署完成,直到服务状态为“运行中”表示服务部署成功,可以响应请求。
在“在线服务”列表中,点击服务名称,进入服务详情页。
在服务详情页中,点击“修改”按钮,将打开服务配置弹窗,您可以在弹窗中修改在线服务的配置信息。
修改完配置后,会重新启动在线服务。
在服务详情页中,得到在线服务访问的url。
调用地址:在线服务的url
请求方式:POST
返回类型:json
Params如下:
参数 | 值 | 说明 |
---|---|---|
AccessKeyId | Access Key值 | ak值 |
Signature | 签名值 | ak/sk生成的签名,获取签名的代码请参考SignatureUtil.java |
Body如下:
{ "inputs": { <1_input_name_>: <input_strcut>, // numpy or base64 <2_input_name_>: <input_strcut>, // numpy or base64 <3_input_name_>: <input_strcut>, // numpy or base64 ... } }
{ "inputs": { : , // numpy or base64 : , // numpy or base64 : , // numpy or base64 ... } }
在“在线服务”列表页,点击“停止”按钮,停止在线服务。释放资源,节约成本。