最近更新时间:2021-03-12
1 功能描述
对中文文本,为用户提供分词和词性标注两种功能。
调用地址:https://apim.unicloud.com/api/nlp/segment/1.0.0/
请求方式:POST
返回类型:JSON
Header如下:
参数 | 值 | 说明 |
---|---|---|
Content-Type | application/json | -- |
Authorization | Bearer | 参考Token获取 |
Body如下:
参数 | 是否必选 | 类型 | 可选值范围 | 说明 |
---|---|---|---|---|
text | true | string | - | 待分析文本,长度建议不超过1000个汉字,超过上限接口报错 |
注:Body是raw-json格式
curl -H "Authorization:Bearer 2735fbc9-b797-31ad-812c-d8e9e903f6e3" \ -H "Content-Type:application/json" \ -d '{"text": "阳光保险集团股份有限公司于2005年7月成立"}' \ https://apim.unicloud.com/api/nlp/segment/1.0.0/
curl -H "Authorization:Bearer 2735fbc9-b797-31ad-812c-d8e9e903f6e3" -H "Content-Type:application/json" -d '{"text": "阳光保险集团股份有限公司于2005年7月成立"}' https://apim.unicloud.com/api/nlp/segment/1.0.0/
字段 | 类型 | 说明 |
---|---|---|
data | dict | 返回结果数据 |
+text | string | 待分析文本 |
+segment | array of objects | 词汇数组,每个元素对应结果中的一个词 |
++word | string | 词汇字符串 |
++offset | int | 词在原文的起始位置 |
++length | int | 词长度 |
++pos | string | 当前分词对应的词性 |
++basic_words | array of strings | 构成词的子部分 |
code | int | 返回码: 0表示成功 1001表示错误的命令请求格式:如JSON格式错误 2000 表示请求的操作超时终止:如模块处理超时 2001 表示未执行请求的操作:如文本超过指定长度 |
message | string | 返回信息 |
{ "data": { "text": "阳光保险集团股份有限公司于2005年7月成立", "segment": [ { "offset": 0, "pos": "nt", "basic_words": [ "阳光保险集团", "股份有限公司" ], "length": 12, "word": "阳光保险集团股份有限公司" }, { "offset": 12, "pos": "p", "basic_words": [], "length": 1, "word": "于" }, { "offset": 13, "pos": "t", "basic_words": [ "2005", "年", "7月" ], "length": 7, "word": "2005年7月" }, { "offset": 20, "pos": "v", "basic_words": [], "length": 2, "word": "成立" } ] }, "code": 0, "message": "success" }
{ "data": { "text": "阳光保险集团股份有限公司于2005年7月成立", "segment": [ { "offset": 0, "pos": "nt", "basic_words": [ "阳光保险集团", "股份有限公司" ], "length": 12, "word": "阳光保险集团股份有限公司" }, { "offset": 12, "pos": "p", "basic_words": [], "length": 1, "word": "于" }, { "offset": 13, "pos": "t", "basic_words": [ "2005", "年", "7月" ], "length": 7, "word": "2005年7月" }, { "offset": 20, "pos": "v", "basic_words": [], "length": 2, "word": "成立" } ] }, "code": 0, "message": "success"}
分词词性标签 | 释义 | 举例说明 |
---|---|---|
n | 名词 | 余额、手机 |
nr | 人名 | 张三、老李 |
nrj | 日语人名 | 福原爱、小栗旬 |
nrf | 音译人名 | 卡尔·马克思、C.S.刘易斯 |
ns | 地名 | 北京市、海淀区 |
nsf | 音译地名 | 纽约市、曼哈顿区 |
nz | 其他专名 | 西安事变、红楼梦 |
nx | 字母词 | CPU、log |
nba | 动物名 | 东北虎、阿拉斯加犬 |
nbp | 植物名 | 波斯菊、牵牛花 |
nf | 食物名 | 薯片、米粉 |
nnd | 职业 | 文秘、教师 |
nnt | 职务 | 校长、经理 |
nhd | 疾病 | 感冒、发烧 |
nhm | 药品 | 乳酸菌素片、藿香正气水 |
nmc | 化学品名 | 乙醇、甲醇 |
nt | 机构团体名(包括政府机 构) | 联合国、教育部 |
nis | 机构后缀 | 学院、大学 |
ntc | 公司名 | 玖富、百度 |
ntcb | 银行 | 中国银行、招商银行 |
ntcf | 工厂 | 富士康 |
ntch | 酒店宾馆 | 全季酒店 |
nth | 医院 | 北医三院 |
nts | 中小学 | 北大附小 |
ntu | 大学 | 北京大学 |
v | 动词 | 吃、看 |
vshi | 动词“是” | 是、不是 |
vyou | 动词“有” | 有、没有 |
vf | 趋向动词 | 上去、下来 |
vn | 名词性动词 | 指挥、通知 |
vd | 能愿动词 | (不)能、(不)可以 |
vx | 形式动词 | 进行、加以 |
vi | 不及物动词 | 吃饭、开会 |
vl | 动词性惯用语 | 吃不了兜着走 |
a | 性质形容词 | 宽大、容不容易 |
z | 状态形容词 | 胖胖的、笔直 |
an | 形容词性名词 | 困难、痛苦 |
ad | 形容词性副词 | 深入、容易 |
d | 副词 | 很、非常 |
t | 时间词 | 周一、五点 |
s | 处所词 | 手头、家里 |
f | 方位词 | 前、后、上、下 |
b | 区别词 | 雄、雌、公共、半自动 |
m | 数词 | 一、第一 |
mq | 数量词 | 点、一点 |
q | 量词 | 本、个、个个 |
qv | 动量词 | 趟、下 |
qt | 时量词 | 天、小时 |
r | 代词 | 这下、这下子 |
rr | 人称代词 | 你、我、他 |
rz | 指示代词 | 这个、那样 |
rzt | 时间指示代词 | 这天、这时 |
rzs | 地点指示代词 | 这里、这儿 |
rzv | 谓词性指示代词 | 看语境:这样 |
ry | 疑问代词 | 什么、怎样 |
ryt | 时间疑问代词 | 多久、何时 |
rys | 处所疑问代词 | 哪里、哪儿 |
ryv | 谓词性疑问代词 | 看语境:干嘛、怎么办 |
p | 介词 | 在、为了 |
pba | 介词“把” | 把 |
pbei | 介词“被” | 被 |
c | 连词 | 因为、虽然 |
cc | 并列连词 | 和、还是 |
u | 助词 | 也罢、得慌 |
uzhe | 助词“着” | 着 |
ule | 助词“了” | 了 |
uguo | 助词“过” | 过 |
ude1 | 助词“的” | 的 |
ude2 | 助词“地” | 地 |
ude3 | 助词“得” | 得 |
usuo | 助词“所” | 所 |
udeng | 助词“等” | 等、云云、之类 |
uyy | 助词“一样” | 一样、似的、一般 |
udh | 助词“的话” | 的话 |
uls | 助词“来说” | 来说、来讲、而言、而论 |
uzhi | 助词“之” | 之 |
ulian | 助词“连” | 连 |
e | 叹词 | 哎呀、天哪 |
o | 拟声词 | 哗啦、扑通、滴答 |
y | 语气词 | 了、呢、吧 |
i | 成语 | 兢兢业业、说一不二 |
h | 前缀 | 阿(婆)、老(爸) |
k | 后缀 | (学)者、(桌)子 |
g | 语素字 | (五点)时 |
ng | 名词性语素 | (出了五天)差 |
vg | 动词性语素 | (街头)现(新型诈骗手段) |
tg | 时间词语素 | (上大学)时 |
ag | 形容词性语素 | 众(明星)、(事故)频(发) |
xx | 非语素字 | 葡、萄 |
w | 标点符号 | !、。 |