分词服务接口

分词服务接口

中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。

服务保障
请勿线下交易!90%的欺诈、纠纷、资金盗取均由线下交易导致。

产品亮点

分词系统基于隐马模型开发出的汉语分析系統,主要功能包括中文分词、词性标注、命名实体识别、新词识别。

产品说明

 

中文分词是什么

中文分词指的是将一个汉字序列切分成一个一个单独的词。中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。分词系统基于隐马模型开发出的汉语分析系統,主要功能包括中文分词、词性标注、命名实体识别、新词识别。

应用场景

分词服务主要用于中文语义分析。常用应用场景如:

对博客标题进行分词,提取其中的名词作为文章关键词。

对用户搜索条件进行分词,提取其中关键词语进行搜索。

词性列表

代码 词性说明
0 不知道
10 形容词
20 区别词
30 连词
31 体词连接
32 分句连接
40 副词
41 副词(“不”)
42 副词(“没”)
50 叹词
60 方位词
61 方位短语(处所词+方位词)
62 方位短语(名词+方位词“地上”)
63 方位短语(动词+方位词“取前”)
64 方位短语(动词+方位词“取前”)
70 前接成分
71 数词前缀(“数”—数十)
72 时间词前缀(“公元”“明永乐”)
73 姓氏
74 姓氏
80 后接成分
81 数词后缀(“来”–,十来个)
82 时间词后缀(“初”“末”“时”)
83 名词后缀(“们”)
84 处所词后缀(“苑”“里”)
85 状态词后缀(“然”)
86 状态词后缀(“然”)
87 状态词后缀(“然”)
90 数词
95 名词
96 人名(“毛泽东”)
97 机构团体(“团”的声母为t,名词代码n和t并在一起。“公司”)
99 机构团体名(“北大”)
100 其他专名(“专”的声母的第1个字母为z,名词代码n和z并在一起。)
101 名处词
102 地名(名处词专指:“中国”)
103 n-m,数词开头的名词(三个学生)
104 n-rb,以区别词/代词开头的名词(该学校,该生)
107 拟声词
108 介词
110 量词
111 动量词(“趟”“遍”)
112 时间量词(“年”“月”“期”)
113 货币量词(“元”“美元”“英镑”)
120 代词
121 副词性代词(“怎么”)
122 数词性代词(“多少”)
123 名词性代词(“什么”“谁”)
124 处所词性代词(“哪儿”)
125 时间词性代词(“何时”)
126 谓词性代词(“怎么样”)
127 区别词性代词(“某”“每”)
130 处所词(取英语space的第1个字母。“东部”)
131 处所词(取英语space的第1个字母。“东部”)
132 时间词(取英语time的第1个字母)
140 助词
141 定语助词(“的”)
142 状语助词(“地”)
143 补语助词(“得”)
144 谓词后助词(“了、着、过”)
145 体词后助词(“等、等等”)
146 助词(“所”)
150 标点符号
151 顿号(“、”)
152 句号(“。”)
153 分句尾标点(“,”“;”)
154 搭配型标点左部
155 搭配型标点右部(“》”“]”“)”)
156 中缀型符号
160 语气词(取汉字“语”的声母。“吗”“吧”“啦”)
170 及物动词(取英语动词verb的第一个字母。)
171 不及物谓词(谓宾结构“剃头”)
172 动补结构动词(“取出”“放到”)
173 动词“是”
174 动词“有”
175 趋向动词(“来”“去”“进来”)
176 助动词(“应该”“能够”)
180 状态词(不及物动词,v-o、sp之外的不及物动词)
190 语素字
191 名词语素(“琥”)
192 动词语素(“酹”)
193 处所词语素(“中”“日”“美”)
194 时间词语素(“唐”“宋”“元”)
195 状态词语素(“伟”“芳”)
196 状态词语素(“伟”“芳”)
200 不及物谓词(主谓结构“腰酸”“头疼”)
201 数量短语(“叁个”)
202 代量短语(“这个”)
210 副形词(直接作状语的形容词)
211 名形词(具有名词功能的形容词)
212 副动词(直接作状语的动词)
213 名动词(指具有名词功能的动词)
230 空格

我们还有以下商品:

1、证件识别

2、汽车识别

3、其他识别

4、图片审核(政治敏感,色情敏感,广告词)

 

5、金融工具

6、开发服务

7、知识产权

售后支持范围

售后服务范围为产品使用方面的技术支持,售后支持时间范围为合同期范围内
热搜类目 热搜产品 快速入口