产品亮点
分词系统基于隐马模型开发出的汉语分析系統,主要功能包括中文分词、词性标注、命名实体识别、新词识别。
产品说明


中文分词是什么
中文分词指的是将一个汉字序列切分成一个一个单独的词。中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。分词系统基于隐马模型开发出的汉语分析系統,主要功能包括中文分词、词性标注、命名实体识别、新词识别。
应用场景
分词服务主要用于中文语义分析。常用应用场景如:
对博客标题进行分词,提取其中的名词作为文章关键词。
对用户搜索条件进行分词,提取其中关键词语进行搜索。
词性列表
代码 |
词性说明 |
0 |
不知道 |
10 |
形容词 |
20 |
区别词 |
30 |
连词 |
31 |
体词连接 |
32 |
分句连接 |
40 |
副词 |
41 |
副词(“不”) |
42 |
副词(“没”) |
50 |
叹词 |
60 |
方位词 |
61 |
方位短语(处所词+方位词) |
62 |
方位短语(名词+方位词“地上”) |
63 |
方位短语(动词+方位词“取前”) |
64 |
方位短语(动词+方位词“取前”) |
70 |
前接成分 |
71 |
数词前缀(“数”—数十) |
72 |
时间词前缀(“公元”“明永乐”) |
73 |
姓氏 |
74 |
姓氏 |
80 |
后接成分 |
81 |
数词后缀(“来”–,十来个) |
82 |
时间词后缀(“初”“末”“时”) |
83 |
名词后缀(“们”) |
84 |
处所词后缀(“苑”“里”) |
85 |
状态词后缀(“然”) |
86 |
状态词后缀(“然”) |
87 |
状态词后缀(“然”) |
90 |
数词 |
95 |
名词 |
96 |
人名(“毛泽东”) |
97 |
机构团体(“团”的声母为t,名词代码n和t并在一起。“公司”) |
99 |
机构团体名(“北大”) |
100 |
其他专名(“专”的声母的第1个字母为z,名词代码n和z并在一起。) |
101 |
名处词 |
102 |
地名(名处词专指:“中国”) |
103 |
n-m,数词开头的名词(三个学生) |
104 |
n-rb,以区别词/代词开头的名词(该学校,该生) |
107 |
拟声词 |
108 |
介词 |
110 |
量词 |
111 |
动量词(“趟”“遍”) |
112 |
时间量词(“年”“月”“期”) |
113 |
货币量词(“元”“美元”“英镑”) |
120 |
代词 |
121 |
副词性代词(“怎么”) |
122 |
数词性代词(“多少”) |
123 |
名词性代词(“什么”“谁”) |
124 |
处所词性代词(“哪儿”) |
125 |
时间词性代词(“何时”) |
126 |
谓词性代词(“怎么样”) |
127 |
区别词性代词(“某”“每”) |
130 |
处所词(取英语space的第1个字母。“东部”) |
131 |
处所词(取英语space的第1个字母。“东部”) |
132 |
时间词(取英语time的第1个字母) |
140 |
助词 |
141 |
定语助词(“的”) |
142 |
状语助词(“地”) |
143 |
补语助词(“得”) |
144 |
谓词后助词(“了、着、过”) |
145 |
体词后助词(“等、等等”) |
146 |
助词(“所”) |
150 |
标点符号 |
151 |
顿号(“、”) |
152 |
句号(“。”) |
153 |
分句尾标点(“,”“;”) |
154 |
搭配型标点左部 |
155 |
搭配型标点右部(“》”“]”“)”) |
156 |
中缀型符号 |
160 |
语气词(取汉字“语”的声母。“吗”“吧”“啦”) |
170 |
及物动词(取英语动词verb的第一个字母。) |
171 |
不及物谓词(谓宾结构“剃头”) |
172 |
动补结构动词(“取出”“放到”) |
173 |
动词“是” |
174 |
动词“有” |
175 |
趋向动词(“来”“去”“进来”) |
176 |
助动词(“应该”“能够”) |
180 |
状态词(不及物动词,v-o、sp之外的不及物动词) |
190 |
语素字 |
191 |
名词语素(“琥”) |
192 |
动词语素(“酹”) |
193 |
处所词语素(“中”“日”“美”) |
194 |
时间词语素(“唐”“宋”“元”) |
195 |
状态词语素(“伟”“芳”) |
196 |
状态词语素(“伟”“芳”) |
200 |
不及物谓词(主谓结构“腰酸”“头疼”) |
201 |
数量短语(“叁个”) |
202 |
代量短语(“这个”) |
210 |
副形词(直接作状语的形容词) |
211 |
名形词(具有名词功能的形容词) |
212 |
副动词(直接作状语的动词) |
213 |
名动词(指具有名词功能的动词) |
230 |
空格 |
我们还有以下商品:
1、证件识别




2、汽车识别

3、其他识别


4、图片审核(政治敏感,色情敏感,广告词)
5、金融工具




6、开发服务

7、知识产权






售后支持范围
售后服务范围为产品使用方面的技术支持,售后支持时间范围为合同期范围内