产品亮点
违禁词库:包含海量历史数据,提供对敏感事件、违规词语及监管要求封禁词语的识别审核能力,同时于2020年1月开始包含对新冠疫情谣言的识别审核能力
文本色情:对文本中的色情行为描述、色情资源链接、低俗交友、污秽文爱等内容进行识别
违禁违规:对暴力行为、恐怖描述、赌博、毒品、枪支弹药等违禁内容进行识别
恶意推广:对文本中带有售卖意向的软文广告,微信、QQ等个人联系方式等违规内容及变体进行识别
低俗辱骂:对文本中的侮辱谩骂、人身攻击、消极宣泄等内容进行识别
低质灌水:对网络社区常见的乱码、水帖、刷屏等无意义的灌水信息进行识别
广告法审核:对广告法中要求的不能出现的违规词进行检测
产品说明
应用场景
- 用户评论过滤:对网站用户的评论信息进行检测,审核出涉及色情、暴恐、恶意推广等内容,保证良好的用户体验
- 注册信息筛查:对用户的注册信息进行筛查,避免黑产通过用户名实现违规信息的推广
- 文章内容审核:对UGC文章内容进行多个维度的审核,避免因内容违规导致的APP下架等损失
注意事项
请求体格式化: Content-Type为application/x-www-form-urlencoded,然后通过urlencode格式化请求体
文本长度限制:20000字节(约等于6666个字符数)
响应参数
参数名称
|
数据类型
|
是否必须
|
备注
|
log_id
|
Long
|
Y
|
请求唯一id
|
error_code
|
Long
|
N
|
错误提示码,失败才返回,成功不返回
|
error_msg
|
String
|
N
|
错误提示信息,失败才返回,成功不返回
|
conclusion
|
String
|
N
|
审核结果,可取值:合规、不合规、疑似、审核失败
|
conclusionType
|
Integer
|
N
|
审核结果类型,可取值1.合规,2.不合规,3.疑似,4.审核失败
|
data
|
Array
|
N
|
不合规/疑似/命中白名单项详细信息。响应成功并且conclusion为疑似或不合规或命中白名单时才返回,响应失败或conclusion为合规且未命中白名单时不返回。
|
+error_code
|
Integer
|
否
|
内层错误提示码,底层服务失败才返回,成功不返回
|
+error_msg
|
String
|
否
|
内层错误提示信息,底层服务失败才返回,成功不返回
|
+type
|
Integer
|
N
|
审核主类型,11:官方违禁词库、12:文本反作弊、13:自定义文本黑名单、14:自定义文本白名单
|
+subType
|
Integer
|
N
|
审核子类型,此字段需参照type主类型字段决定其含义:
当type=11时subType取值含义:
0:官方默认违禁词库
当type=12时subType取值含义:
0:低质灌水、1:违禁违规、2:文本色情、3:敏感信息、4:恶意推广、5:低俗辱骂 6:恶意推广-联系方式、7:恶意推广-软文推广
当type=13时subType取值含义:
0:自定义文本黑名单
当type=14时subType取值含义:
0:自定义文本白名单
|
+msg
|
String
|
N
|
不合规项描述信息
|
+hits
|
Array
|
N
|
送检文本违规原因的详细信息
|
++probability
|
Float
|
N
|
不合规项置信度
|
++datasetName
|
String
|
N
|
违规项目所属数据集名称
|
++words
|
Array
|
N
|
送检文本命中词库的关键词(备注:建议参考新字段“wordHitPositions”,包含信息更丰富:关键词以及对应的位置及标签信息)
|
++modelHitPositions
|
Array
|
N
|
送检文本命中模型的详细信息,包含位置信息及置信度信息。位置信息:命中模型的违规内容在送检原文中的位置(从0开始计算):“开始位置”、“结束位置”;置信度信息:命中模型对应的置信度分数(范围:0至1,数字越大,可能性越高)。返回示例见下方“成功响应示例——不合规”部分
|
++wordHitPositions
|
Array
|
N
|
送检文本命中词库的详细信息,为Object的列表,包含words、positions、label三个字段,详细描述如下表所示。返回示例见下方“成功响应示例——不合规”部分
|
+++keyword
|
String
|
N
|
送检文本命中词库的关键词
|
+++positions
|
Array
|
N
|
关键词在送检原文中的位置(从0开始计算):分别为“起始位置”,“结束位置”
|
+++label
|
String
|
N
|
关键词命中的细分标签,标签规则见文末“细分标签对照表”
|
成功响应示例 ——合规
成功响应示例——不合规
失败响应示例
{
"log_id": 149319909347709,
"error_code": 0,
"error_msg":"configId error"
}
细分标签对照表
一级分类(subType)
|
二级分类(label)
|
label含义
|
1:违禁违规
|
100100
|
恐怖描述
|
100200
|
毒品违禁药
|
100300
|
武器描述
|
100400
|
赌博及高利贷
|
100500
|
儿童恐怖影视
|
100600
|
造假&非法培训
|
100700
|
翻墙外挂服务
|
100800
|
代孕&人口买卖
|
100900
|
个人信息贩卖
|
101000
|
诈骗
|
101100
|
保护动物
|
109900
|
其它违禁相关
|
2:文本色情
|
200101
|
性挑逗-轻度涉黄
|
200102
|
性行为描述-重度涉黄
|
200202
|
未成年色情-重度涉黄
|
200302
|
性器官描述-重度涉黄
|
200401
|
畸恋描述-轻度涉黄
|
200402
|
畸恋描述-重度涉黄
|
200501
|
色情段子-轻度涉黄
|
200502
|
色情资源-重度涉黄
|
200601
|
色情交友-轻度涉黄
|
200602
|
色情交友-重度涉黄
|
200701
|
色情道具-轻度涉黄
|
200702
|
色情道具-重度涉黄
|
200801
|
恋物癖-轻度涉黄
|
200802
|
恋物癖-重度涉黄
|
209900
|
其他色情相关
|
4:恶意推广
|
400100
|
联系方式
|
400200
|
关注引流
|
400300
|
兼职代理
|
400400
|
产品推广
|
400500
|
企业推广
|
400600
|
广告法
|
400990
|
其他恶意推广
|
5:低俗辱骂
|
500100
|
轻度辱骂
|
500200
|
重度辱骂
|
|
|
|
售后支持范围
售后服务范围为产品使用方面的技术支持,售后支持时间范围为合同期范围内