违规文字审核接口

违规文字审核接口

基于中文NLP技术,结合海量的中文关键词库,准确识别各种敏感文本及其变体违规内容。

服务保障
请勿线下交易!90%的欺诈、纠纷、资金盗取均由线下交易导致。

产品能力

[]

产品亮点

违禁词库:包含海量历史数据,提供对敏感事件、违规词语及监管要求封禁词语的识别审核能力,同时于2020年1月开始包含对新冠疫情谣言的识别审核能力 文本色情:对文本中的色情行为描述、色情资源链接、低俗交友、污秽文爱等内容进行识别 违禁违规:对暴力行为、恐怖描述、赌博、毒品、枪支弹药等违禁内容进行识别 恶意推广:对文本中带有售卖意向的软文广告,微信、QQ等个人联系方式等违规内容及变体进行识别 低俗辱骂:对文本中的侮辱谩骂、人身攻击、消极宣泄等内容进行识别 低质灌水:对网络社区常见的乱码、水帖、刷屏等无意义的灌水信息进行识别 广告法审核:对广告法中要求的不能出现的违规词进行检测

产品说明

应用场景

  • 用户评论过滤:对网站用户的评论信息进行检测,审核出涉及色情、暴恐、恶意推广等内容,保证良好的用户体验
  • 注册信息筛查:对用户的注册信息进行筛查,避免黑产通过用户名实现违规信息的推广
  • 文章内容审核:对UGC文章内容进行多个维度的审核,避免因内容违规导致的APP下架等损失

注意事项

请求体格式化: Content-Type为application/x-www-form-urlencoded,然后通过urlencode格式化请求体
文本长度限制:20000字节(约等于6666个字符数)

响应参数

参数名称

数据类型

是否必须

备注

log_id

Long

Y

请求唯一id

error_code

Long

N

错误提示码,失败才返回,成功不返回

error_msg

String

N

错误提示信息,失败才返回,成功不返回

conclusion

String

N

审核结果,可取值:合规、不合规、疑似、审核失败

conclusionType

Integer

N

审核结果类型,可取值1.合规,2.不合规,3.疑似,4.审核失败

data

Array

N

不合规/疑似/命中白名单项详细信息。响应成功并且conclusion为疑似或不合规或命中白名单时才返回,响应失败或conclusion为合规且未命中白名单时不返回。

+error_code

Integer

内层错误提示码,底层服务失败才返回,成功不返回

+error_msg

String

内层错误提示信息,底层服务失败才返回,成功不返回

+type

Integer

N

审核主类型,11:官方违禁词库、12:文本反作弊、13:自定义文本黑名单、14:自定义文本白名单

+subType

Integer

N

审核子类型,此字段需参照type主类型字段决定其含义:
当type=11时subType取值含义:
0:官方默认违禁词库
当type=12时subType取值含义:
0:低质灌水、1:违禁违规、2:文本色情、3:敏感信息、4:恶意推广、5:低俗辱骂 6:恶意推广-联系方式、7:恶意推广-软文推广
当type=13时subType取值含义:
0:自定义文本黑名单
当type=14时subType取值含义:
0:自定义文本白名单

+msg

String

N

不合规项描述信息

+hits

Array

N

送检文本违规原因的详细信息

++probability

Float

N

不合规项置信度

++datasetName

String

N

违规项目所属数据集名称

++words

Array

N

送检文本命中词库的关键词(备注:建议参考新字段“wordHitPositions”,包含信息更丰富:关键词以及对应的位置及标签信息)

++modelHitPositions

Array

N

送检文本命中模型的详细信息,包含位置信息及置信度信息。位置信息:命中模型的违规内容在送检原文中的位置(从0开始计算):“开始位置”、“结束位置”;置信度信息:命中模型对应的置信度分数(范围:0至1,数字越大,可能性越高)。返回示例见下方“成功响应示例——不合规”部分

++wordHitPositions

Array

N

送检文本命中词库的详细信息,为Object的列表,包含words、positions、label三个字段,详细描述如下表所示。返回示例见下方“成功响应示例——不合规”部分

+++keyword

String

N

送检文本命中词库的关键词

+++positions

Array

N

关键词在送检原文中的位置(从0开始计算):分别为“起始位置”,“结束位置”

+++label

String

N

关键词命中的细分标签,标签规则见文末“细分标签对照表”

成功响应示例 ——合规

成功响应示例——不合规

失败响应示例

{

    "log_id": 149319909347709,

    "error_code": 0,

    "error_msg":"configId error"

}

细分标签对照表

一级分类(subType)

二级分类(label)

label含义

1:违禁违规

100100

恐怖描述

100200

毒品违禁药

100300

武器描述

100400

赌博及高利贷

100500

儿童恐怖影视

100600

造假&非法培训

100700

翻墙外挂服务

100800

代孕&人口买卖

100900

个人信息贩卖

101000

诈骗

101100

保护动物

109900

其它违禁相关

2:文本色情

200101

性挑逗-轻度涉黄

200102

性行为描述-重度涉黄

200202

未成年色情-重度涉黄

200302

性器官描述-重度涉黄

200401

畸恋描述-轻度涉黄

200402

畸恋描述-重度涉黄

200501

色情段子-轻度涉黄

200502

色情资源-重度涉黄

200601

色情交友-轻度涉黄

200602

色情交友-重度涉黄

200701

色情道具-轻度涉黄

200702

色情道具-重度涉黄

200801

恋物癖-轻度涉黄

200802

恋物癖-重度涉黄

209900

其他色情相关

4:恶意推广

400100

联系方式

400200

关注引流

400300

兼职代理

400400

产品推广

400500

企业推广

400600

广告法

400990

其他恶意推广

5:低俗辱骂

500100

轻度辱骂

500200

重度辱骂

 

 

 

 

 

售后支持范围

售后服务范围为产品使用方面的技术支持,售后支持时间范围为合同期范围内
热搜类目 热搜产品 快速入口