GPT-4新增审核功能 可自动识别不良信息

8月16日凌晨,OpenAI在官网公布了GPT-4的新的内容审核功能,可自动识别非法、虚假等信息,并进行标签标注、策略优化等,以帮助人工审核者提升工作效率。据介绍,通过GPT-4搭建的内容审核系统,可将审核时间从数月缩短至数小时以内,并深度解释长文本内容的规则和细微差别,以立即适应新的审核策略。

GPT-4新增审核功能

其实,智能审核功能已经在贴吧、reddit、虎扑、Quora、抖音、快手、豆瓣、知乎等各大媒体平台广泛应用。但经常会出现“误删”的问题,明明我们发布的帖子、视频没有任何违规依然会被秒删。这是因为AI在执行内容审核时,会严格执行人工定下的数据标签,对一些中间地带的内容无法解释,只能采取一刀切的方式。

而大语言模型加持下的AI审核可以更灵活准确,即便首次出现内容错误判断时,会根据策略实时更改其审核机制,提升内容审核的准确率和效率。

GPT-4的审核功能在应用前,会根据人工制定的审核模型和数据进行微调,以保证审核的准确性和安全性,才会大规模应用。流程如下:

  • 人工编写审核策略,通过识别少量示例、策略,为审核的内容打上数据标签。
  • GPT-4读取策略并将标签分配给同一数据集。
  • 检查人类审核和GPT-4审核的区别。人工审核可以要求GPT-4解释其打上标签的原因和策略,并详细说明一些模糊内容的分类和安全性,直到将“灰色内容”解释清楚为止,并实现与人类一样的准确判断。

目前,通过GPT-4 API就可以将内容审核功能集成在应用、系统等产品中。

服务商动态

讯飞星火认知大模型V2.0重磅发布 推出代码能力与多模态能力

2023-8-16 9:29:03

服务商动态

亚马逊用生成式AI总结用户评论 自动生成精华评论

2023-8-16 10:39:32

相关推荐