CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 文档资料 搜索资源 - 敏感词库

搜索资源列表

  1. design-documents

    1下载:
  2. 网页信息采集子系统: 网页采集:动态查找及实时分析新增网页,读取网页回帖信息。 网页过滤:,对获取的网页,通过网页清洗模块清除网页中的广告、导航信息、 图片、版权说明等噪声数据,萃取出相关网页的标题、正文、链接地址、采集时 间、回帖、发帖人数等数据。 网页信息预处理子系统: 网页审查脏字:主要功能包括中文分词、词性标注、命名实体识别、新词识别, 建立数据库说明每类词库,建立敏感词词库。 网页舆情监测:监测是否出现了一定影响的舆论,即回帖的回帖或支持、顶等 达到
  3. 所属分类:software engineering

    • 发布日期:2017-11-08
    • 文件大小:626.8kb
    • 提供者:黄生
  1. 敏感词库大全.txt

    9下载:
  2. 敏感词库,用于敏感词过滤等系统的词库设置,包含1k多个词(Sensitive thesaurus, used for thesaurus establishment of sensitive words filtering system, including 1K multiple words.)
  3. 所属分类:文章/文档

    • 发布日期:2019-07-26
    • 文件大小:6kb
    • 提供者:thor830428
搜珍网 www.dssz.com