搜索资源 - data segmentation - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

Internet/网络编程

搜索资源 - data segmentation

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

搜索资源列表

SharpICTCLAS

0下载：
ICTCLAS分词的总体流程包括：1）初步分词；2）词性标注；3）人名、地名识别；4）重新分词；5）重新词性标注这五步。就第一步分词而言，又细分成：1）原子切分；2）找出原子之间所有可能的组词方案；3）N-最短路径中文词语粗分三步。在所有内容中，词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中，常用的词典包括coreDict.dct（词典库）、BigramDict.dct（词与词间的关联库）、nr.dct（人名库）、ns.dct（地名库）、tr.dct（翻译人名库
所属分类：Search Engine
- 发布日期：2017-04-09
- 文件大小：1.87mb
- 提供者：ounata

totsearch

0下载：
淘特站内搜索引擎(C#版)基于Lucene.Net核心，通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时，通过读取索引文件查询，避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库，为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案-Amoy Special Search Engine (C# Edition) Based on Lucene.Net core, through the effective Chinese word
所属分类：Search Engine
- 发布日期：2017-03-29
- 文件大小：597.23kb
- 提供者：yanghe

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.