搜索资源列表
无词典分词
- 基于后缀数组的无词典分词算法,通过后缀和散列表获取汉字的结合模式,通过置信度筛选词
fen
- 基于后缀数组无词典分词算法,利用散列表获得汉字结合模式,通过置信度进行赛选。-Suffix array-based non-dictionary word segmentation algorithm, the use of hash table model was combined with Chinese characters, through the confidence to carry out the election race.
SogouT.mini.tar
- 百度搜索引擎具有响应速度快、查找结果准确全面、时效性强、无效链接少、符合中文语言特点和中国人使用习惯等优点。 1...这种方法只需对语料中的字组频度进行统计,不需要切分词典,因而又叫做无词典分词法或统计取词方法。但这种方法也有一定- IHTMLDocument3* pHTMLDoc3 HRESULT hr = m_pHTMLDocument2->QueryInterface(IID_IHTMLDocument3, (LPVOID*)&pHTMLDoc3)
CatDemo
- JAVA文章检索 压缩包无加密,含有源代码 可运行,无错误,功能:1.分词;2.能添加新的词典 希望对下载的朋友们有帮助(JAVA article search compression package, no encryption, containing the source code can run, no error, function: 1. word segmentation; 2. can add new dictionaries, I hope to download friends