资源列表
siuying_segment
- 「我是中國人」,ChineseTokenizer會將之分割為五個中文字:「我、是、中、國、人」,CJKTokenizer則會將之分割為「我是、是中、中國、國人」四個二節的詞。前者的問題是沒有考慮中文詞語的問題,如搜尋「國中」一樣搜尋到「我是中國人」。後者的問題則是制做了大量沒意義的詞如「是中」「國人」,讓索引沒必要地增大、降低搜尋效率。
Levinson
- AR模型参数确定后计算出功率谱, 用Levision_Durbin 算法
pingfenxitong
- 一个投标评分小系统!在excel中使用,以文本文件保存数据!
ChineseAnalyzer
- lucene.net 2.0的中文分词器,采用最大向前匹配算法,附上源代码和lucene.net.dll,希望这方面有兴趣的互相交流一下。
Big5-GB-Unicode
- Big5,GB,Unicode互相转换的源代码。 C++编写
07S051098
- 通过隐马尔可夫模型做词性标注,即给定一个句子,得到它的最优词性序列
ppt
- 德力士品牌管理幻灯片,内容排版清新,按钮制作精美,超漂亮的演示文稿模板
Word
- 对中科院分词程序的简化版本,做成了动态链接库形式
mysql-connector-java-5.0.8.tar
- mysql jdbc驱动程序 mysql jdbc驱动程序 mysql jdbc驱动程序
JTextPane
- 用java编写的记事本 具有打开保存的功能 可供大家学习
SocietyInforDistill
- gis,使用c#,arcobject(ae)实现空间分析的列子(geoproceor使用),根据面积淹没,实现灾评信息的统计.
NLP
- 只要在在文本栏中输入想要测试的字符串,点击切分按钮即可看到普通词切分基本功能的结果。