搜索资源列表
多种分词方法
- 含有多个分词算法。毕业设计的时候获得的,希望对大家在汉字处理中能用的到。 ICTCLAS算法,中科院,对名字识别能力很强。VC开发。 CSharp分词,向前匹配加向后最大匹配,C#开发,容易扩展。 小叮咚分词,由后向前最大匹配,C#开发。 xerdoc分词,基于ICTCLAS的Java版本分词。 文本分词词典,分词的词典,可以提供分词数据源。-containing more than Segmentation. Graduation was the time of hope
DataMining
- 用VC或Java实现K-means聚类算法,分别以迭代次数及分配不再发生变化为算法终止条件,用图片(自己选择)作为数据集,比较运行时间(画出时间与像素点的关系曲线图,因此须用多幅像素个数不同的图片进行实验),提交实验报告与源代码。-With the picture (choose your own) as data sets, more running time (draw time and pixels relations diagram, so must use many different