搜索资源列表
VSM
- 用TFIDF和特征增益两种方式实现了特征向量空间的建立,将文本文件表示成特征向量的形式,为接下来的聚类做了准备。程序用JAVA写成。
1
- 修复后台修改未激活及未审核的会员时,提示类型不匹配 修复会员中心查找好友里查看在线用户,链接空间地址不正确 修复相关链接不指定模型时,调用出来的链接会错乱 修复sql标签如果调用keywords字段,调用出来的链接都成了一个了 修复后台邮箱发送,收到的信件会出现html代码问题 加强后台*检查文件KS.CheckMM.asp,加入一些常见的特征码,建议定期用此功能扫描下您的网站 修复company/show.asp页面会显示未审核的供求信息 修复系统函
javaKNN
- java KNN 算法源码: 邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法可以说是整个数据挖掘分类技术中最简单的方法了。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用她最接近的k个邻居来代表。 kNN算法的核心思想是如果一个样本在特征空间中的k个最相似的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 kNN方法在类别决策
CanopyExm
- Canopy聚类算法是一个将对象分组到类的简单、快速、精确地方法。每个对象用多维特征空间里的一个点来表示。这个算法使用一个快速近似距离度量和两个距离阈值 T1>T2来处理。 Canopy聚类算法能快速找出应该选择多少个簇,同时找到簇的中心,这样可以大大优化 K均值聚类算法的效率 。-Canopy is a clustering algorithm to group objects into simple categories, fast, accurate method. Each obj
qtxtdbp
- 特征: 标准的CRUD操作; 支持搜索; 速度快。 与其他文本数据库的主要区别: 不同于其他任何文本数据库,QTxtDB仅对需要的记录进行操作,不会为了一条记录而完全重写整个文本文件。大大提高了效率。 采用固定长度字段,方便记录的删除、更新。(为了速度,牺牲一点点硬盘空间是值得的。)-features: Standard CRUD operation Support search Fast speed. Main differences wi