搜索资源列表
ProgrammingPCollectivePIntelligence
- 本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过
MetaSeeker-4.11.2
- 主要应用领域: • 垂直搜索(Vertical Search):也称为专业搜索,高速、海量和精确抓取是定题网络爬虫DataScraper的强项,每天24小时每周7天无人值守自主调度的周期性批量采集,加上断点续传和软件看门狗(Watch Dog),确保您高枕无忧 • 移动互联网:手机搜索、手机混搭(mashup)、移动社交网络、移动电子商务都离不开结构化的数据内容,DataScraper实时高效地 采集内容,输出富含语义元数据的XML格式的抓取结果文件,确保自动化
iwebSNS
- 作为一款大型高并发高负载的开源SNS(社交网络服务)软件,iwebSNS功能强大,易于扩展,具有良好的伸缩性和稳定性。 它基于iweb SuperInteraction(简称iweb SI)框架开发。借助iwebSI平台,站点可以轻松获得支持热插拔及快速增加新节点的集群计算与处理能力(分布式计算与存储/高可用性/负载均衡),以方便管理web2.0类站点持续增长的数据量。SI的web层、db层负载均衡,基于内存的分布式缓存系统、dfs(分布式文件系统)、分布式数据存储等可以轻松支持站点拥有服务
The-programming-collective-wisdom
- 《集体智慧编程》(programming collective intelligence building smart web 2.0 applications)以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数
karate_network
- karate train data,著名的社交网络数据集,用于社区发现-karate train data,well know data set for community detection in graph
Probabilistic-Matrix-Factorization
- MATLAB 实现的概率矩阵分解,可以用于社交网络推荐,将评分矩阵分解为两个低维的用户和商品特征矩阵。代码中需要在load位置添加自己试验所需的数据集。-MATLAB realization probability matrix decomposition can be used for social networking recommendation, the scoring matrix is decomposed into two low dimensional
Geolife Data 1.3
- Geolife GPS 轨迹数据集–用户指南 这一 GPS 轨迹数据集是在 (微软研究亚洲) Geolife 项目中收集的, 178 用户在四年 (2007年4月至 2011年10月) 期间。该数据集的 GPS 轨迹由一个时间戳点序列表示, 每一个都包含纬度、经度和高度信息。该数据集包含17621个轨迹, 总距离为1251654公里, 总持续时间为48203小时。该轨迹数据集可以应用于移动模式挖掘、用户活动识别、基于位置的社交网络、位置隐私和位置推荐等多个研究领域。(Geolife GPS t
社交网络数据集
- t includes rating data and trust data two data files. Rating data file consists of 49290 users on 139738 different items comments, where each row of data format is: user_id item_id rating_value. For example, 23 387 5, denotes that the comment of user
K-order Markov Chain in Mobile Social Networks
- 针对移动社交网络中节点中心性预测问题,提出基于K阶马尔科夫链的中心性预测方法。在真实移动社交数据集的中计算信息熵分析节点中心性的过去与未来规律性,研究了节点中心性的可预测性。利用节点中心性的历史信息,构建状态转移概率矩阵,预测节点未来中心性值, 并通过分析真实值与预测值之间的误差评估了这些预测方法的性能。结果表明,当阶数K=2时,与四种基于时窗的中心性预测方法比较,基于K阶马尔科夫链的预测模型在MIT数据集和Infocom 06数据集中虽不在个体上优于已提出的预测方法,但在整体上达到了优化。(w