搜索资源列表
news.Rar
- 伴随着网络的出现,网页逐渐融入人们的生活。快速及时的新闻浏览,五彩缤纷的网上信息,使网络与人们的生活息息相关,于是世界上又出现了第三媒体——Internet。它打破了地域限制,真正使信息得以共享,改变了人们的工作和生活方式。而网页具有信息量大,传递快速,没有时空限制等特点。在这个网络时代,人们了解的新闻不仅仅是来源于电视、报纸等,还来源于网络。所以新闻发布系统也就成为大家所认可的在网络浏览新闻的最佳途径。 本系统实现了对新闻的添加、修改、删除、审核,以及对用户的管理等功能,在前台新闻浏览模块
Document-ranking-algorithm
- 以前的算法是根据点击数目来排行,有很多不足的地方,比如没有考虑时间因素,没有考虑用户对其的推荐等因素,我打算以文章浏览次数,评论次数,引用次数以及文章的日期来生成。把用户的评论数目作为推荐次数,文章的发表日期到今天的时间做为时间因素。 1条评论和100次浏览有相同积分。 1条Traceback等于2条评论的积分。评论和引用的增长是线性的。 浏览次数增大,取得的积分以开平方根的方式增长,即数字越大,变化越小。 文章的日期做为负积分,以指数方式增长,越老的文章,会变为
selenium_sina_text
- python 写的爬虫 可以爬取新浪微博wap端的内容,包括用户发表的微博内容,时间,终端,评论数,转发数等指标,直接可用-write python reptile You can crawl content Weibo wap side, including micro-blog content published by users, time, terminal, Comments, forwarding numbers and other indicators, directly