搜索资源列表
kmeans
- 对文章进行kmeans聚类,进行网页主体内容的提取-Extraction of articles kmeans clustering for web main content
convnetjs-master
- 基于C#开发的深度神经网络网页版。将文件夹拖动至浏览器即可使用功能。包括CNN、DBN等多种深度学习思路。-Based on C# development of depth Neural Network Web version. Drag the folder to the browser functionality. Including CNN, DBN and other deep learning ideas.
ThemeCrawler
- 现在常见的搜索策略主要分为两种:一种是基于网页链接结构的搜索策略,另一种是基于内容评价的搜索策略。第一种是通过网页之间的链接关系来确定网页的重要性,从而决定链接访问的顺序。此方法虽然考虑了网页链接结构和网页之间的链接关系,但忽略了网页内容与主题的相关度,容易出现网页搜索“主题漂移”。第二种主要考虑网页内容,好处就是思路清晰且计算简单。但这种方法忽略了网页的链接关系,故在预测链接网页价值方面存在不足。考虑到这些问题,提出将布谷鸟搜索算法应用到主题爬虫中。-Now the common search
pachongBDTB
- Python 爬去百度贴吧中一个贴子的内容,运用Urllib2和re模块,并对爬取的内容进行修改,去掉网页中的各种标签。-Python crawls the contents of a post in Baidu Post Bar, using Urllib2 and re modules, and crawl the contents of the amendment, remove the various pages of the label.
pachongtest2
- 运用python爬取知乎日报的内容,对知乎日报网页中的每一个子链接进行爬取,并对内容进行修改,运用re,urllib2,BeautifulSoup模块。-Use python to crawl the contents of daily news, to know every page in the daily sub-links to crawl, and to modify the content, the use of re, urllib2, BeautifulSoup module.
string
- 几个蚁群算法源代码打包,文件里为网页格式,希望对大家有帮助()