资源列表
jobo-src
- 真正的网络爬虫的源代码啊,希望大家好好阅读,写出心得体会啊
Projects
- 进货管理系统为操作员提供主功能界面。 进货管理系统在启动时要求操作员输入ID和口令,只有ID和口令正确,才可以进入系统的主功能界面。 操作员负责对进货管理系统的维护工作,因此系统应赋予操作员对系统信息、进行录入、修改、查询和删除等功能的操作权限。 操作员作为代理实现进货基本信息管理业务。 供货商信息、货物信息保存在对应的数据库表中。
main
- 从文件中搜索EMAIL地址,帮住公司搜集一些信息
PcfgParser
- 1. 先打开规则库,读入规则集 (可比较两个规则文件rule1.txt 和 rule2.txt的差异) 2. 选择经过分词和词性标注的文件,进行句法分析 3. 分析结果文件与测试文件在同一个目录下,文件后缀名为 .pcfg 4. 分析结束后,同时产生一个新的规则文件,后缀名为.new, 可以观察规则概率值和期望次数的变化 5. 分析结果逐个以树形图方式显示,如果一个句子有多个结果,在显示框中同时显示。
BottomUpParser
- 一个简单的基于Chart的自底向上句法分析器
word
- 实现中文分词,词汇表记录在WORD.TXT文件中。待分词文档为article.txt。
xqdj
- 人代会人员名单,使用EXCEL VBA编写,实现了自动按楼群等自定义方式分解、打印功能,效率很高。
BottomUpParser
- 中文信息处理方面的一个源码,此为自底向上的句法分析程序。功能比较完善,代码简洁易懂。
POSTagger
- 中文信息处理方面的一个源码。此为一个词性标注软件,需要有事先做好的词典的支持。功能强大,代码简洁易懂。
ProbWordSeg
- 中文信息处理方面的一个源码。此为一个分词软件,这个分词的算法虽然简单,但是原理和其他相同,是最大概率法分次。功能强大,代码简洁易懂。
TestMDB
- 中文信息处理方面的一个源码。此为一个拼音分析和生成软件功能强大,代码简洁易懂。 1 可执行程序TestLexicon.exe必须与数据库文件在同一个目录下 2 数据库文件名为: lexicon.mdb,可以是access 97版格式的数据库, 也可以是access 2000版格式的数据库 3 双击TestLexicon.exe启动程序 4 选择“词典数据库”下“词库查询1”等进行查询,状态栏显示每个查询的 区别。程序反馈消息框响应用户的查询。
TestCorpus
- 一个检索单个汉字、多个汉字和词组,并且可以检索多种搭配的程序。使用起来非常方便。