搜索资源列表
firtex_beta102_src
- FirteX介绍 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支持多字段检索,日期范围检索,检索结果自定义排序等。 性能: 在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度 在近7G的索引文件(100G网页,11G纯文本的索引)上检索,仅使用十几M内存在数毫
SharpICTCLAS
- ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct(人名库)、ns.dct(地名库)、tr.dct(翻译人名库
work1.tar
- 实现一个简易的printf函数,系统调用write的调用格式为size_t write (int fd,const void * buf,size_t count),将读取buf中字长为count的数据进入到文件描述符为fd的文件中-Achieve a simple printf function, call the system call write format size_t write (int fd, const void* buf, size_t count), will read t
msrlts_v1.2
- 陌生人随机聊天室 免费开源,任意使用 简介: 陌生人随机聊天室是一个类似omegle.com的在线匿名聊天系统。 功能: 1.匿名用户配对聊天 2.聊天记录可以下载 3.可以显示对方输入状态 4.采用轮询服务器方式传输数据,相比comet方式,服务器压力小许多,而且轮询间隔时间可以调节。 5.显示在线人数 6.敏感词屏蔽 7.基于ip地址的地理位置显示 安装方法: 1.编辑common.php文件,填写数据库连接信息 2.上传文件