搜索资源列表
BFcode
- 布隆过滤器的C语言实现,可以检索海量数据,用于去重-Bloom filter C language, you can retrieve huge amounts of data, for the de-emphasis
string_search
- 利用标准trie和bloom filter算法进行海量email地址搜索,开发编译环境为linux c,在2000万个email地址中搜索1000个地址占用内存为47M。-use standard Trie and bloom filter algorithms to search massive email address, the compiler development environment is linux c, and it occupies 47M memories to sea
BloomFilter
- 如需要判断一个元素是不是在一个集合中,我们通常做法是把所有元素保存下来,然后通过比较知道它是不是在集合内,链表、树都是基于这种思路,当集合内元素个数的变大,我们需要的空间和时间都线性变大,检索速度也越来越慢。 Bloom filter 采用的是哈希函数的方法,将一个元素映射到一个 m 长度的阵列上的一个点,当这个点是 1 时,那么这个元素在集合内,反之则不在集合内。这个方法的缺点就是当检测的元素很多的时候可能有冲突,解决方法就是使用 k 个哈希 函数对应 k 个点,如果所有点都是 1 的话,那么
crawler
- 轻量级爬虫框架,可控制抓取深度 跟踪最初站源 可配置线程池 可配置UserAgent 可决定是否要抽取链接 Bloom Filter 可控制爬取速度 内置UserAgent池 支持Proxy池(Lightweight crawler framework)
fasl4
- generat bloom filter
CuckooFilter-master
- 网上找到的一个很不错的cuckoo算法,C语言实现,容易移植(Cuckoo Filter ============= A key-value filter using cuckoo hashing, substituting for bloom filter. Usage ----- ```c cd cuckoo_filter make ./cockoo_db input_file output_file ``` Define `CUCKOO_DBG` in
Hutool_v3.2.0
- Hutool是一个Java基础工具类,对文件、流、加密解密、转码、正则、线程、XML等JDK方法进行封装,组成各种Util工具类,同时提供以下组件: 布隆过滤 缓存 克隆接口 类型转换 日期处理 数据库ORM(基于ActiveRecord思想) 基于DFA有限自动机的多个关键字查找 HTTP客户端 IO和文件 有用的一些数据结构 日志 反射代理类的简化(AOP切面实现) Setting(一种扩展Properties的配置文件) System(JVM和系统信息等) W