前面聊了布隆过滤器,回归认识一下位图BitMap,阅读前文的同学应该发现了布隆过滤器本身就是基于位图,是位图的一种改进。
位图
先看一个问题, 假如有1千万个整数,整数范围在1到1亿之间,如何快速确定某个整数是否在这个1千万个整数中呢?
乍一看是一个查找问题,循环、二分查找都是常规思路。
一个好的答案是存储结构和算法的完美结合, 基于题干上的特征和条件,我们是否有其他思路。
对于题干我们使用高中排列组合的思维:有1亿个有编号的空篮子,我们拿出这1千万个有数字的球,放进对应的篮子。
最后,所有的篮子有两种状态:有球/无球,我们要确定某个数字是否存在,就看对应篮子是否为空。
什么是位图?每一位存放某种状态,适用于海量数据,通常用于判断数据是否存在。位图的空间由数据的最大值决定。
位图这种数据结构来大大节省内存的使用量。
我们只需要构造一个长度为1亿的bit数组,将有球位置标记为1,无球位置默认记为0; 这样我们就将数字转换成了一个被压缩紧致的数组索引,1亿bit数组不到16M空间。
确定某位置有球,只需要O(1)的时间复杂度。
常用属性
Count BitArray中包含实例的个数
IsReadOnly 获取一个值,该值指示BitArray是否为只读
Item 获取或设置BitArray中特定位置的值
Length 获取或设置BitArray中元素的数目
常用的方法
And 和指定的BitArray中相应的元素做and运算
Or 按位或运算
Xor 按位异或运算
Not 取反所有元素
Get 获取特定位置处的值
Set 设定特定位置处的值
SetAll 将BitArray中所有的元素设定为指定的值
public sealed class BitArray : ICollection, IEnumerable, ICloneable { public BitArray(BitArray bits); //用已有的BitArray给新的BitArray初始化 public BitArray(bool[] values); //用布尔数组初始化 public BitArray(byte[] bytes); //用字节数组初始化 public BitArray(int length); //初始化并设置位数值,此值会在使用中自动增长 public BitArray(int[] values); //用int数组初始化 public BitArray(int length, bool defaultValue); //初始化并设置默认值 public int Count { get; } //位数组中现存的位的个数 public bool IsReadOnly { get; } //确定位数组是否只读 public bool IsSynchronized { get; } //是否同步对此BitArray的操作,用在线程安全上 public int Length { get; set; } //位数组的位数 public object SyncRoot { get; } public bool this[int index] { get; set; } //索引器,利用索引读位值 public BitArray And(BitArray value); //按位与 public object Clone(); //创建BitArray 的浅表副本。 public void CopyTo(Array array, int index); //将BitArray拷贝到其他数组中 public bool Get(int index); //按下标读取位值 public IEnumerator GetEnumerator(); //返回循环访问BitArray 的枚举数 public BitArray Not(); //按位非 public BitArray Or(BitArray value); //按位或 public void Set(int index, bool value); //按位设置值 public void SetAll(bool value); //设置所有位为指定值 public BitArray Xor(BitArray value); //按位异或 }
C# 有专业的位图数组:BitArray
using System; using System.Collections; namespace Bitmap { class Program { static void Main(string[] args) { var input = Console.ReadLine(); var num = int.Parse(input); var bitmap = InitBitMap(); if (bitmap.Get(num)) { Console.WriteLine($"找到数字{num}"); } else { Console.WriteLine($"未找到数字{num}"); } } public static BitArray InitBitMap() { var myBA1 = new BitArray(10000); var arr1 = new int[] { 1, 2, 4, 6, 77, 77, 88, 99, 100, 500, 600, 700, 999, 8888 }; foreach (int element in arr1) { myBA1[element] = true; } return myBA1; } } }
BitArray是管理位值的紧凑数组,用布尔值表示,其中true表示位是开启的(1),false表示位是关闭的(0), 是引用类型,位于System.Collections命名空间。
以上只是小试牛刀,我们针对原题再发散一下,如何找到以上1千万数字中重复的数字?
还是篮子中放球的思路,这次我们要两排篮子,也就是两个BitMap,利用位AND运算(同时为True,结果才是True)找到两排篮子中均有球的位置。
using System; using System.Collections; namespace Bitmap { class Program { static void Main(string[] args) { var bitmap = InitBitMap(); for (int i = 0; i < bitmap.Length; i++) { if(bitmap[i] == true) { Console.WriteLine(i); } } } public static BitArray InitBitMap() { var myBA1 = new BitArray(10000); var myBA2 = new BitArray(10000); var arr1 = new int[] { 1, 2, 4, 6, 77, 77, 88, 99, 100, 500, 600, 700, 999, 8888 }; foreach (int element in arr1) { if (myBA1[element] == false) { myBA1[element] = true; } else { myBA2[element] = true; } } myBA1 = myBA1.And(myBA2); return myBA1; } } }
最后提醒各位:宝藏组件Redis天然支持位图
到此这篇关于C# 位图BitArray的使用的文章就介绍到这了,更多相关C# 位图BitArray内容请搜索自学编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持自学编程网!
- 本文固定链接: https://zxbcw.cn/post/216115/
- 转载请注明:必须在正文中标注并保留原文链接
- QQ群: PHP高手阵营官方总群(344148542)
- QQ群: Yii2.0开发(304864863)