首页 > 编程语言 > iOS开发 > iOS开发探索-正则表达式
2016
02-19

iOS开发探索-正则表达式

概念

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

给定一个正则表达式和另一个字符串,我们可以达到如下的目的:
  1. 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”);
  2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。
正则表达式的特点是:
  1. 灵活性、逻辑性和功能性非常的强;
  2. 可以迅速地用极简单的方式达到字符串的复杂控制。
  3. 对于刚接触的人来说,比较晦涩难懂。
正则表达式的应用:

正则表达式是一种用来进行文本匹配的工具,其语法优美简洁。在开发中,查找、对比以及匹配字符串是家常便饭的业务,通过正则表达式我们将这些业务描述成某些需求规则,来让我们的代码更美观、实用。

使用步骤

1.定义正则表达式规则
2.通过规则,创建正则表达式对象
3.利用正则表达式对象匹配字符串
注意:正则表达式通常缩写成“regex”

正则表达式常见的语义语法
/**
 *  正则表达式简单说明
 *  语法:
 .       匹配除换行符以外的任意字符 \\w      匹配字母或数字或下划线或汉字 \\s      匹配任意的空白符 \\d      匹配数字 \\b      匹配单词的开始或结束
 ^       匹配字符串的开始 $       匹配字符串的结束
 *       重复零次或更多次
 +       重复一次或更多次
 ?       重复零次或一次 {n} 重复n次 {n,} 重复n次或更多次 {n,m} 重复n到m次 \\W      匹配任意不是字母,数字,下划线,汉字的字符 \\S      匹配任意不是空白符的字符 \\D      匹配任意非数字的字符 \\B      匹配不是单词开头或结束的位置 [^x] 匹配除了x以外的任意字符 [^aeiou]匹配除了aeiou这几个字母以外的任意字符
 *?      重复任意次,但尽可能少重复
 +?      重复1次或更多次,但尽可能少重复
 ??      重复0次或1次,但尽可能少重复 {n,m}?     重复n到m次,但尽可能少重复 {n,}?     重复n次以上,但尽可能少重复 \\a      报警字符(打印它的效果是电脑嘀一声) \\b      通常是单词分界位置,但如果在字符类里使用代表退格 \\t      制表符,Tab \\r      回车 \\v      竖向制表符 \\f      换页符 \\n      换行符 \\e      Escape \\0nn     ASCII代码中八进制代码为nn的字符 \\xnn     ASCII代码中十六进制代码为nn的字符 \\unnnn     Unicode代码中十六进制代码为nnnn的字符 \\cN     ASCII控制字符。比如\\cC代表Ctrl+C \\A      字符串开头(类似^,但不受处理多行选项的影响) \\Z      字符串结尾或行尾(不受处理多行选项的影响) \\z      字符串结尾(类似$,但不受处理多行选项的影响) \\G      当前搜索的开头 \\p{name} Unicode中命名为name的字符类,例如\\p{IsGreek} (?>exp)     贪婪子表达式
 (?<x>-<y>exp)     平衡组
 (?im-nsx:exp)     在子表达式exp中改变处理选项
 (?im-nsx)       为表达式后面的部分改变处理选项
 (?(exp)yes|no)     把exp当作零宽正向先行断言,如果在这个位置能匹配,使用yes作为此组的表达式;否则使用no
 (?(exp)yes)     同上,只是使用空表达式作为no
 (?(name)yes|no) 如果命名为name的组捕获到了内容,使用yes作为表达式;否则使用no
 (?(name)yes)     同上,只是使用空表达式作为no

 捕获
 (exp)               匹配exp,并捕获文本到自动命名的组里
 (?<name>exp)        匹配exp,并捕获文本到名称为name的组里,也可以写成    (?'name'exp)
 (?:exp)             匹配exp,不捕获匹配的文本,也不给此分组分配组号
 零宽断言
 (?=exp)             匹配exp前面的位置
 (?<=exp)            匹配exp后面的位置
 (?!exp)             匹配后面跟的不是exp的位置
 (?<!exp)            匹配前面不是exp的位置
 注释
 (?#comment)         这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读

 *  表达式:\\(?0\\d{2}[) -]?\\d{8} *  这个表达式可以匹配几种格式的电话号码,像(010)88886666,或022-22334455,或02912345678等。
 *  我们对它进行一些分析吧:
 *  首先是一个转义字符\\(,它能出现0次或1次(?),然后是一个0,后面跟着2个数字(\\d{2}),然后是)或-或空格中的一个,它出现1次或不出现(?),
 *  最后是8个数字(\\d{8})
 */
以下为通过一个分类将常用到的一些正则表达是进行归类

NSString+RegexCategory.h

#import <Foundation/Foundation.h> @interface NSString (RegexCategory) /**
 *  手机号码的有效性:分电信、联通、移动和小灵通
 */ - (BOOL)isMobileNumberClassification; /**
 *  手机号有效性
 */ - (BOOL)isMobileNumber; /**
 *  邮箱的有效性
 */ - (BOOL)isEmailAddress; /**
 *  简单的身份证有效性
 *
 */ - (BOOL)simpleVerifyIdentityCardNum; /**
 *  精确的身份证号码有效性检测
 *
 *  @param value 身份证号
 */ + (BOOL)accurateVerifyIDCardNumber:(NSString *)value; /**
 *  车牌号的有效性
 */ - (BOOL)isCarNumber; /**
 *  银行卡的有效性
 */ - (BOOL)bankCardluhmCheck; /**
 *  IP地址有效性
 */ - (BOOL)isIPAddress; /**
 *  Mac地址有效性
 */ - (BOOL)isMacAddress; /**
 *  网址有效性
 */ - (BOOL)isValidUrl; /**
 *  纯汉字
 */ - (BOOL)isValidChinese; /**
 *  邮政编码
 */ - (BOOL)isValidPostalcode; /**
 *  工商税号
 */ - (BOOL)isValidTaxNo; /**
 @brief     是否符合最小长度、最长长度,是否包含中文,首字母是否可以为数字
 @param     minLenth 账号最小长度
 @param     maxLenth 账号最长长度
 @param     containChinese 是否包含中文
 @param     firstCannotBeDigtal 首字母不能为数字
 @return    正则验证成功返回YES, 否则返回NO
 */ - (BOOL)isValidWithMinLenth:(NSInteger)minLenth
               maxLenth:(NSInteger)maxLenth
         containChinese:(BOOL)containChinese
    firstCannotBeDigtal:(BOOL)firstCannotBeDigtal; /**
 @brief     是否符合最小长度、最长长度,是否包含中文,数字,字母,其他字符,首字母是否可以为数字
 @param     minLenth 账号最小长度
 @param     maxLenth 账号最长长度
 @param     containChinese 是否包含中文
 @param     containDigtal   包含数字
 @param     containLetter   包含字母
 @param     containOtherCharacter   其他字符
 @param     firstCannotBeDigtal 首字母不能为数字
 @return    正则验证成功返回YES, 否则返回NO
 */ - (BOOL)isValidWithMinLenth:(NSInteger)minLenth
               maxLenth:(NSInteger)maxLenth
         containChinese:(BOOL)containChinese
          containDigtal:(BOOL)containDigtal
          containLetter:(BOOL)containLetter
  containOtherCharacter:(NSString *)containOtherCharacter
    firstCannotBeDigtal:(BOOL)firstCannotBeDigtal; @end

NSString+RegexCategory.m

#import "NSString+RegexCategory.h" @implementation NSString (RegexCategory) #pragma mark - 正则相关 - (BOOL)isValidateByRegex:(NSString *)regex
{ NSPredicate *pre = [NSPredicate predicateWithFormat:@"SELF MATCHES %@",regex]; return [pre evaluateWithObject:self];
} #pragma mark - //手机号分服务商 - (BOOL)isMobileNumberClassification{ /**
 * 手机号码
 * 移动:134[0-8],135,136,137,138,139,150,151,157,158,159,182,187,188,1705
 * 联通:130,131,132,152,155,156,185,186,1709
 * 电信:133,1349,153,180,189,1700
 */ //    NSString * MOBILE = @"^1((3//d|5[0-35-9]|8[025-9])//d|70[059])\\\\d{7}$";//总况 /**
 10         * 中国移动:China Mobile
 11         * 134[0-8],135,136,137,138,139,150,151,157,158,159,182,187,188,1705
 12         */ NSString * CM = @"^1(34[0-8]|(3[5-9]|5[017-9]|8[278])\\\\d|705)\\\\d{7}$"; /**
 15         * 中国联通:China Unicom
 16         * 130,131,132,152,155,156,185,186,1709
 17         */ NSString * CU = @"^1((3[0-2]|5[256]|8[56])\\\\d|709)\\\\d{7}$"; /**
 20         * 中国电信:China Telecom
 21         * 133,1349,153,180,189,1700
 22         */ NSString * CT = @"^1((33|53|8[09])\\\\d|349|700)\\\\d{7}$"; /**
 25         * 大陆地区固话及小灵通
 26         * 区号:010,020,021,022,023,024,025,027,028,029
 27         * 号码:七位或八位
 28         */ NSString * PHS = @"^0(10|2[0-5789]|\\\\d{3})\\\\d{7,8}$"; //    NSPredicate *regextestmobile = [NSPredicate predicateWithFormat:@"SELF MATCHES %@", MOBILE]; if (([self isValidateByRegex:CM])
    || ([self isValidateByRegex:CU])
    || ([self isValidateByRegex:CT])
    || ([self isValidateByRegex:PHS]))
{ return YES;
} else { return NO;
}
} //手机号有效性 - (BOOL)isMobileNumber{ /**
 *  手机号以13、15、18、170开头,8个 \\d 数字字符
 *  小灵通 区号:010,020,021,022,023,024,025,027,028,029 还有未设置的新区号xxx
 */ NSString *mobileNoRegex = @"^1((3\\\\d|5[0-35-9]|8[025-9])\\\\d|70[059])\\\\d{7}$";//除4以外的所有个位整数,不能使用[^4,\\\\d]匹配,这里是否iOS Bug? NSString *phsRegex =@"^0(10|2[0-57-9]|\\\\d{3})\\\\d{7,8}$"; BOOL ret = [self isValidateByRegex:mobileNoRegex]; BOOL ret1 = [self isValidateByRegex:phsRegex]; return (ret || ret1);
} //邮箱 - (BOOL)isEmailAddress{ NSString *emailRegex = @"[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\\\\.[A-Za-z]{2,4}"; return [self isValidateByRegex:emailRegex];
} //身份证号 - (BOOL) simpleVerifyIdentityCardNum
{ NSString *regex2 = @"^(\\\\d{14}|\\\\d{17})(\\\\d|[xX])$"; return [self isValidateByRegex:regex2];
} //车牌 - (BOOL)isCarNumber{ //车牌号:湘K-DE829 香港车牌号码:粤Z-J499港 NSString *carRegex = @"^[\\u4e00-\\u9fff]{1}[a-zA-Z]{1}[-][a-zA-Z_0-9]{4}[a-zA-Z_0-9_\\u4e00-\\u9fff]$";//其中\\u4e00-\\u9fa5表示unicode编码中汉字已编码部分,\\u9fa5-\\u9fff是保留部分,将来可能会添加 return [self isValidateByRegex:carRegex];
}

- (BOOL)isMacAddress{ NSString * macAddRegex = @"([A-Fa-f\\\\d]{2}:){5}[A-Fa-f\\\\d]{2}"; return [self isValidateByRegex:macAddRegex];
}

- (BOOL)isValidUrl
{ NSString *regex = @"^((http)|(https))+:[^\\\\s]+\\\\.[^\\\\s]*$"; return [self isValidateByRegex:regex];
}

- (BOOL)isValidChinese;
{ NSString *chineseRegex = @"^[\\u4e00-\\u9fa5]+$"; return [self isValidateByRegex:chineseRegex];
}

- (BOOL)isValidPostalcode { NSString *postalRegex = @"^[0-8]\\\\d{5}(?!\\\\d)$"; return [self isValidateByRegex:postalRegex];
}

- (BOOL)isValidTaxNo
{ NSString *taxNoRegex = @"[0-9]\\\\d{13}([0-9]|X)$"; return [self isValidateByRegex:taxNoRegex];
}

- (BOOL)isValidWithMinLenth:(NSInteger)minLenth
               maxLenth:(NSInteger)maxLenth
         containChinese:(BOOL)containChinese
    firstCannotBeDigtal:(BOOL)firstCannotBeDigtal;
{ //  [\\u4e00-\\u9fa5A-Za-z0-9_]{4,20} NSString *hanzi = containChinese ? @"\\u4e00-\\u9fa5" : @""; NSString *first = firstCannotBeDigtal ? @"^[a-zA-Z_]" : @""; NSString *regex = [NSString stringWithFormat:@"%@[%@A-Za-z0-9_]{%d,%d}", first, hanzi, (int)(minLenth-1), (int)(maxLenth-1)]; return [self isValidateByRegex:regex];
}

- (BOOL)isValidWithMinLenth:(NSInteger)minLenth
               maxLenth:(NSInteger)maxLenth
         containChinese:(BOOL)containChinese
          containDigtal:(BOOL)containDigtal
          containLetter:(BOOL)containLetter
  containOtherCharacter:(NSString *)containOtherCharacter
    firstCannotBeDigtal:(BOOL)firstCannotBeDigtal;
{ NSString *hanzi = containChinese ? @"\\u4e00-\\u9fa5" : @""; NSString *first = firstCannotBeDigtal ? @"^[a-zA-Z_]" : @""; NSString *lengthRegex = [NSString stringWithFormat:@"(?=^.{%@,%@}$)", @(minLenth), @(maxLenth)]; NSString *digtalRegex = containDigtal ? @"(?=(.*\\\\d.*){1})" : @""; NSString *letterRegex = containLetter ? @"(?=(.*[a-zA-Z].*){1})" : @""; NSString *characterRegex = [NSString stringWithFormat:@"(?:%@[%@A-Za-z0-9%@]+)", first, hanzi, containOtherCharacter ? containOtherCharacter : @""]; NSString *regex = [NSString stringWithFormat:@"%@%@%@%@", lengthRegex, digtalRegex, letterRegex, characterRegex]; return [self isValidateByRegex:regex];
} #pragma mark - 算法相关 //精确的身份证号码有效性检测 + (BOOL)accurateVerifyIDCardNumber:(NSString *)value {
value = [value stringByTrimmingCharactersInSet:[NSCharacterSet whitespaceAndNewlineCharacterSet]]; int length =0; if (!value) { return NO;
}else {
    length = (int)value.length; if (length !=15 && length !=18) { return NO;
    }
} // 省份代码 NSArray *areasArray =@[@"11",@"12", @"13",@"14", @"15",@"21", @"22",@"23", @"31",@"32", @"33",@"34", @"35",@"36", @"37",@"41", @"42",@"43", @"44",@"45", @"46",@"50", @"51",@"52", @"53",@"54", @"61",@"62", @"63",@"64", @"65",@"71", @"81",@"82", @"91"]; NSString *valueStart2 = [value substringToIndex:2]; BOOL areaFlag =NO; for (NSString *areaCode in areasArray) { if ([areaCode isEqualToString:valueStart2]) {
        areaFlag =YES; break;
    }
} if (!areaFlag) { return false;
} NSRegularExpression *regularExpression; NSUInteger numberofMatch; int year =0; switch (length) { case 15:
        year = [value substringWithRange:NSMakeRange(6,2)].intValue +1900; if (year %4 ==0 || (year %100 ==0 && year %4 ==0)) {

            regularExpression = [[NSRegularExpression alloc] initWithPattern:@"^[1-9][0-9]{5}[0-9]{2}((01|03|05|07|08|10|12)(0[1-9]|[1-2][0-9]|3[0-1])|(04|06|09|11)(0[1-9]|[1-2][0-9]|30)|02(0[1-9]|[1-2][0-9]))[0-9]{3}$" options:NSRegularExpressionCaseInsensitive error:nil];//测试出生日期的合法性 }else {
            regularExpression = [[NSRegularExpression alloc]initWithPattern:@"^[1-9][0-9]{5}[0-9]{2}((01|03|05|07|08|10|12)(0[1-9]|[1-2][0-9]|3[0-1])|(04|06|09|11)(0[1-9]|[1-2][0-9]|30)|02(0[1-9]|1[0-9]|2[0-8]))[0-9]{3}$" options:NSRegularExpressionCaseInsensitive error:nil];//测试出生日期的合法性 }
        numberofMatch = [regularExpression numberOfMatchesInString:value
                                                           options:NSMatchingReportProgress range:NSMakeRange(0, value.length)]; if(numberofMatch >0) { return YES;
        }else { return NO;
        } case 18:
        year = [value substringWithRange:NSMakeRange(6,4)].intValue; if (year %4 ==0 || (year %100 ==0 && year %4 ==0)) {

            regularExpression = [[NSRegularExpression alloc] initWithPattern:@"^[1-9][0-9]{5}19[0-9]{2}((01|03|05|07|08|10|12)(0[1-9]|[1-2][0-9]|3[0-1])|(04|06|09|11)(0[1-9]|[1-2][0-9]|30)|02(0[1-9]|[1-2][0-9]))[0-9]{3}[0-9Xx]$" options:NSRegularExpressionCaseInsensitive error:nil];//测试出生日期的合法性 }else {
            regularExpression = [[NSRegularExpression alloc] initWithPattern:@"^[1-9][0-9]{5}19[0-9]{2}((01|03|05|07|08|10|12)(0[1-9]|[1-2][0-9]|3[0-1])|(04|06|09|11)(0[1-9]|[1-2][0-9]|30)|02(0[1-9]|1[0-9]|2[0-8]))[0-9]{3}[0-9Xx]$" options:NSRegularExpressionCaseInsensitive error:nil];//测试出生日期的合法性 }
        numberofMatch = [regularExpression numberOfMatchesInString:value
                                                           options:NSMatchingReportProgress range:NSMakeRange(0, value.length)]; if(numberofMatch >0) { int S = ([value substringWithRange:NSMakeRange(0,1)].intValue + [value substringWithRange:NSMakeRange(10,1)].intValue) *7 + ([value substringWithRange:NSMakeRange(1,1)].intValue + [value substringWithRange:NSMakeRange(11,1)].intValue) *9 + ([value substringWithRange:NSMakeRange(2,1)].intValue + [value substringWithRange:NSMakeRange(12,1)].intValue) *10 + ([value substringWithRange:NSMakeRange(3,1)].intValue + [value substringWithRange:NSMakeRange(13,1)].intValue) *5 + ([value substringWithRange:NSMakeRange(4,1)].intValue + [value substringWithRange:NSMakeRange(14,1)].intValue) *8 + ([value substringWithRange:NSMakeRange(5,1)].intValue + [value substringWithRange:NSMakeRange(15,1)].intValue) *4 + ([value substringWithRange:NSMakeRange(6,1)].intValue + [value substringWithRange:NSMakeRange(16,1)].intValue) *2 + [value substringWithRange:NSMakeRange(7,1)].intValue *1 + [value substringWithRange:NSMakeRange(8,1)].intValue *6 + [value substringWithRange:NSMakeRange(9,1)].intValue *3; int Y = S %11; NSString *M =@"F"; NSString *JYM =@"10X98765432";
            M = [JYM substringWithRange:NSMakeRange(Y,1)];// 判断校验位 if ([M isEqualToString:[value substringWithRange:NSMakeRange(17,1)]]) { return YES;// 检测ID的校验位 }else { return NO;
            }

        }else { return NO;
        } default: return NO;
}
    } /** 银行卡号有效性问题Luhn算法
 *  现行 16 位银联卡现行卡号开头 6 位是 622126~622925 之间的,7 到 15 位是银行自定义的,
 *  可能是发卡分行,发卡网点,发卡序号,第 16 位是校验码。
 *  16 位卡号校验位采用 Luhm 校验方法计算:
 *  1,将未带校验位的 15 位卡号从右依次编号 1 到 15,位于奇数位号上的数字乘以 2
 *  2,将奇位乘积的个十位全部相加,再加上所有偶数位上的数字
 *  3,将加法和加上校验位能被 10 整除。
 */ - (BOOL)bankCardluhmCheck{ NSString * lastNum = [[self substringFromIndex:(self.length-1)] copy];//取出最后一位 NSString * forwardNum = [[self substringToIndex:(self.length -1)] copy];//前15或18位 NSMutableArray * forwardArr = [[NSMutableArray alloc] initWithCapacity:0]; for (int i=0; i<forwardNum.length; i++) { NSString * subStr = [forwardNum substringWithRange:NSMakeRange(i, 1)];
    [forwardArr addObject:subStr];
} NSMutableArray * forwardDescArr = [[NSMutableArray alloc] initWithCapacity:0]; for (int i = (int)(forwardArr.count-1); i> -1; i--) {//前15位或者前18位倒序存进数组 [forwardDescArr addObject:forwardArr[i]];
} NSMutableArray * arrOddNum = [[NSMutableArray alloc] initWithCapacity:0];//奇数位*2的积 < 9 NSMutableArray * arrOddNum2 = [[NSMutableArray alloc] initWithCapacity:0];//奇数位*2的积 > 9 NSMutableArray * arrEvenNum = [[NSMutableArray alloc] initWithCapacity:0];//偶数位数组 for (int i=0; i< forwardDescArr.count; i++) { NSInteger num = [forwardDescArr[i] intValue]; if (i%2) {//偶数位 [arrEvenNum addObject:[NSNumber numberWithInteger:num]];
    }else{//奇数位 if (num * 2 < 9) {
            [arrOddNum addObject:[NSNumber numberWithInteger:num * 2]];
        }else{ NSInteger decadeNum = (num * 2) / 10; NSInteger unitNum = (num * 2) % 10;
            [arrOddNum2 addObject:[NSNumber numberWithInteger:unitNum]];
            [arrOddNum2 addObject:[NSNumber numberWithInteger:decadeNum]];
        }
    }
}

__block NSInteger sumOddNumTotal = 0;
[arrOddNum enumerateObjectsUsingBlock:^(NSNumber * obj, NSUInteger idx, BOOL *stop) {
    sumOddNumTotal += [obj integerValue];
}];

__block NSInteger sumOddNum2Total = 0;
[arrOddNum2 enumerateObjectsUsingBlock:^(NSNumber * obj, NSUInteger idx, BOOL *stop) {
    sumOddNum2Total += [obj integerValue];
}];

__block NSInteger sumEvenNumTotal =0 ;
[arrEvenNum enumerateObjectsUsingBlock:^(NSNumber * obj, NSUInteger idx, BOOL *stop) {
    sumEvenNumTotal += [obj integerValue];
}]; NSInteger lastNumber = [lastNum integerValue]; NSInteger luhmTotal = lastNumber + sumEvenNumTotal + sumOddNum2Total + sumOddNumTotal; return (luhmTotal%10 ==0)?YES:NO;
}

- (BOOL)isIPAddress{ NSString *regex = [NSString stringWithFormat:@"^(\\\\d{1,3})\\\\.(\\\\d{1,3})\\\\.(\\\\d{1,3})\\\\.(\\\\d{1,3})$"]; NSPredicate *pre = [NSPredicate predicateWithFormat:@"SELF MATCHES %@",regex]; BOOL rc = [pre evaluateWithObject:self]; if (rc) { NSArray *componds = [self componentsSeparatedByString:@","]; BOOL v = YES; for (NSString *s in componds) { if (s.integerValue > 255) {
            v = NO; break;
        }
    } return v;
} return NO;
} @end

编程技巧