1 2 3 4 5 6 7 8 9 | function check_html( $html ) { preg_match_all( "/<([a-zA-Z0-9]+)\\s*[^\\/>]*>/" , $html , $start_tags ); preg_match_all( "/<\\/([a-zA-Z0-9]+)>/" , $html , $end_tags ); if ( count ( $start_tags [1]) != count ( $end_tags [1])) return false; for ( $i = 0; $i < count ( $start_tags [1]); $i ++) { if (!in_array( $start_tags [1][ $i ], $end_tags [1])) return false; } return true; } |
解释:
/<([a-zA-Z0-9]+)\\s*[^\\/>]*>/这个模式是用来匹配HTML的标记(如:<head>、<div>、<div id="main">等等,但是除了<br/>这种)的,并且在$start_tags保持着标签的名字(如:head、div等)。而/<\\/([a-zA-Z0-9]+)>/这个模式是用来匹配闭合的HTML标记(如:</head>,</div>等)的。并且在$end_tags中保持这闭合的标签名。然后我们用count($start_tags[1]) != count($end_tags[1])这个条件语句来判断开始的标记跟闭合的标记是否相等,不相等就说明没闭合。最后用in_array($start_tags[1][$i], $end_tags[1])来判断开始标跟闭合的标记是否相等。至此,我们就完成了HTML的匹配了!