|
tid=16929& int preg_match_all ( string pattern, string subject, array matches [, int flags] )
1 ~' b8 @% n6 l/ L5 U* E& R0 Y
, J: x' M7 u, m7 a: a; ? 在 subject 中搜索所有與pattern 给出的正規表示式匹配的内容並將结果以 flags 指定的順序放到 matches 中。 搜索到第一个匹配項之后,接下来的搜索從上一個匹配項末尾開始。 flags 可以是下列標記的組合(注意把 PREG_PATTERN_ORDER 和 PREG_SET_ORDER 合起來用没有意義):
1 @2 F: i5 @( GPREG_PATTERN_ORDER對結果排序使 $matches[0] 為全部模式匹配的字串,$matches[1]為第一個括号中的子模式所匹配的字串,以此類推。 - <?php
! k# Y" M( Z: j, Y. a) Y2 m V( K - preg_match_all ("|<[^>]+>(.*)</[^>]+>|U",) ?* g) f+ L4 F& ^& w
- "<b>example: </b><div align=left>this is a test</div>",
; u( {0 ?0 q2 K2 k' d8 Q/ y3 h8 ^ - $out, PREG_PATTERN_ORDER);, W/ j4 J: e' e7 K
- print $out[0][0].", ".$out[0][1]."\n";) ^3 y6 O- H, o5 v- {$ ~1 u1 B
- print $out[1][0].", ".$out[1][1]."\n";9 ?7 O8 C" ~/ t% p
- ?>
複製代碼 4 Z( w i. b3 K# @3 m
本例將输出: - <b>example: </b>, <div align=left>this is a test</div>/ H# E7 A6 b4 t# j1 M7 u1 M
- example: , this is a test
複製代碼
' d* ^( Y6 ?5 P( @. n; z' Q因此,$out[0] 包含匹配整个模式的字串,$out[1] 包含一對HTML 標記之間的字串。
0 r3 r. V( n9 e7 h" q* I5 y1 P- U: \
" f' I/ l7 q% ], ^6 d r
PREG_SET_ORDER对结果排序使 $matches[0] 为第一组匹配项的数组,$matches[1] 为第二组匹配项的数组,以此类推。 - <?php
- R. `/ E3 Z- v! K$ w: {' W - preg_match_all ("|<[^>]+>(.*)</[^>]+>|U",- g, {! h5 I! q% \6 j
- "<b>example: </b><div align=left>this is a test</div>",6 k H' N4 M& s7 @6 V$ }# ?. s
- $out, PREG_SET_ORDER);' v( }8 T6 ?* C+ E
- print $out[0][0].", ".$out[0][1]."\n";
& @" [) ]. f/ d+ W9 D1 G( _ - print $out[1][0].", ".$out[1][1]."\n";- F6 X# B9 s. v: J( Y- C2 q! @7 G
- ?>
複製代碼 z1 [6 R4 I) D2 o6 h, i: C+ r
本例将输出: - <b>example: </b>, example:
, S8 h$ l, P/ q! a- ~' ^ - <div align=left>this is a test</div>, this is a test
* `3 o* y( }8 S( v3 T8 b" N
複製代碼 1 Y0 [. t" y# o7 C: M; e* [4 k' h* A3 {
本例中,$matches[0] 是第一组匹配结果,$matches[0][0] 包含匹配整个模式的文本,$matches[0][1] 包含匹配第一个子模式的文本,以此类推。同样,$matches[1] 是第二组匹配结果,等等。 PREG_OFFSET_CAPTURE如果设定本标记,对每个出现的匹配结果也同时返回其附属的字符串偏移量。注意这改变了返回的数组的值,使其中的每个单元也是一个数组,其中第一项为匹配字符串,第二项为其在 subject 中的偏移量。本标记自 PHP 4.3.0 起可用。 / f c7 x0 d4 ~9 S- v' ]* K
7 p+ _. w1 D4 S: Q如果没有给出标记,则假定为 PREG_PATTERN_ORDER。 返回整个模式匹配的次数(可能为零),如果出错返回 FALSE。
& a2 b3 Z) J) F @7 K例子 1. 从某文本中取得所有的电话号码 - <?php
3 { V8 U0 } ~: i' B0 o; F) l% p - preg_match_all ("/\(? (\d{3})? \)? (?(1) [\-\s] ) \d{3}-\d{4}/x",
2 C* U) R6 [+ {& f5 S - "Call 555-1212 or 1-800-555-1212 FREE", $phones);
1 \# `7 ? S3 M8 A6 K1 }0 `, Z, r - ?>
複製代碼例子 2. 搜索匹配的 HTML 标记(greedy) - <?php
6 H" z9 t. N V6 a - // \\2 是一个逆向引用的例子,其在 PCRE 中的含义是
, @* O$ L$ \. X - // 必须匹配正则表达式本身中第二组括号内的内容,本例中
4 T0 F; K$ V W& q/ m - // 就是 ([\w]+)。因为字符串在双引号中,所以需要8 ^; [! b- ?8 I }/ H
- // 多加一个反斜线。
# N: g3 M' j+ A$ n1 |# H - $html = "<b>bold text</b><a href=howdy.html>click me</a>";+ [3 V3 o5 J+ _2 J Z
* W2 K3 T+ I2 H& ]$ P0 o( z* [- preg_match_all ("/(<([\w]+)[^>]*>)(.*)(<\/\\2>)/", $html, $matches);
( Y! O9 L, y. h- k1 J - 9 e" A3 E6 Q! G4 Y% q
- for ($i=0; $i< count($matches[0]); $i++) {: C# p: u3 R& {: T M
- echo "matched: ".$matches[0][$i]."\n";% w$ l2 ]8 q: m. N( ?
- echo "part 1: ".$matches[1][$i]."\n";
P E L0 v; t - echo "part 2: ".$matches[3][$i]."\n";
6 q$ U: m5 }9 J$ }" B6 [" R - echo "part 3: ".$matches[4][$i]."\n\n";
' E( R7 G) S" N2 d, S. R$ ^1 Q - }
' ?0 P0 L8 c) B/ R2 a - ?>
複製代碼本例将输出: - matched: <b>bold text</b>' C1 z$ J* C, Q e O
- part 1: <b>
+ A' W! x2 ^- J - part 2: bold text5 Q" l" o$ H# W" g; c
- part 3: </b>: ~) _1 W: R( m2 D
, A" [7 S% i5 Y: l/ ?/ o- matched: <a href=howdy.html>click me</a>6 P2 M) K9 H) K* ^/ G: \
- part 1: <a href=howdy.html>. f2 H, `1 l4 M) F8 v
- part 2: click me
, D& ^( K. W8 g n4 L - part 3: </a>
複製代碼
: J& @$ w/ y* o! M2 m
/ a1 ~! u# z0 P$ ~3 F! O" J |