/[pcre]/code/trunk/testdata/testoutput5
ViewVC logotype

Diff of /code/trunk/testdata/testoutput5

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 51 by nigel, Sat Feb 24 21:39:37 2007 UTC revision 226 by ph10, Tue Aug 21 11:46:08 2007 UTC
# Line 1  Line 1 
1  PCRE version 3.4 22-Aug-2000  /\x{100}/8DZ
2    ------------------------------------------------------------------
3  /-- Because of problems with Perl 5.6 in handling UTF-8 vs non UTF-8 --/          Bra
4  /-- strings automatically, do not use the \x{} construct except with --/          \x{100}
5  No match          Ket
6  /-- patterns that have the /8 option set, and don't use them without! --/          End
7  No match  ------------------------------------------------------------------
8    Capturing subpattern count = 0
9    Options: utf8
10    First char = 196
11    Need char = 128
12    
13    /\x{1000}/8DZ
14    ------------------------------------------------------------------
15            Bra
16            \x{1000}
17            Ket
18            End
19    ------------------------------------------------------------------
20    Capturing subpattern count = 0
21    Options: utf8
22    First char = 225
23    Need char = 128
24    
25    /\x{10000}/8DZ
26    ------------------------------------------------------------------
27            Bra
28            \x{10000}
29            Ket
30            End
31    ------------------------------------------------------------------
32    Capturing subpattern count = 0
33    Options: utf8
34    First char = 240
35    Need char = 128
36    
37    /\x{100000}/8DZ
38    ------------------------------------------------------------------
39            Bra
40            \x{100000}
41            Ket
42            End
43    ------------------------------------------------------------------
44    Capturing subpattern count = 0
45    Options: utf8
46    First char = 244
47    Need char = 128
48    
49    /\x{1000000}/8DZ
50    ------------------------------------------------------------------
51            Bra
52            \x{1000000}
53            Ket
54            End
55    ------------------------------------------------------------------
56    Capturing subpattern count = 0
57    Options: utf8
58    First char = 249
59    Need char = 128
60    
61    /\x{4000000}/8DZ
62    ------------------------------------------------------------------
63            Bra
64            \x{4000000}
65            Ket
66            End
67    ------------------------------------------------------------------
68    Capturing subpattern count = 0
69    Options: utf8
70    First char = 252
71    Need char = 128
72    
73    /\x{7fffFFFF}/8DZ
74    ------------------------------------------------------------------
75            Bra
76            \x{7fffffff}
77            Ket
78            End
79    ------------------------------------------------------------------
80    Capturing subpattern count = 0
81    Options: utf8
82    First char = 253
83    Need char = 191
84    
85    /[\x{ff}]/8DZ
86    ------------------------------------------------------------------
87            Bra
88            \x{ff}
89            Ket
90            End
91    ------------------------------------------------------------------
92    Capturing subpattern count = 0
93    Options: utf8
94    First char = 195
95    Need char = 191
96    
97    /[\x{100}]/8DZ
98    ------------------------------------------------------------------
99            Bra
100            [\x{100}]
101            Ket
102            End
103    ------------------------------------------------------------------
104    Capturing subpattern count = 0
105    Options: utf8
106    No first char
107    No need char
108    
109    /\x{ffffffff}/8
110    Failed: character value in \x{...} sequence is too large at offset 11
111    
112    /\x{100000000}/8
113    Failed: character value in \x{...} sequence is too large at offset 12
114    
115    /^\x{100}a\x{1234}/8
116        \x{100}a\x{1234}bcd
117     0: \x{100}a\x{1234}
118    
119    /\x80/8DZ
120    ------------------------------------------------------------------
121            Bra
122            \x{80}
123            Ket
124            End
125    ------------------------------------------------------------------
126    Capturing subpattern count = 0
127    Options: utf8
128    First char = 194
129    Need char = 128
130    
131    /\xff/8DZ
132    ------------------------------------------------------------------
133            Bra
134            \x{ff}
135            Ket
136            End
137    ------------------------------------------------------------------
138    Capturing subpattern count = 0
139    Options: utf8
140    First char = 195
141    Need char = 191
142    
143    /\x{0041}\x{2262}\x{0391}\x{002e}/DZ8
144    ------------------------------------------------------------------
145            Bra
146            A\x{2262}\x{391}.
147            Ket
148            End
149    ------------------------------------------------------------------
150    Capturing subpattern count = 0
151    Options: utf8
152    First char = 'A'
153    Need char = '.'
154        \x{0041}\x{2262}\x{0391}\x{002e}
155     0: A\x{2262}\x{391}.
156    
157    /\x{D55c}\x{ad6d}\x{C5B4}/DZ8
158    ------------------------------------------------------------------
159            Bra
160            \x{d55c}\x{ad6d}\x{c5b4}
161            Ket
162            End
163    ------------------------------------------------------------------
164    Capturing subpattern count = 0
165    Options: utf8
166    First char = 237
167    Need char = 180
168        \x{D55c}\x{ad6d}\x{C5B4}
169     0: \x{d55c}\x{ad6d}\x{c5b4}
170    
171    /\x{65e5}\x{672c}\x{8a9e}/DZ8
172    ------------------------------------------------------------------
173            Bra
174            \x{65e5}\x{672c}\x{8a9e}
175            Ket
176            End
177    ------------------------------------------------------------------
178    Capturing subpattern count = 0
179    Options: utf8
180    First char = 230
181    Need char = 158
182        \x{65e5}\x{672c}\x{8a9e}
183     0: \x{65e5}\x{672c}\x{8a9e}
184    
185    /\x{80}/DZ8
186    ------------------------------------------------------------------
187            Bra
188            \x{80}
189            Ket
190            End
191    ------------------------------------------------------------------
192    Capturing subpattern count = 0
193    Options: utf8
194    First char = 194
195    Need char = 128
196    
197    /\x{084}/DZ8
198    ------------------------------------------------------------------
199            Bra
200            \x{84}
201            Ket
202            End
203    ------------------------------------------------------------------
204    Capturing subpattern count = 0
205    Options: utf8
206    First char = 194
207    Need char = 132
208    
209    /\x{104}/DZ8
210    ------------------------------------------------------------------
211            Bra
212            \x{104}
213            Ket
214            End
215    ------------------------------------------------------------------
216    Capturing subpattern count = 0
217    Options: utf8
218    First char = 196
219    Need char = 132
220    
221    /\x{861}/DZ8
222    ------------------------------------------------------------------
223            Bra
224            \x{861}
225            Ket
226            End
227    ------------------------------------------------------------------
228    Capturing subpattern count = 0
229    Options: utf8
230    First char = 224
231    Need char = 161
232    
233    /\x{212ab}/DZ8
234    ------------------------------------------------------------------
235            Bra
236            \x{212ab}
237            Ket
238            End
239    ------------------------------------------------------------------
240    Capturing subpattern count = 0
241    Options: utf8
242    First char = 240
243    Need char = 171
244    
245    /.{3,5}X/DZ8
246    ------------------------------------------------------------------
247            Bra
248            Any{3}
249            Any{0,2}
250            X
251            Ket
252            End
253    ------------------------------------------------------------------
254    Capturing subpattern count = 0
255    Partial matching not supported
256    Options: utf8
257    No first char
258    Need char = 'X'
259        \x{212ab}\x{212ab}\x{212ab}\x{861}X
260     0: \x{212ab}\x{212ab}\x{212ab}\x{861}X
261    
262    
263    /.{3,5}?/DZ8
264    ------------------------------------------------------------------
265            Bra
266            Any{3}
267            Any{0,2}?
268            Ket
269            End
270    ------------------------------------------------------------------
271    Capturing subpattern count = 0
272    Partial matching not supported
273    Options: utf8
274    No first char
275    No need char
276        \x{212ab}\x{212ab}\x{212ab}\x{861}
277     0: \x{212ab}\x{212ab}\x{212ab}
278    
279    /-- These tests are here rather than in testinput4 because Perl 5.6 has some
280    problems with UTF-8 support, in the area of \x{..} where the value is < 255.
281    It grumbles about invalid UTF-8 strings. --/
282    
283    /^[a\x{c0}]b/8
284        \x{c0}b
285     0: \x{c0}b
286    
287    /^([a\x{c0}]*?)aa/8
288        a\x{c0}aaaa/
289     0: a\x{c0}aa
290     1: a\x{c0}
291    
292    /^([a\x{c0}]*?)aa/8
293        a\x{c0}aaaa/
294     0: a\x{c0}aa
295     1: a\x{c0}
296        a\x{c0}a\x{c0}aaa/
297     0: a\x{c0}a\x{c0}aa
298     1: a\x{c0}a\x{c0}
299    
300    /^([a\x{c0}]*)aa/8
301        a\x{c0}aaaa/
302     0: a\x{c0}aaaa
303     1: a\x{c0}aa
304        a\x{c0}a\x{c0}aaa/
305     0: a\x{c0}a\x{c0}aaa
306     1: a\x{c0}a\x{c0}a
307    
308    /^([a\x{c0}]*)a\x{c0}/8
309        a\x{c0}aaaa/
310     0: a\x{c0}
311     1:
312        a\x{c0}a\x{c0}aaa/
313     0: a\x{c0}a\x{c0}
314     1: a\x{c0}
315    
316    /-- --/
317    
318    /(?<=\C)X/8
319    Failed: \C not allowed in lookbehind assertion at offset 6
320    
321  /a.b/8  /-- This one is here not because it's different to Perl, but because the way
322      acb  the captured single-byte is displayed. (In Perl it becomes a character, and you
323   0: acb  can't tell the difference.) --/
324      a\x7fb  
325   0: a\x{7f}b  /X(\C)(.*)/8
326      a\x{100}b      X\x{1234}
327   0: a\x{100}b   0: X\x{1234}
328     1: \xe1
329     2: \x88\xb4
330        X\nabc
331     0: X\x{0a}abc
332     1: \x{0a}
333     2: abc
334    
335    /^[ab]/8DZ
336    ------------------------------------------------------------------
337            Bra
338            ^
339            [ab]
340            Ket
341            End
342    ------------------------------------------------------------------
343    Capturing subpattern count = 0
344    Options: anchored utf8
345    No first char
346    No need char
347        bar
348     0: b
349      *** Failers      *** Failers
350  No match  No match
351      a\nb      c
 No match  
   
 /a(.{3})b/8  
     a\x{4000}xyb  
  0: a\x{4000}xyb  
  1: \x{4000}xy  
     a\x{4000}\x7fyb  
  0: a\x{4000}\x{7f}yb  
  1: \x{4000}\x{7f}y  
     a\x{4000}\x{100}yb  
  0: a\x{4000}\x{100}yb  
  1: \x{4000}\x{100}y  
     *** Failers  
352  No match  No match
353      a\x{4000}b      \x{ff}
354  No match  No match
355      ac\ncb      \x{100}
356  No match  No match
357    
358  /a(.*?)(.)/  /^[^ab]/8DZ
359      a\xc0\x88b  ------------------------------------------------------------------
360   0: a\xc0          Bra
361   1:          ^
362   2: \xc0          [\x00-`c-\xff] (neg)
363            Ket
364  /a(.*?)(.)/8          End
365      a\x{100}b  ------------------------------------------------------------------
366   0: a\x{100}  Capturing subpattern count = 0
367   1:  Contains explicit CR or LF match
368   2: \x{100}  Options: anchored utf8
369    No first char
370  /a(.*)(.)/  No need char
371      a\xc0\x88b      c
372   0: a\xc0\x88b   0: c
373   1: \xc0\x88      \x{ff}
374   2: b   0: \x{ff}
375        \x{100}
376  /a(.*)(.)/8   0: \x{100}
377      a\x{100}b      *** Failers
378   0: a\x{100}b   0: *
379   1: \x{100}      aaa
  2: b  
   
 /a(.)(.)/  
     a\xc0\x92bcd  
  0: a\xc0\x92  
  1: \xc0  
  2: \x92  
   
 /a(.)(.)/8  
     a\x{240}bcd  
  0: a\x{240}b  
  1: \x{240}  
  2: b  
   
 /a(.?)(.)/  
     a\xc0\x92bcd  
  0: a\xc0\x92  
  1: \xc0  
  2: \x92  
   
 /a(.?)(.)/8  
     a\x{240}bcd  
  0: a\x{240}b  
  1: \x{240}  
  2: b  
   
 /a(.??)(.)/  
     a\xc0\x92bcd  
  0: a\xc0  
  1:  
  2: \xc0  
   
 /a(.??)(.)/8  
     a\x{240}bcd  
  0: a\x{240}  
  1:  
  2: \x{240}  
   
 /a(.{3})b/8  
     a\x{1234}xyb  
  0: a\x{1234}xyb  
  1: \x{1234}xy  
     a\x{1234}\x{4321}yb  
  0: a\x{1234}\x{4321}yb  
  1: \x{1234}\x{4321}y  
     a\x{1234}\x{4321}\x{3412}b  
  0: a\x{1234}\x{4321}\x{3412}b  
  1: \x{1234}\x{4321}\x{3412}  
     *** Failers  
380  No match  No match
381      a\x{1234}b  
382    /[^ab\xC0-\xF0]/8SDZ
383    ------------------------------------------------------------------
384            Bra
385            [\x00-`c-\xbf\xf1-\xff] (neg)
386            Ket
387            End
388    ------------------------------------------------------------------
389    Capturing subpattern count = 0
390    Contains explicit CR or LF match
391    Options: utf8
392    No first char
393    No need char
394    Starting byte set: \x00 \x01 \x02 \x03 \x04 \x05 \x06 \x07 \x08 \x09 \x0a
395      \x0b \x0c \x0d \x0e \x0f \x10 \x11 \x12 \x13 \x14 \x15 \x16 \x17 \x18 \x19
396      \x1a \x1b \x1c \x1d \x1e \x1f \x20 ! " # $ % & ' ( ) * + , - . / 0 1 2 3 4
397      5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y
398      Z [ \ ] ^ _ ` c d e f g h i j k l m n o p q r s t u v w x y z { | } ~ \x7f
399      \xc2 \xc3 \xc4 \xc5 \xc6 \xc7 \xc8 \xc9 \xca \xcb \xcc \xcd \xce \xcf \xd0
400      \xd1 \xd2 \xd3 \xd4 \xd5 \xd6 \xd7 \xd8 \xd9 \xda \xdb \xdc \xdd \xde \xdf
401      \xe0 \xe1 \xe2 \xe3 \xe4 \xe5 \xe6 \xe7 \xe8 \xe9 \xea \xeb \xec \xed \xee
402      \xef \xf0 \xf1 \xf2 \xf3 \xf4 \xf5 \xf6 \xf7 \xf8 \xf9 \xfa \xfb \xfc \xfd
403      \xfe \xff
404        \x{f1}
405     0: \x{f1}
406        \x{bf}
407     0: \x{bf}
408        \x{100}
409     0: \x{100}
410        \x{1000}
411     0: \x{1000}
412        *** Failers
413     0: *
414        \x{c0}
415  No match  No match
416      ac\ncb      \x{f0}
417  No match  No match
418    
419  /a(.{3,})b/8  /Ā{3,4}/8SDZ
420      a\x{1234}xyb  ------------------------------------------------------------------
421   0: a\x{1234}xyb          Bra
422   1: \x{1234}xy          \x{100}{3}
423      a\x{1234}\x{4321}yb          \x{100}?
424   0: a\x{1234}\x{4321}yb          Ket
425   1: \x{1234}\x{4321}y          End
426      a\x{1234}\x{4321}\x{3412}b  ------------------------------------------------------------------
427   0: a\x{1234}\x{4321}\x{3412}b  Capturing subpattern count = 0
428   1: \x{1234}\x{4321}\x{3412}  Partial matching not supported
429      axxxxbcdefghijb  Options: utf8
430   0: axxxxbcdefghijb  First char = 196
431   1: xxxxbcdefghij  Need char = 128
432      a\x{1234}\x{4321}\x{3412}\x{3421}b  Study returned NULL
433   0: a\x{1234}\x{4321}\x{3412}\x{3421}b    \x{100}\x{100}\x{100}\x{100\x{100}
434   1: \x{1234}\x{4321}\x{3412}\x{3421}   0: \x{100}\x{100}\x{100}
435      *** Failers  
436    /(\x{100}+|x)/8SDZ
437    ------------------------------------------------------------------
438            Bra
439            CBra 1
440            \x{100}+
441            Alt
442            x
443            Ket
444            Ket
445            End
446    ------------------------------------------------------------------
447    Capturing subpattern count = 1
448    Partial matching not supported
449    Options: utf8
450    No first char
451    No need char
452    Starting byte set: x \xc4
453    
454    /(\x{100}*a|x)/8SDZ
455    ------------------------------------------------------------------
456            Bra
457            CBra 1
458            \x{100}*+
459            a
460            Alt
461            x
462            Ket
463            Ket
464            End
465    ------------------------------------------------------------------
466    Capturing subpattern count = 1
467    Partial matching not supported
468    Options: utf8
469    No first char
470    No need char
471    Starting byte set: a x \xc4
472    
473    /(\x{100}{0,2}a|x)/8SDZ
474    ------------------------------------------------------------------
475            Bra
476            CBra 1
477            \x{100}{0,2}
478            a
479            Alt
480            x
481            Ket
482            Ket
483            End
484    ------------------------------------------------------------------
485    Capturing subpattern count = 1
486    Partial matching not supported
487    Options: utf8
488    No first char
489    No need char
490    Starting byte set: a x \xc4
491    
492    /(\x{100}{1,2}a|x)/8SDZ
493    ------------------------------------------------------------------
494            Bra
495            CBra 1
496            \x{100}
497            \x{100}{0,1}
498            a
499            Alt
500            x
501            Ket
502            Ket
503            End
504    ------------------------------------------------------------------
505    Capturing subpattern count = 1
506    Partial matching not supported
507    Options: utf8
508    No first char
509    No need char
510    Starting byte set: x \xc4
511    
512    /\x{100}*(\d+|"(?1)")/8
513        1234
514     0: 1234
515     1: 1234
516        "1234"
517     0: "1234"
518     1: "1234"
519        \x{100}1234
520     0: \x{100}1234
521     1: 1234
522        "\x{100}1234"
523     0: \x{100}1234
524     1: 1234
525        \x{100}\x{100}12ab
526     0: \x{100}\x{100}12
527     1: 12
528        \x{100}\x{100}"12"
529     0: \x{100}\x{100}"12"
530     1: "12"
531        *** Failers
532  No match  No match
533      a\x{1234}b      \x{100}\x{100}abcd
534  No match  No match
535    
536  /a(.{3,}?)b/8  /\x{100}/8DZ
537      a\x{1234}xyb  ------------------------------------------------------------------
538   0: a\x{1234}xyb          Bra
539   1: \x{1234}xy          \x{100}
540      a\x{1234}\x{4321}yb          Ket
541   0: a\x{1234}\x{4321}yb          End
542   1: \x{1234}\x{4321}y  ------------------------------------------------------------------
543      a\x{1234}\x{4321}\x{3412}b  Capturing subpattern count = 0
544   0: a\x{1234}\x{4321}\x{3412}b  Options: utf8
545   1: \x{1234}\x{4321}\x{3412}  First char = 196
546      axxxxbcdefghijb  Need char = 128
547   0: axxxxb  
548   1: xxxx  /\x{100}*/8DZ
549      a\x{1234}\x{4321}\x{3412}\x{3421}b  ------------------------------------------------------------------
550   0: a\x{1234}\x{4321}\x{3412}\x{3421}b          Bra
551   1: \x{1234}\x{4321}\x{3412}\x{3421}          \x{100}*
552      *** Failers          Ket
553            End
554    ------------------------------------------------------------------
555    Capturing subpattern count = 0
556    Partial matching not supported
557    Options: utf8
558    No first char
559    No need char
560    
561    /a\x{100}*/8DZ
562    ------------------------------------------------------------------
563            Bra
564            a
565            \x{100}*
566            Ket
567            End
568    ------------------------------------------------------------------
569    Capturing subpattern count = 0
570    Partial matching not supported
571    Options: utf8
572    First char = 'a'
573    No need char
574    
575    /ab\x{100}*/8DZ
576    ------------------------------------------------------------------
577            Bra
578            ab
579            \x{100}*
580            Ket
581            End
582    ------------------------------------------------------------------
583    Capturing subpattern count = 0
584    Partial matching not supported
585    Options: utf8
586    First char = 'a'
587    Need char = 'b'
588    
589    /a\x{100}\x{101}*/8DZ
590    ------------------------------------------------------------------
591            Bra
592            a\x{100}
593            \x{101}*
594            Ket
595            End
596    ------------------------------------------------------------------
597    Capturing subpattern count = 0
598    Partial matching not supported
599    Options: utf8
600    First char = 'a'
601    Need char = 128
602    
603    /a\x{100}\x{101}+/8DZ
604    ------------------------------------------------------------------
605            Bra
606            a\x{100}
607            \x{101}+
608            Ket
609            End
610    ------------------------------------------------------------------
611    Capturing subpattern count = 0
612    Partial matching not supported
613    Options: utf8
614    First char = 'a'
615    Need char = 129
616    
617    /\x{100}*A/8DZ
618    ------------------------------------------------------------------
619            Bra
620            \x{100}*+
621            A
622            Ket
623            End
624    ------------------------------------------------------------------
625    Capturing subpattern count = 0
626    Partial matching not supported
627    Options: utf8
628    No first char
629    Need char = 'A'
630        A
631     0: A
632    
633    /\x{100}*\d(?R)/8DZ
634    ------------------------------------------------------------------
635            Bra
636            \x{100}*+
637            \d
638            Once
639            Recurse
640            Ket
641            Ket
642            End
643    ------------------------------------------------------------------
644    Capturing subpattern count = 0
645    Partial matching not supported
646    Options: utf8
647    No first char
648    No need char
649    
650    /[^\x{c4}]/DZ
651    ------------------------------------------------------------------
652            Bra
653            [^\xc4]
654            Ket
655            End
656    ------------------------------------------------------------------
657    Capturing subpattern count = 0
658    Contains explicit CR or LF match
659    No options
660    No first char
661    No need char
662    
663    /[^\x{c4}]/8DZ
664    ------------------------------------------------------------------
665            Bra
666            [\x00-\xc3\xc5-\xff] (neg)
667            Ket
668            End
669    ------------------------------------------------------------------
670    Capturing subpattern count = 0
671    Contains explicit CR or LF match
672    Options: utf8
673    No first char
674    No need char
675    
676    /[\x{100}]/8DZ
677    ------------------------------------------------------------------
678            Bra
679            [\x{100}]
680            Ket
681            End
682    ------------------------------------------------------------------
683    Capturing subpattern count = 0
684    Options: utf8
685    No first char
686    No need char
687        \x{100}
688     0: \x{100}
689        Z\x{100}
690     0: \x{100}
691        \x{100}Z
692     0: \x{100}
693        *** Failers
694  No match  No match
695      a\x{1234}b  
696    /[Z\x{100}]/8DZ
697    ------------------------------------------------------------------
698            Bra
699            [Z\x{100}]
700            Ket
701            End
702    ------------------------------------------------------------------
703    Capturing subpattern count = 0
704    Options: utf8
705    No first char
706    No need char
707        Z\x{100}
708     0: Z
709        \x{100}
710     0: \x{100}
711        \x{100}Z
712     0: \x{100}
713        *** Failers
714  No match  No match
715    
716  /a(.{3,5})b/8  /[\x{200}-\x{100}]/8
717      a\x{1234}xyb  Failed: range out of order in character class at offset 15
718   0: a\x{1234}xyb  
719   1: \x{1234}xy  /[Ā-Ą]/8
720      a\x{1234}\x{4321}yb      \x{100}
721   0: a\x{1234}\x{4321}yb   0: \x{100}
722   1: \x{1234}\x{4321}y      \x{104}
723      a\x{1234}\x{4321}\x{3412}b   0: \x{104}
  0: a\x{1234}\x{4321}\x{3412}b  
  1: \x{1234}\x{4321}\x{3412}  
     axxxxbcdefghijb  
  0: axxxxb  
  1: xxxx  
     a\x{1234}\x{4321}\x{3412}\x{3421}b  
  0: a\x{1234}\x{4321}\x{3412}\x{3421}b  
  1: \x{1234}\x{4321}\x{3412}\x{3421}  
     axbxxbcdefghijb  
  0: axbxxb  
  1: xbxx  
     axxxxxbcdefghijb  
  0: axxxxxb  
  1: xxxxx  
724      *** Failers      *** Failers
725  No match  No match
726      a\x{1234}b      \x{105}
727  No match  No match
728      axxxxxxbcdefghijb      \x{ff}
729  No match  No match
730    
731  /a(.{3,5}?)b/8  /[z-\x{100}]/8DZ
732      a\x{1234}xyb  ------------------------------------------------------------------
733   0: a\x{1234}xyb          Bra
734   1: \x{1234}xy          [z-\x{100}]
735      a\x{1234}\x{4321}yb          Ket
736   0: a\x{1234}\x{4321}yb          End
737   1: \x{1234}\x{4321}y  ------------------------------------------------------------------
738      a\x{1234}\x{4321}\x{3412}b  Capturing subpattern count = 0
739   0: a\x{1234}\x{4321}\x{3412}b  Options: utf8
740   1: \x{1234}\x{4321}\x{3412}  No first char
741      axxxxbcdefghijb  No need char
742   0: axxxxb  
743   1: xxxx  /[z\Qa-d]Ā\E]/8DZ
744      a\x{1234}\x{4321}\x{3412}\x{3421}b  ------------------------------------------------------------------
745   0: a\x{1234}\x{4321}\x{3412}\x{3421}b          Bra
746   1: \x{1234}\x{4321}\x{3412}\x{3421}          [\-\]adz\x{100}]
747      axbxxbcdefghijb          Ket
748   0: axbxxb          End
749   1: xbxx  ------------------------------------------------------------------
750      axxxxxbcdefghijb  Capturing subpattern count = 0
751   0: axxxxxb  Options: utf8
752   1: xxxxx  No first char
753      *** Failers  No need char
754  No match      \x{100}
755      a\x{1234}b   0: \x{100}
756        Ā
757     0: \x{100}
758    
759    /[\xFF]/DZ
760    ------------------------------------------------------------------
761            Bra
762            \xff
763            Ket
764            End
765    ------------------------------------------------------------------
766    Capturing subpattern count = 0
767    No options
768    First char = 255
769    No need char
770        >\xff<
771     0: \xff
772    
773    /[\xff]/DZ8
774    ------------------------------------------------------------------
775            Bra
776            \x{ff}
777            Ket
778            End
779    ------------------------------------------------------------------
780    Capturing subpattern count = 0
781    Options: utf8
782    First char = 195
783    Need char = 191
784        >\x{ff}<
785     0: \x{ff}
786    
787    /[^\xFF]/DZ
788    ------------------------------------------------------------------
789            Bra
790            [^\xff]
791            Ket
792            End
793    ------------------------------------------------------------------
794    Capturing subpattern count = 0
795    Contains explicit CR or LF match
796    No options
797    No first char
798    No need char
799    
800    /[^\xff]/8DZ
801    ------------------------------------------------------------------
802            Bra
803            [\x00-\xfe] (neg)
804            Ket
805            End
806    ------------------------------------------------------------------
807    Capturing subpattern count = 0
808    Contains explicit CR or LF match
809    Options: utf8
810    No first char
811    No need char
812    
813    /[Ä-Ü]/8
814        Ö # Matches without Study
815     0: \x{d6}
816        \x{d6}
817     0: \x{d6}
818    
819    /[Ä-Ü]/8S
820        Ö <-- Same with Study
821     0: \x{d6}
822        \x{d6}
823     0: \x{d6}
824    
825    /[\x{c4}-\x{dc}]/8
826        Ö # Matches without Study
827     0: \x{d6}
828        \x{d6}
829     0: \x{d6}
830    
831    /[\x{c4}-\x{dc}]/8S
832        Ö <-- Same with Study
833     0: \x{d6}
834        \x{d6}
835     0: \x{d6}
836    
837    /[]/8
838    Failed: invalid UTF-8 string at offset 2
839    
840    //8
841    Failed: invalid UTF-8 string at offset 0
842    
843    /xxx/8
844    Failed: invalid UTF-8 string at offset 1
845    
846    /xxx/8?DZ
847    ------------------------------------------------------------------
848            Bra
849            \X{c0}\X{c0}\X{c0}xxx
850            Ket
851            End
852    ------------------------------------------------------------------
853    Capturing subpattern count = 0
854    Options: utf8 no_utf8_check
855    First char = 195
856    Need char = 'x'
857    
858    /abc/8
859        ]
860    Error -10
861        
862    Error -10
863        
864    Error -10
865        \?
866    No match
867    
868    /anything/8
869        \xc0\x80
870    Error -10
871        \xc1\x8f
872    Error -10
873        \xe0\x9f\x80
874    Error -10
875        \xf0\x8f\x80\x80
876    Error -10
877        \xf8\x87\x80\x80\x80
878    Error -10
879        \xfc\x83\x80\x80\x80\x80
880    Error -10
881        \xfe\x80\x80\x80\x80\x80
882    Error -10
883        \xff\x80\x80\x80\x80\x80
884    Error -10
885        \xc3\x8f
886    No match
887        \xe0\xaf\x80
888    No match
889        \xe1\x80\x80
890    No match
891        \xf0\x9f\x80\x80
892    No match
893        \xf1\x8f\x80\x80
894    No match
895        \xf8\x88\x80\x80\x80
896    Error -10
897        \xf9\x87\x80\x80\x80
898    Error -10
899        \xfc\x84\x80\x80\x80\x80
900    Error -10
901        \xfd\x83\x80\x80\x80\x80
902    Error -10
903        \?\xf8\x88\x80\x80\x80
904    No match
905        \?\xf9\x87\x80\x80\x80
906    No match
907        \?\xfc\x84\x80\x80\x80\x80
908    No match
909        \?\xfd\x83\x80\x80\x80\x80
910    No match
911    
912    /\x{100}abc(xyz(?1))/8DZ
913    ------------------------------------------------------------------
914            Bra
915            \x{100}abc
916            CBra 1
917            xyz
918            Once
919            Recurse
920            Ket
921            Ket
922            Ket
923            End
924    ------------------------------------------------------------------
925    Capturing subpattern count = 1
926    Options: utf8
927    First char = 196
928    Need char = 'z'
929    
930    /[^\x{100}]abc(xyz(?1))/8DZ
931    ------------------------------------------------------------------
932            Bra
933            [^\x{100}]
934            abc
935            CBra 1
936            xyz
937            Once
938            Recurse
939            Ket
940            Ket
941            Ket
942            End
943    ------------------------------------------------------------------
944    Capturing subpattern count = 1
945    Contains explicit CR or LF match
946    Options: utf8
947    No first char
948    Need char = 'z'
949    
950    /[ab\x{100}]abc(xyz(?1))/8DZ
951    ------------------------------------------------------------------
952            Bra
953            [ab\x{100}]
954            abc
955            CBra 1
956            xyz
957            Once
958            Recurse
959            Ket
960            Ket
961            Ket
962            End
963    ------------------------------------------------------------------
964    Capturing subpattern count = 1
965    Options: utf8
966    No first char
967    Need char = 'z'
968    
969    /(\x{100}(b(?2)c))?/DZ8
970    ------------------------------------------------------------------
971            Bra
972            Brazero
973            CBra 1
974            \x{100}
975            CBra 2
976            b
977            Once
978            Recurse
979            Ket
980            c
981            Ket
982            Ket
983            Ket
984            End
985    ------------------------------------------------------------------
986    Capturing subpattern count = 2
987    Options: utf8
988    No first char
989    No need char
990    
991    /(\x{100}(b(?2)c)){0,2}/DZ8
992    ------------------------------------------------------------------
993            Bra
994            Brazero
995            Bra
996            CBra 1
997            \x{100}
998            CBra 2
999            b
1000            Once
1001            Recurse
1002            Ket
1003            c
1004            Ket
1005            Ket
1006            Brazero
1007            CBra 1
1008            \x{100}
1009            CBra 2
1010            b
1011            Once
1012            Recurse
1013            Ket
1014            c
1015            Ket
1016            Ket
1017            Ket
1018            Ket
1019            End
1020    ------------------------------------------------------------------
1021    Capturing subpattern count = 2
1022    Options: utf8
1023    No first char
1024    No need char
1025    
1026    /(\x{100}(b(?1)c))?/DZ8
1027    ------------------------------------------------------------------
1028            Bra
1029            Brazero
1030            CBra 1
1031            \x{100}
1032            CBra 2
1033            b
1034            Once
1035            Recurse
1036            Ket
1037            c
1038            Ket
1039            Ket
1040            Ket
1041            End
1042    ------------------------------------------------------------------
1043    Capturing subpattern count = 2
1044    Options: utf8
1045    No first char
1046    No need char
1047    
1048    /(\x{100}(b(?1)c)){0,2}/DZ8
1049    ------------------------------------------------------------------
1050            Bra
1051            Brazero
1052            Bra
1053            CBra 1
1054            \x{100}
1055            CBra 2
1056            b
1057            Once
1058            Recurse
1059            Ket
1060            c
1061            Ket
1062            Ket
1063            Brazero
1064            CBra 1
1065            \x{100}
1066            CBra 2
1067            b
1068            Once
1069            Recurse
1070            Ket
1071            c
1072            Ket
1073            Ket
1074            Ket
1075            Ket
1076            End
1077    ------------------------------------------------------------------
1078    Capturing subpattern count = 2
1079    Options: utf8
1080    No first char
1081    No need char
1082    
1083    /\W/8
1084        A.B
1085     0: .
1086        A\x{100}B
1087     0: \x{100}
1088    
1089    /\w/8
1090        \x{100}X
1091     0: X
1092    
1093    /a\x{1234}b/P8
1094        a\x{1234}b
1095     0: a\x{1234}b
1096    
1097    /^\ሴ/8DZ
1098    ------------------------------------------------------------------
1099            Bra
1100            ^
1101            \x{1234}
1102            Ket
1103            End
1104    ------------------------------------------------------------------
1105    Capturing subpattern count = 0
1106    Options: anchored utf8
1107    No first char
1108    No need char
1109    
1110    /\777/I
1111    Failed: octal value is greater than \377 (not in UTF-8 mode) at offset 3
1112    
1113    /\777/8I
1114    Capturing subpattern count = 0
1115    Options: utf8
1116    First char = 199
1117    Need char = 191
1118      \x{1ff}
1119     0: \x{1ff}
1120      \777
1121     0: \x{1ff}
1122    
1123    /\x{100}*\d/8DZ
1124    ------------------------------------------------------------------
1125            Bra
1126            \x{100}*+
1127            \d
1128            Ket
1129            End
1130    ------------------------------------------------------------------
1131    Capturing subpattern count = 0
1132    Partial matching not supported
1133    Options: utf8
1134    No first char
1135    No need char
1136    
1137    /\x{100}*\s/8DZ
1138    ------------------------------------------------------------------
1139            Bra
1140            \x{100}*+
1141            \s
1142            Ket
1143            End
1144    ------------------------------------------------------------------
1145    Capturing subpattern count = 0
1146    Partial matching not supported
1147    Options: utf8
1148    No first char
1149    No need char
1150    
1151    /\x{100}*\w/8DZ
1152    ------------------------------------------------------------------
1153            Bra
1154            \x{100}*+
1155            \w
1156            Ket
1157            End
1158    ------------------------------------------------------------------
1159    Capturing subpattern count = 0
1160    Partial matching not supported
1161    Options: utf8
1162    No first char
1163    No need char
1164    
1165    /\x{100}*\D/8DZ
1166    ------------------------------------------------------------------
1167            Bra
1168            \x{100}*
1169            \D
1170            Ket
1171            End
1172    ------------------------------------------------------------------
1173    Capturing subpattern count = 0
1174    Partial matching not supported
1175    Options: utf8
1176    No first char
1177    No need char
1178    
1179    /\x{100}*\S/8DZ
1180    ------------------------------------------------------------------
1181            Bra
1182            \x{100}*
1183            \S
1184            Ket
1185            End
1186    ------------------------------------------------------------------
1187    Capturing subpattern count = 0
1188    Partial matching not supported
1189    Options: utf8
1190    No first char
1191    No need char
1192    
1193    /\x{100}*\W/8DZ
1194    ------------------------------------------------------------------
1195            Bra
1196            \x{100}*
1197            \W
1198            Ket
1199            End
1200    ------------------------------------------------------------------
1201    Capturing subpattern count = 0
1202    Partial matching not supported
1203    Options: utf8
1204    No first char
1205    No need char
1206    
1207    /\x{100}+\x{200}/8DZ
1208    ------------------------------------------------------------------
1209            Bra
1210            \x{100}++
1211            \x{200}
1212            Ket
1213            End
1214    ------------------------------------------------------------------
1215    Capturing subpattern count = 0
1216    Partial matching not supported
1217    Options: utf8
1218    First char = 196
1219    Need char = 128
1220    
1221    /\x{100}+X/8DZ
1222    ------------------------------------------------------------------
1223            Bra
1224            \x{100}++
1225            X
1226            Ket
1227            End
1228    ------------------------------------------------------------------
1229    Capturing subpattern count = 0
1230    Partial matching not supported
1231    Options: utf8
1232    First char = 196
1233    Need char = 'X'
1234    
1235    /X+\x{200}/8DZ
1236    ------------------------------------------------------------------
1237            Bra
1238            X++
1239            \x{200}
1240            Ket
1241            End
1242    ------------------------------------------------------------------
1243    Capturing subpattern count = 0
1244    Partial matching not supported
1245    Options: utf8
1246    First char = 'X'
1247    Need char = 128
1248    
1249    /()()()()()()()()()()
1250     ()()()()()()()()()()
1251     ()()()()()()()()()()
1252     ()()()()()()()()()()
1253     A (x) (?41) B/8x
1254        AxxB
1255    Matched, but too many substrings
1256     0: AxxB
1257     1:
1258     2:
1259     3:
1260     4:
1261     5:
1262     6:
1263     7:
1264     8:
1265     9:
1266    10:
1267    11:
1268    12:
1269    13:
1270    14:
1271    
1272    /^[\x{100}\E-\Q\E\x{150}]/BZ8
1273    ------------------------------------------------------------------
1274            Bra
1275            ^
1276            [\x{100}-\x{150}]
1277            Ket
1278            End
1279    ------------------------------------------------------------------
1280    
1281    /^[\QĀ\E-\QŐ\E]/BZ8
1282    ------------------------------------------------------------------
1283            Bra
1284            ^
1285            [\x{100}-\x{150}]
1286            Ket
1287            End
1288    ------------------------------------------------------------------
1289    
1290    /^[\QĀ\E-\QŐ\E/BZ8
1291    Failed: missing terminating ] for character class at offset 15
1292    
1293    /^abc./mgx8<any>
1294        abc1 \x0aabc2 \x0babc3xx \x0cabc4 \x0dabc5xx \x0d\x0aabc6 \x{0085}abc7 \x{2028}abc8 \x{2029}abc9 JUNK
1295     0: abc1
1296     0: abc2
1297     0: abc3
1298     0: abc4
1299     0: abc5
1300     0: abc6
1301     0: abc7
1302     0: abc8
1303     0: abc9
1304    
1305    /abc.$/mgx8<any>
1306        abc1\x0a abc2\x0b abc3\x0c abc4\x0d abc5\x0d\x0a abc6\x{0085} abc7\x{2028} abc8\x{2029} abc9
1307     0: abc1
1308     0: abc2
1309     0: abc3
1310     0: abc4
1311     0: abc5
1312     0: abc6
1313     0: abc7
1314     0: abc8
1315     0: abc9
1316    
1317    /^a\Rb/8
1318        a\nb
1319     0: a\x{0a}b
1320        a\rb
1321     0: a\x{0d}b
1322        a\r\nb
1323     0: a\x{0d}\x{0a}b
1324        a\x0bb
1325     0: a\x{0b}b
1326        a\x0cb
1327     0: a\x{0c}b
1328        a\x{85}b
1329     0: a\x{85}b
1330        a\x{2028}b
1331     0: a\x{2028}b
1332        a\x{2029}b
1333     0: a\x{2029}b
1334        ** Failers
1335    No match
1336        a\n\rb
1337    No match
1338    
1339    /^a\R*b/8
1340        ab
1341     0: ab
1342        a\nb
1343     0: a\x{0a}b
1344        a\rb
1345     0: a\x{0d}b
1346        a\r\nb
1347     0: a\x{0d}\x{0a}b
1348        a\x0bb
1349     0: a\x{0b}b
1350        a\x0c\x{2028}\x{2029}b
1351     0: a\x{0c}\x{2028}\x{2029}b
1352        a\x{85}b
1353     0: a\x{85}b
1354        a\n\rb
1355     0: a\x{0a}\x{0d}b
1356        a\n\r\x{85}\x0cb
1357     0: a\x{0a}\x{0d}\x{85}\x{0c}b
1358    
1359    /^a\R+b/8
1360        a\nb
1361     0: a\x{0a}b
1362        a\rb
1363     0: a\x{0d}b
1364        a\r\nb
1365     0: a\x{0d}\x{0a}b
1366        a\x0bb
1367     0: a\x{0b}b
1368        a\x0c\x{2028}\x{2029}b
1369     0: a\x{0c}\x{2028}\x{2029}b
1370        a\x{85}b
1371     0: a\x{85}b
1372        a\n\rb
1373     0: a\x{0a}\x{0d}b
1374        a\n\r\x{85}\x0cb
1375     0: a\x{0a}\x{0d}\x{85}\x{0c}b
1376        ** Failers
1377    No match
1378        ab
1379    No match
1380    
1381    /^a\R{1,3}b/8
1382        a\nb
1383     0: a\x{0a}b
1384        a\n\rb
1385     0: a\x{0a}\x{0d}b
1386        a\n\r\x{85}b
1387     0: a\x{0a}\x{0d}\x{85}b
1388        a\r\n\r\nb
1389     0: a\x{0d}\x{0a}\x{0d}\x{0a}b
1390        a\r\n\r\n\r\nb
1391     0: a\x{0d}\x{0a}\x{0d}\x{0a}\x{0d}\x{0a}b
1392        a\n\r\n\rb
1393     0: a\x{0a}\x{0d}\x{0a}\x{0d}b
1394        a\n\n\r\nb
1395     0: a\x{0a}\x{0a}\x{0d}\x{0a}b
1396        ** Failers
1397    No match
1398        a\n\n\n\rb
1399    No match
1400        a\r
1401    No match
1402    
1403    /\H\h\V\v/8
1404        X X\x0a
1405     0: X X\x{0a}
1406        X\x09X\x0b
1407     0: X\x{09}X\x{0b}
1408        ** Failers
1409  No match  No match
1410      axxxxxxbcdefghijb      \x{a0} X\x0a
1411  No match  No match
1412    
1413  /^[a\x{c0}]/8  /\H*\h+\V?\v{3,4}/8
1414      *** Failers      \x09\x20\x{a0}X\x0a\x0b\x0c\x0d\x0a
1415     0: \x{09} \x{a0}X\x{0a}\x{0b}\x{0c}\x{0d}
1416        \x09\x20\x{a0}\x0a\x0b\x0c\x0d\x0a
1417     0: \x{09} \x{a0}\x{0a}\x{0b}\x{0c}\x{0d}
1418        \x09\x20\x{a0}\x0a\x0b\x0c
1419     0: \x{09} \x{a0}\x{0a}\x{0b}\x{0c}
1420        ** Failers
1421    No match
1422        \x09\x20\x{a0}\x0a\x0b
1423    No match
1424    
1425    /\H\h\V\v/8
1426        \x{3001}\x{3000}\x{2030}\x{2028}
1427     0: \x{3001}\x{3000}\x{2030}\x{2028}
1428        X\x{180e}X\x{85}
1429     0: X\x{180e}X\x{85}
1430        ** Failers
1431  No match  No match
1432      \x{100}      \x{2009} X\x0a
1433  No match  No match
1434    
1435  /(?<=aXb)cd/8  /\H*\h+\V?\v{3,4}/8
1436      aXbcd      \x{1680}\x{180e}\x{2007}X\x{2028}\x{2029}\x0c\x0d\x0a
1437   0: cd   0: \x{1680}\x{180e}\x{2007}X\x{2028}\x{2029}\x{0c}\x{0d}
1438        \x09\x{205f}\x{a0}\x0a\x{2029}\x0c\x{2028}\x0a
1439  /(?<=a\x{100}b)cd/8   0: \x{09}\x{205f}\x{a0}\x{0a}\x{2029}\x{0c}\x{2028}
1440      a\x{100}bcd      \x09\x20\x{202f}\x0a\x0b\x0c
1441   0: cd   0: \x{09} \x{202f}\x{0a}\x{0b}\x{0c}
1442        ** Failers
1443  /(?<=a\x{100000}b)cd/8  No match
1444      a\x{100000}bcd      \x09\x{200a}\x{a0}\x{2028}\x0b
1445   0: cd  No match
1446    
1447  /(?:\x{100}){3}b/8  /[\h]/8BZ
1448      \x{100}\x{100}\x{100}b  ------------------------------------------------------------------
1449   0: \x{100}\x{100}\x{100}b          Bra
1450      *** Failers          [\x09 \xa0\x{1680}\x{180e}\x{2000}-\x{200a}\x{202f}\x{205f}\x{3000}]
1451            Ket
1452            End
1453    ------------------------------------------------------------------
1454        >\x{1680}
1455     0: \x{1680}
1456    
1457    /[\h]{3,}/8BZ
1458    ------------------------------------------------------------------
1459            Bra
1460            [\x09 \xa0\x{1680}\x{180e}\x{2000}-\x{200a}\x{202f}\x{205f}\x{3000}]{3,}
1461            Ket
1462            End
1463    ------------------------------------------------------------------
1464        >\x{1680}\x{180e}\x{2000}\x{2003}\x{200a}\x{202f}\x{205f}\x{3000}<
1465     0: \x{1680}\x{180e}\x{2000}\x{2003}\x{200a}\x{202f}\x{205f}\x{3000}
1466    
1467    /[\v]/8BZ
1468    ------------------------------------------------------------------
1469            Bra
1470            [\x0a-\x0d\x85\x{2028}-\x{2029}]
1471            Ket
1472            End
1473    ------------------------------------------------------------------
1474    
1475    /[\H]/8BZ
1476    ------------------------------------------------------------------
1477            Bra
1478            [\x00-\x08\x0a-\x1f!-\x9f\xa1-\xff\x{100}-\x{167f}\x{1681}-\x{180d}\x{180f}-\x{1fff}\x{200b}-\x{202e}\x{2030}-\x{205e}\x{2060}-\x{2fff}\x{3001}-\x{7fffffff}]
1479            Ket
1480            End
1481    ------------------------------------------------------------------
1482    
1483    /[\V]/8BZ
1484    ------------------------------------------------------------------
1485            Bra
1486            [\x00-\x09\x0e-\x84\x86-\xff\x{100}-\x{2027}\x{2029}-\x{7fffffff}]
1487            Ket
1488            End
1489    ------------------------------------------------------------------
1490    
1491    /.*$/8<any>
1492        \x{1ec5}
1493     0: \x{1ec5}
1494    
1495    /-- This tests the stricter UTF-8 check according to RFC 3629. --/
1496    
1497    /X/8
1498        \x{0}\x{d7ff}\x{e000}\x{10ffff}
1499  No match  No match
1500      \x{100}\x{100}b      \x{d800}
1501    Error -10
1502        \x{d800}\?
1503    No match
1504        \x{da00}
1505    Error -10
1506        \x{da00}\?
1507    No match
1508        \x{dfff}
1509    Error -10
1510        \x{dfff}\?
1511    No match
1512        \x{110000}
1513    Error -10
1514        \x{110000}\?
1515    No match
1516        \x{2000000}
1517    Error -10
1518        \x{2000000}\?
1519    No match
1520        \x{7fffffff}
1521    Error -10
1522        \x{7fffffff}\?
1523  No match  No match
1524    
1525  / End of testinput5 /  / End of testinput5 /
   

Legend:
Removed from v.51  
changed lines
  Added in v.226

  ViewVC Help
Powered by ViewVC 1.1.5