/[pcre]/code/trunk/pcre_exec.c
ViewVC logotype

Diff of /code/trunk/pcre_exec.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 929 by zherczeg, Fri Feb 24 11:07:47 2012 UTC revision 1135 by chpe, Thu Oct 18 18:35:37 2012 UTC
# Line 37  POSSIBILITY OF SUCH DAMAGE. Line 37  POSSIBILITY OF SUCH DAMAGE.
37  -----------------------------------------------------------------------------  -----------------------------------------------------------------------------
38  */  */
39    
   
40  /* This module contains pcre_exec(), the externally visible function that does  /* This module contains pcre_exec(), the externally visible function that does
41  pattern matching using an NFA algorithm, trying to mimic Perl as closely as  pattern matching using an NFA algorithm, trying to mimic Perl as closely as
42  possible. There are also some static supporting functions. */  possible. There are also some static supporting functions. */
# Line 93  because the offset vector is always a mu Line 92  because the offset vector is always a mu
92  static const char rep_min[] = { 0, 0, 1, 1, 0, 0 };  static const char rep_min[] = { 0, 0, 1, 1, 0, 0 };
93  static const char rep_max[] = { 0, 0, 0, 0, 1, 1 };  static const char rep_max[] = { 0, 0, 0, 0, 1, 1 };
94    
   
   
95  #ifdef PCRE_DEBUG  #ifdef PCRE_DEBUG
96  /*************************************************  /*************************************************
97  *        Debugging function to print chars       *  *        Debugging function to print chars       *
# Line 115  Returns:     nothing Line 112  Returns:     nothing
112  static void  static void
113  pchars(const pcre_uchar *p, int length, BOOL is_subject, match_data *md)  pchars(const pcre_uchar *p, int length, BOOL is_subject, match_data *md)
114  {  {
115  unsigned int c;  pcre_uint32 c;
116    BOOL utf = md->utf;
117  if (is_subject && length > md->end_subject - p) length = md->end_subject - p;  if (is_subject && length > md->end_subject - p) length = md->end_subject - p;
118  while (length-- > 0)  while (length-- > 0)
119    if (isprint(c = *(p++))) printf("%c", c); else printf("\\x%02x", c);    if (isprint(c = RAWUCHARINCTEST(p))) printf("%c", (char)c); else printf("\\x{%02x}", c);
120  }  }
121  #endif  #endif
122    
# Line 142  Arguments: Line 140  Arguments:
140    
141  Returns:      >= 0 the number of subject bytes matched  Returns:      >= 0 the number of subject bytes matched
142                -1 no match                -1 no match
143                -2 partial match; always given if at end subject                -2 partial match; always given if at end subject
144  */  */
145    
146  static int  static int
# Line 151  match_ref(int offset, register PCRE_PUCH Line 149  match_ref(int offset, register PCRE_PUCH
149  {  {
150  PCRE_PUCHAR eptr_start = eptr;  PCRE_PUCHAR eptr_start = eptr;
151  register PCRE_PUCHAR p = md->start_subject + md->offset_vector[offset];  register PCRE_PUCHAR p = md->start_subject + md->offset_vector[offset];
152    BOOL utf = md->utf;
153    
154  #ifdef PCRE_DEBUG  #ifdef PCRE_DEBUG
155  if (eptr >= md->end_subject)  if (eptr >= md->end_subject)
# Line 165  pchars(p, length, FALSE, md); Line 164  pchars(p, length, FALSE, md);
164  printf("\n");  printf("\n");
165  #endif  #endif
166    
167  /* Always fail if reference not set (and not JavaScript compatible - in that  /* Always fail if reference not set (and not JavaScript compatible - in that
168  case the length is passed as zero). */  case the length is passed as zero). */
169    
170  if (length < 0) return -1;  if (length < 0) return -1;
# Line 178  if (caseless) Line 177  if (caseless)
177    {    {
178  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
179  #ifdef SUPPORT_UCP  #ifdef SUPPORT_UCP
180    if (md->utf)    if (utf)
181      {      {
182      /* Match characters up to the end of the reference. NOTE: the number of      /* Match characters up to the end of the reference. NOTE: the number of
183      bytes matched may differ, because there are some characters whose upper and      data units matched may differ, because in UTF-8 there are some characters
184      lower case versions code as different numbers of bytes. For example, U+023A      whose upper and lower case versions code have different numbers of bytes.
185      (2 bytes in UTF-8) is the upper case version of U+2C65 (3 bytes in UTF-8);      For example, U+023A (2 bytes in UTF-8) is the upper case version of U+2C65
186      a sequence of 3 of the former uses 6 bytes, as does a sequence of two of      (3 bytes in UTF-8); a sequence of 3 of the former uses 6 bytes, as does a
187      the latter. It is important, therefore, to check the length along the      sequence of two of the latter. It is important, therefore, to check the
188      reference, not along the subject (earlier code did this wrong). */      length along the reference, not along the subject (earlier code did this
189        wrong). */
190    
191      PCRE_PUCHAR endptr = p + length;      PCRE_PUCHAR endptr = p + length;
192      while (p < endptr)      while (p < endptr)
193        {        {
194        int c, d;        pcre_uint32 c, d;
195          const ucd_record *ur;
196        if (eptr >= md->end_subject) return -2;   /* Partial match */        if (eptr >= md->end_subject) return -2;   /* Partial match */
197        GETCHARINC(c, eptr);        GETCHARINC(c, eptr);
198        GETCHARINC(d, p);        GETCHARINC(d, p);
199        if (c != d && c != UCD_OTHERCASE(d)) return -1;        ur = GET_UCD(d);
200          if (c != d && c != d + ur->other_case)
201            {
202            const pcre_uint32 *pp = PRIV(ucd_caseless_sets) + ur->caseset;
203            for (;;)
204              {
205              if (c < *pp) return -1;
206              if (c == *pp++) break;
207              }
208            }
209        }        }
210      }      }
211    else    else
# Line 207  if (caseless) Line 217  if (caseless)
217      {      {
218      while (length-- > 0)      while (length-- > 0)
219        {        {
220          pcre_uchar cc, cp;
221        if (eptr >= md->end_subject) return -2;   /* Partial match */        if (eptr >= md->end_subject) return -2;   /* Partial match */
222        if (TABLE_GET(*p, md->lcc, *p) != TABLE_GET(*eptr, md->lcc, *eptr)) return -1;        cc = RAWUCHARTEST(eptr);
223          cp = RAWUCHARTEST(p);
224          if (TABLE_GET(cp, md->lcc, cp) != TABLE_GET(cc, md->lcc, cc)) return -1;
225        p++;        p++;
226        eptr++;        eptr++;
227        }        }
# Line 220  are in UTF-8 mode. */ Line 233  are in UTF-8 mode. */
233    
234  else  else
235    {    {
236    while (length-- > 0)    while (length-- > 0)
237      {      {
238      if (eptr >= md->end_subject) return -2;   /* Partial match */      if (eptr >= md->end_subject) return -2;   /* Partial match */
239      if (*p++ != *eptr++) return -1;      if (RAWUCHARINCTEST(p) != RAWUCHARINCTEST(eptr)) return -1;
240      }      }
241    }    }
242    
243  return (int)(eptr - eptr_start);  return (int)(eptr - eptr_start);
# Line 297  actually used in this definition. */ Line 310  actually used in this definition. */
310    }    }
311  #define RRETURN(ra) \  #define RRETURN(ra) \
312    { \    { \
313    printf("match() returned %d from line %d ", ra, __LINE__); \    printf("match() returned %d from line %d\n", ra, __LINE__); \
314    return ra; \    return ra; \
315    }    }
316  #else  #else
# Line 317  argument of match(), which never changes Line 330  argument of match(), which never changes
330    
331  #define RMATCH(ra,rb,rc,rd,re,rw)\  #define RMATCH(ra,rb,rc,rd,re,rw)\
332    {\    {\
333    heapframe *newframe = (heapframe *)(PUBL(stack_malloc))(sizeof(heapframe));\    heapframe *newframe = frame->Xnextframe;\
334    if (newframe == NULL) RRETURN(PCRE_ERROR_NOMEMORY);\    if (newframe == NULL)\
335    frame->Xwhere = rw; \      {\
336        newframe = (heapframe *)(PUBL(stack_malloc))(sizeof(heapframe));\
337        if (newframe == NULL) RRETURN(PCRE_ERROR_NOMEMORY);\
338        newframe->Xnextframe = NULL;\
339        frame->Xnextframe = newframe;\
340        }\
341      frame->Xwhere = rw;\
342    newframe->Xeptr = ra;\    newframe->Xeptr = ra;\
343    newframe->Xecode = rb;\    newframe->Xecode = rb;\
344    newframe->Xmstart = mstart;\    newframe->Xmstart = mstart;\
# Line 338  argument of match(), which never changes Line 357  argument of match(), which never changes
357    {\    {\
358    heapframe *oldframe = frame;\    heapframe *oldframe = frame;\
359    frame = oldframe->Xprevframe;\    frame = oldframe->Xprevframe;\
   if (oldframe != &frame_zero) (PUBL(stack_free))(oldframe);\  
360    if (frame != NULL)\    if (frame != NULL)\
361      {\      {\
362      rrc = ra;\      rrc = ra;\
# Line 352  argument of match(), which never changes Line 370  argument of match(), which never changes
370    
371  typedef struct heapframe {  typedef struct heapframe {
372    struct heapframe *Xprevframe;    struct heapframe *Xprevframe;
373      struct heapframe *Xnextframe;
374    
375    /* Function arguments that may change */    /* Function arguments that may change */
376    
# Line 382  typedef struct heapframe { Line 401  typedef struct heapframe {
401    
402  #ifdef SUPPORT_UCP  #ifdef SUPPORT_UCP
403    int Xprop_type;    int Xprop_type;
404    int Xprop_value;    unsigned int Xprop_value;
405    int Xprop_fail_result;    int Xprop_fail_result;
406    int Xoclength;    int Xoclength;
407    pcre_uchar Xocchars[6];    pcre_uchar Xocchars[6];
# Line 483  so they can be ordinary variables in all Line 502  so they can be ordinary variables in all
502    
503  register int  rrc;         /* Returns from recursive calls */  register int  rrc;         /* Returns from recursive calls */
504  register int  i;           /* Used for loops not involving calls to RMATCH() */  register int  i;           /* Used for loops not involving calls to RMATCH() */
505  register unsigned int c;   /* Character values not kept over RMATCH() calls */  register pcre_uint32 c;    /* Character values not kept over RMATCH() calls */
506  register BOOL utf;         /* Local copy of UTF flag for speed */  register BOOL utf;         /* Local copy of UTF flag for speed */
507    
508  BOOL minimize, possessive; /* Quantifier options */  BOOL minimize, possessive; /* Quantifier options */
# Line 498  the top-level on the stack rather than m Line 517  the top-level on the stack rather than m
517  boost in many cases where there is not much "recursion". */  boost in many cases where there is not much "recursion". */
518    
519  #ifdef NO_RECURSE  #ifdef NO_RECURSE
520  heapframe frame_zero;  heapframe *frame = (heapframe *)md->match_frames_base;
 heapframe *frame = &frame_zero;  
 frame->Xprevframe = NULL;            /* Marks the top level */  
521    
522  /* Copy in the original argument variables */  /* Copy in the original argument variables */
523    
# Line 602  BOOL prev_is_word; Line 619  BOOL prev_is_word;
619    
620  #ifdef SUPPORT_UCP  #ifdef SUPPORT_UCP
621  int prop_type;  int prop_type;
622  int prop_value;  unsigned int prop_value;
623  int prop_fail_result;  int prop_fail_result;
624  int oclength;  int oclength;
625  pcre_uchar occhars[6];  pcre_uchar occhars[6];
# Line 615  int max; Line 632  int max;
632  int min;  int min;
633  int number;  int number;
634  int offset;  int offset;
635  int op;  pcre_uchar op;
636  int save_capture_last;  int save_capture_last;
637  int save_offset1, save_offset2, save_offset3;  int save_offset1, save_offset2, save_offset3;
638  int stacksave[REC_STACK_SAVE_MAX];  int stacksave[REC_STACK_SAVE_MAX];
# Line 734  for (;;) Line 751  for (;;)
751      unaltered. */      unaltered. */
752    
753      else if (rrc == MATCH_SKIP_ARG &&      else if (rrc == MATCH_SKIP_ARG &&
754          STRCMP_UC_UC(ecode + 2, md->start_match_ptr) == 0)          STRCMP_UC_UC_TEST(ecode + 2, md->start_match_ptr) == 0)
755        {        {
756        md->start_match_ptr = eptr;        md->start_match_ptr = eptr;
757        RRETURN(MATCH_SKIP);        RRETURN(MATCH_SKIP);
# Line 903  for (;;) Line 920  for (;;)
920        }        }
921      else  /* OP_KETRMAX */      else  /* OP_KETRMAX */
922        {        {
       md->match_function_type = MATCH_CBEGROUP;  
923        RMATCH(eptr, prev, offset_top, md, eptrb, RM66);        RMATCH(eptr, prev, offset_top, md, eptrb, RM66);
924        if (rrc != MATCH_NOMATCH) RRETURN(rrc);        if (rrc != MATCH_NOMATCH) RRETURN(rrc);
925        ecode += 1 + LINK_SIZE;        ecode += 1 + LINK_SIZE;
# Line 1032  for (;;) Line 1048  for (;;)
1048    
1049      for (;;)      for (;;)
1050        {        {
1051        if (op >= OP_SBRA || op == OP_ONCE) md->match_function_type = MATCH_CBEGROUP;        if (op >= OP_SBRA || op == OP_ONCE)
1052            md->match_function_type = MATCH_CBEGROUP;
1053    
1054        /* If this is not a possibly empty group, and there are no (*THEN)s in        /* If this is not a possibly empty group, and there are no (*THEN)s in
1055        the pattern, and this is the final alternative, optimize as described        the pattern, and this is the final alternative, optimize as described
# Line 1259  for (;;) Line 1276  for (;;)
1276          cb.version          = 2;   /* Version 1 of the callout block */          cb.version          = 2;   /* Version 1 of the callout block */
1277          cb.callout_number   = ecode[LINK_SIZE+2];          cb.callout_number   = ecode[LINK_SIZE+2];
1278          cb.offset_vector    = md->offset_vector;          cb.offset_vector    = md->offset_vector;
1279  #ifdef COMPILE_PCRE8  #if defined COMPILE_PCRE8
1280          cb.subject          = (PCRE_SPTR)md->start_subject;          cb.subject          = (PCRE_SPTR)md->start_subject;
1281  #else  #elif defined COMPILE_PCRE16
1282          cb.subject          = (PCRE_SPTR16)md->start_subject;          cb.subject          = (PCRE_SPTR16)md->start_subject;
1283    #elif defined COMPILE_PCRE32
1284            cb.subject          = (PCRE_SPTR32)md->start_subject;
1285  #endif  #endif
1286          cb.subject_length   = (int)(md->end_subject - md->start_subject);          cb.subject_length   = (int)(md->end_subject - md->start_subject);
1287          cb.start_match      = (int)(mstart - md->start_subject);          cb.start_match      = (int)(mstart - md->start_subject);
# Line 1571  for (;;) Line 1590  for (;;)
1590          mstart = md->start_match_ptr;   /* In case \K reset it */          mstart = md->start_match_ptr;   /* In case \K reset it */
1591          break;          break;
1592          }          }
1593          md->mark = save_mark;
1594    
1595        /* PCRE does not allow THEN to escape beyond an assertion; it is treated        /* A COMMIT failure must fail the entire assertion, without trying any
1596        as NOMATCH. */        subsequent branches. */
1597    
1598          if (rrc == MATCH_COMMIT) RRETURN(MATCH_NOMATCH);
1599    
1600          /* PCRE does not allow THEN to escape beyond an assertion; it
1601          is treated as NOMATCH. */
1602    
1603        if (rrc != MATCH_NOMATCH && rrc != MATCH_THEN) RRETURN(rrc);        if (rrc != MATCH_NOMATCH && rrc != MATCH_THEN) RRETURN(rrc);
1604        ecode += GET(ecode, 1);        ecode += GET(ecode, 1);
       md->mark = save_mark;  
1605        }        }
1606      while (*ecode == OP_ALT);      while (*ecode == OP_ALT);
1607    
# Line 1677  for (;;) Line 1701  for (;;)
1701        cb.version          = 2;   /* Version 1 of the callout block */        cb.version          = 2;   /* Version 1 of the callout block */
1702        cb.callout_number   = ecode[1];        cb.callout_number   = ecode[1];
1703        cb.offset_vector    = md->offset_vector;        cb.offset_vector    = md->offset_vector;
1704  #ifdef COMPILE_PCRE8  #if defined COMPILE_PCRE8
1705        cb.subject          = (PCRE_SPTR)md->start_subject;        cb.subject          = (PCRE_SPTR)md->start_subject;
1706  #else  #elif defined COMPILE_PCRE16
1707        cb.subject          = (PCRE_SPTR16)md->start_subject;        cb.subject          = (PCRE_SPTR16)md->start_subject;
1708    #elif defined COMPILE_PCRE32
1709          cb.subject          = (PCRE_SPTR32)md->start_subject;
1710  #endif  #endif
1711        cb.subject_length   = (int)(md->end_subject - md->start_subject);        cb.subject_length   = (int)(md->end_subject - md->start_subject);
1712        cb.start_match      = (int)(mstart - md->start_subject);        cb.start_match      = (int)(mstart - md->start_subject);
# Line 1785  for (;;) Line 1811  for (;;)
1811            goto RECURSION_MATCHED;        /* Exit loop; end processing */            goto RECURSION_MATCHED;        /* Exit loop; end processing */
1812            }            }
1813    
1814          /* PCRE does not allow THEN to escape beyond a recursion; it is treated          /* PCRE does not allow THEN or COMMIT to escape beyond a recursion; it
1815          as NOMATCH. */          is treated as NOMATCH. */
1816    
1817          else if (rrc != MATCH_NOMATCH && rrc != MATCH_THEN)          else if (rrc != MATCH_NOMATCH && rrc != MATCH_THEN &&
1818                     rrc != MATCH_COMMIT)
1819            {            {
1820            DPRINTF(("Recursion gave error %d\n", rrc));            DPRINTF(("Recursion gave error %d\n", rrc));
1821            if (new_recursive.offset_save != stacksave)            if (new_recursive.offset_save != stacksave)
# Line 1999  for (;;) Line 2026  for (;;)
2026          }          }
2027        if (*prev >= OP_SBRA)    /* Could match an empty string */        if (*prev >= OP_SBRA)    /* Could match an empty string */
2028          {          {
         md->match_function_type = MATCH_CBEGROUP;  
2029          RMATCH(eptr, prev, offset_top, md, eptrb, RM50);          RMATCH(eptr, prev, offset_top, md, eptrb, RM50);
2030          RRETURN(rrc);          RRETURN(rrc);
2031          }          }
# Line 2008  for (;;) Line 2034  for (;;)
2034        }        }
2035      else  /* OP_KETRMAX */      else  /* OP_KETRMAX */
2036        {        {
       if (*prev >= OP_SBRA) md->match_function_type = MATCH_CBEGROUP;  
2037        RMATCH(eptr, prev, offset_top, md, eptrb, RM13);        RMATCH(eptr, prev, offset_top, md, eptrb, RM13);
2038        if (rrc == MATCH_ONCE && md->once_target == prev) rrc = MATCH_NOMATCH;        if (rrc == MATCH_ONCE && md->once_target == prev) rrc = MATCH_NOMATCH;
2039        if (rrc != MATCH_NOMATCH) RRETURN(rrc);        if (rrc != MATCH_NOMATCH) RRETURN(rrc);
# Line 2065  for (;;) Line 2090  for (;;)
2090    
2091      case OP_DOLLM:      case OP_DOLLM:
2092      if (eptr < md->end_subject)      if (eptr < md->end_subject)
2093        {        {
2094        if (!IS_NEWLINE(eptr))        if (!IS_NEWLINE(eptr))
2095          {          {
2096          if (md->partial != 0 &&          if (md->partial != 0 &&
2097              eptr + 1 >= md->end_subject &&              eptr + 1 >= md->end_subject &&
2098              NLBLOCK->nltype == NLTYPE_FIXED &&              NLBLOCK->nltype == NLTYPE_FIXED &&
2099              NLBLOCK->nllen == 2 &&              NLBLOCK->nllen == 2 &&
2100              *eptr == NLBLOCK->nl[0])              RAWUCHARTEST(eptr) == NLBLOCK->nl[0])
2101            {            {
2102            md->hitend = TRUE;            md->hitend = TRUE;
2103            if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);            if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
2104            }            }
2105          RRETURN(MATCH_NOMATCH);          RRETURN(MATCH_NOMATCH);
2106          }          }
2107        }        }
2108      else      else
2109        {        {
# Line 2115  for (;;) Line 2140  for (;;)
2140        if (md->partial != 0 &&        if (md->partial != 0 &&
2141            eptr + 1 >= md->end_subject &&            eptr + 1 >= md->end_subject &&
2142            NLBLOCK->nltype == NLTYPE_FIXED &&            NLBLOCK->nltype == NLTYPE_FIXED &&
2143            NLBLOCK->nllen == 2 &&            NLBLOCK->nllen == 2 &&
2144            *eptr == NLBLOCK->nl[0])            RAWUCHARTEST(eptr) == NLBLOCK->nl[0])
2145          {          {
2146          md->hitend = TRUE;          md->hitend = TRUE;
2147          if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);          if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
2148          }          }
2149        RRETURN(MATCH_NOMATCH);        RRETURN(MATCH_NOMATCH);
2150        }        }
2151    
2152      /* Either at end of string or \n before end. */      /* Either at end of string or \n before end. */
2153    
# Line 2258  for (;;) Line 2283  for (;;)
2283      if (md->partial != 0 &&      if (md->partial != 0 &&
2284          eptr + 1 >= md->end_subject &&          eptr + 1 >= md->end_subject &&
2285          NLBLOCK->nltype == NLTYPE_FIXED &&          NLBLOCK->nltype == NLTYPE_FIXED &&
2286          NLBLOCK->nllen == 2 &&          NLBLOCK->nllen == 2 &&
2287          *eptr == NLBLOCK->nl[0])          RAWUCHARTEST(eptr) == NLBLOCK->nl[0])
2288        {        {
2289        md->hitend = TRUE;        md->hitend = TRUE;
2290        if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);        if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
2291        }        }
2292    
2293      /* Fall through */      /* Fall through */
2294    
2295      /* Match any single character whatsoever. */      /* Match any single character whatsoever. */
2296    
2297      case OP_ALLANY:      case OP_ALLANY:
2298      if (eptr >= md->end_subject)   /* DO NOT merge the eptr++ here; it must */      if (eptr >= md->end_subject)   /* DO NOT merge the eptr++ here; it must */
2299        {                            /* not be updated before SCHECK_PARTIAL. */        {                            /* not be updated before SCHECK_PARTIAL. */
# Line 2408  for (;;) Line 2433  for (;;)
2433        {        {
2434        default: RRETURN(MATCH_NOMATCH);        default: RRETURN(MATCH_NOMATCH);
2435    
2436        case 0x000d:        case CHAR_CR:
2437        if (eptr >= md->end_subject)        if (eptr >= md->end_subject)
2438          {          {
2439          SCHECK_PARTIAL();          SCHECK_PARTIAL();
2440          }          }
2441        else if (*eptr == 0x0a) eptr++;        else if (RAWUCHARTEST(eptr) == CHAR_LF) eptr++;
2442        break;        break;
2443    
2444        case 0x000a:        case CHAR_LF:
2445        break;        break;
2446    
2447        case 0x000b:        case CHAR_VT:
2448        case 0x000c:        case CHAR_FF:
2449        case 0x0085:        case CHAR_NEL:
2450    #ifndef EBCDIC
2451        case 0x2028:        case 0x2028:
2452        case 0x2029:        case 0x2029:
2453    #endif  /* Not EBCDIC */
2454        if (md->bsr_anycrlf) RRETURN(MATCH_NOMATCH);        if (md->bsr_anycrlf) RRETURN(MATCH_NOMATCH);
2455        break;        break;
2456        }        }
# Line 2439  for (;;) Line 2466  for (;;)
2466      GETCHARINCTEST(c, eptr);      GETCHARINCTEST(c, eptr);
2467      switch(c)      switch(c)
2468        {        {
2469          HSPACE_CASES: RRETURN(MATCH_NOMATCH);  /* Byte and multibyte cases */
2470        default: break;        default: break;
       case 0x09:      /* HT */  
       case 0x20:      /* SPACE */  
       case 0xa0:      /* NBSP */  
       case 0x1680:    /* OGHAM SPACE MARK */  
       case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
       case 0x2000:    /* EN QUAD */  
       case 0x2001:    /* EM QUAD */  
       case 0x2002:    /* EN SPACE */  
       case 0x2003:    /* EM SPACE */  
       case 0x2004:    /* THREE-PER-EM SPACE */  
       case 0x2005:    /* FOUR-PER-EM SPACE */  
       case 0x2006:    /* SIX-PER-EM SPACE */  
       case 0x2007:    /* FIGURE SPACE */  
       case 0x2008:    /* PUNCTUATION SPACE */  
       case 0x2009:    /* THIN SPACE */  
       case 0x200A:    /* HAIR SPACE */  
       case 0x202f:    /* NARROW NO-BREAK SPACE */  
       case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
       case 0x3000:    /* IDEOGRAPHIC SPACE */  
       RRETURN(MATCH_NOMATCH);  
2471        }        }
2472      ecode++;      ecode++;
2473      break;      break;
# Line 2473  for (;;) Line 2481  for (;;)
2481      GETCHARINCTEST(c, eptr);      GETCHARINCTEST(c, eptr);
2482      switch(c)      switch(c)
2483        {        {
2484          HSPACE_CASES: break;  /* Byte and multibyte cases */
2485        default: RRETURN(MATCH_NOMATCH);        default: RRETURN(MATCH_NOMATCH);
       case 0x09:      /* HT */  
       case 0x20:      /* SPACE */  
       case 0xa0:      /* NBSP */  
       case 0x1680:    /* OGHAM SPACE MARK */  
       case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
       case 0x2000:    /* EN QUAD */  
       case 0x2001:    /* EM QUAD */  
       case 0x2002:    /* EN SPACE */  
       case 0x2003:    /* EM SPACE */  
       case 0x2004:    /* THREE-PER-EM SPACE */  
       case 0x2005:    /* FOUR-PER-EM SPACE */  
       case 0x2006:    /* SIX-PER-EM SPACE */  
       case 0x2007:    /* FIGURE SPACE */  
       case 0x2008:    /* PUNCTUATION SPACE */  
       case 0x2009:    /* THIN SPACE */  
       case 0x200A:    /* HAIR SPACE */  
       case 0x202f:    /* NARROW NO-BREAK SPACE */  
       case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
       case 0x3000:    /* IDEOGRAPHIC SPACE */  
       break;  
2486        }        }
2487      ecode++;      ecode++;
2488      break;      break;
# Line 2507  for (;;) Line 2496  for (;;)
2496      GETCHARINCTEST(c, eptr);      GETCHARINCTEST(c, eptr);
2497      switch(c)      switch(c)
2498        {        {
2499          VSPACE_CASES: RRETURN(MATCH_NOMATCH);
2500        default: break;        default: break;
       case 0x0a:      /* LF */  
       case 0x0b:      /* VT */  
       case 0x0c:      /* FF */  
       case 0x0d:      /* CR */  
       case 0x85:      /* NEL */  
       case 0x2028:    /* LINE SEPARATOR */  
       case 0x2029:    /* PARAGRAPH SEPARATOR */  
       RRETURN(MATCH_NOMATCH);  
2501        }        }
2502      ecode++;      ecode++;
2503      break;      break;
# Line 2529  for (;;) Line 2511  for (;;)
2511      GETCHARINCTEST(c, eptr);      GETCHARINCTEST(c, eptr);
2512      switch(c)      switch(c)
2513        {        {
2514          VSPACE_CASES: break;
2515        default: RRETURN(MATCH_NOMATCH);        default: RRETURN(MATCH_NOMATCH);
       case 0x0a:      /* LF */  
       case 0x0b:      /* VT */  
       case 0x0c:      /* FF */  
       case 0x0d:      /* CR */  
       case 0x85:      /* NEL */  
       case 0x2028:    /* LINE SEPARATOR */  
       case 0x2029:    /* PARAGRAPH SEPARATOR */  
       break;  
2516        }        }
2517      ecode++;      ecode++;
2518      break;      break;
# Line 2555  for (;;) Line 2530  for (;;)
2530        }        }
2531      GETCHARINCTEST(c, eptr);      GETCHARINCTEST(c, eptr);
2532        {        {
2533          const pcre_uint32 *cp;
2534        const ucd_record *prop = GET_UCD(c);        const ucd_record *prop = GET_UCD(c);
2535    
2536        switch(ecode[1])        switch(ecode[1])
# Line 2615  for (;;) Line 2591  for (;;)
2591            RRETURN(MATCH_NOMATCH);            RRETURN(MATCH_NOMATCH);
2592          break;          break;
2593    
2594            case PT_CLIST:
2595            cp = PRIV(ucd_caseless_sets) + prop->caseset;
2596            for (;;)
2597              {
2598              if (c < *cp)
2599                { if (op == OP_PROP) { RRETURN(MATCH_NOMATCH); } else break; }
2600              if (c == *cp++)
2601                { if (op == OP_PROP) break; else { RRETURN(MATCH_NOMATCH); } }
2602              }
2603            break;
2604    
2605          /* This should never occur */          /* This should never occur */
2606    
2607          default:          default:
# Line 2634  for (;;) Line 2621  for (;;)
2621        SCHECK_PARTIAL();        SCHECK_PARTIAL();
2622        RRETURN(MATCH_NOMATCH);        RRETURN(MATCH_NOMATCH);
2623        }        }
2624      GETCHARINCTEST(c, eptr);      else
     if (UCD_CATEGORY(c) == ucp_M) RRETURN(MATCH_NOMATCH);  
     while (eptr < md->end_subject)  
2625        {        {
2626        int len = 1;        int lgb, rgb;
2627        if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }        GETCHARINCTEST(c, eptr);
2628        if (UCD_CATEGORY(c) != ucp_M) break;        lgb = UCD_GRAPHBREAK(c);
2629        eptr += len;        while (eptr < md->end_subject)
2630            {
2631            int len = 1;
2632            if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }
2633            rgb = UCD_GRAPHBREAK(c);
2634            if ((PRIV(ucp_gbtable)[lgb] & (1 << rgb)) == 0) break;
2635            lgb = rgb;
2636            eptr += len;
2637            }
2638        }        }
2639      CHECK_PARTIAL();      CHECK_PARTIAL();
2640      ecode++;      ecode++;
2641      break;      break;
2642  #endif  #endif  /* SUPPORT_UCP */
2643    
2644    
2645      /* Match a back reference, possibly repeatedly. Look past the end of the      /* Match a back reference, possibly repeatedly. Look past the end of the
# Line 2709  for (;;) Line 2702  for (;;)
2702        default:               /* No repeat follows */        default:               /* No repeat follows */
2703        if ((length = match_ref(offset, eptr, length, md, caseless)) < 0)        if ((length = match_ref(offset, eptr, length, md, caseless)) < 0)
2704          {          {
2705          if (length == -2) eptr = md->end_subject;   /* Partial match */          if (length == -2) eptr = md->end_subject;   /* Partial match */
2706          CHECK_PARTIAL();          CHECK_PARTIAL();
2707          RRETURN(MATCH_NOMATCH);          RRETURN(MATCH_NOMATCH);
2708          }          }
# Line 2735  for (;;) Line 2728  for (;;)
2728        int slength;        int slength;
2729        if ((slength = match_ref(offset, eptr, length, md, caseless)) < 0)        if ((slength = match_ref(offset, eptr, length, md, caseless)) < 0)
2730          {          {
2731          if (slength == -2) eptr = md->end_subject;   /* Partial match */          if (slength == -2) eptr = md->end_subject;   /* Partial match */
2732          CHECK_PARTIAL();          CHECK_PARTIAL();
2733          RRETURN(MATCH_NOMATCH);          RRETURN(MATCH_NOMATCH);
2734          }          }
# Line 2759  for (;;) Line 2752  for (;;)
2752          if (fi >= max) RRETURN(MATCH_NOMATCH);          if (fi >= max) RRETURN(MATCH_NOMATCH);
2753          if ((slength = match_ref(offset, eptr, length, md, caseless)) < 0)          if ((slength = match_ref(offset, eptr, length, md, caseless)) < 0)
2754            {            {
2755            if (slength == -2) eptr = md->end_subject;   /* Partial match */            if (slength == -2) eptr = md->end_subject;   /* Partial match */
2756            CHECK_PARTIAL();            CHECK_PARTIAL();
2757            RRETURN(MATCH_NOMATCH);            RRETURN(MATCH_NOMATCH);
2758            }            }
# Line 2778  for (;;) Line 2771  for (;;)
2771          int slength;          int slength;
2772          if ((slength = match_ref(offset, eptr, length, md, caseless)) < 0)          if ((slength = match_ref(offset, eptr, length, md, caseless)) < 0)
2773            {            {
2774            /* Can't use CHECK_PARTIAL because we don't want to update eptr in            /* Can't use CHECK_PARTIAL because we don't want to update eptr in
2775            the soft partial matching case. */            the soft partial matching case. */
2776    
2777            if (slength == -2 && md->partial != 0 &&            if (slength == -2 && md->partial != 0 &&
2778                md->end_subject > md->start_used_ptr)                md->end_subject > md->start_used_ptr)
2779              {              {
2780              md->hitend = TRUE;              md->hitend = TRUE;
2781              if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);              if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
2782              }              }
# Line 2791  for (;;) Line 2784  for (;;)
2784            }            }
2785          eptr += slength;          eptr += slength;
2786          }          }
2787    
2788        while (eptr >= pp)        while (eptr >= pp)
2789          {          {
2790          RMATCH(eptr, ecode, offset_top, md, eptrb, RM15);          RMATCH(eptr, ecode, offset_top, md, eptrb, RM15);
# Line 3155  for (;;) Line 3148  for (;;)
3148          CHECK_PARTIAL();             /* Not SCHECK_PARTIAL() */          CHECK_PARTIAL();             /* Not SCHECK_PARTIAL() */
3149          RRETURN(MATCH_NOMATCH);          RRETURN(MATCH_NOMATCH);
3150          }          }
3151        while (length-- > 0) if (*ecode++ != *eptr++) RRETURN(MATCH_NOMATCH);        while (length-- > 0) if (*ecode++ != RAWUCHARINC(eptr)) RRETURN(MATCH_NOMATCH);
3152        }        }
3153      else      else
3154  #endif  #endif
# Line 3195  for (;;) Line 3188  for (;;)
3188    
3189        if (fc < 128)        if (fc < 128)
3190          {          {
3191          if (md->lcc[fc]          pcre_uchar cc = RAWUCHAR(eptr);
3192              != TABLE_GET(*eptr, md->lcc, *eptr)) RRETURN(MATCH_NOMATCH);          if (md->lcc[fc] != TABLE_GET(cc, md->lcc, cc)) RRETURN(MATCH_NOMATCH);
3193          ecode++;          ecode++;
3194          eptr++;          eptr++;
3195          }          }
# Line 3207  for (;;) Line 3200  for (;;)
3200    
3201        else        else
3202          {          {
3203          unsigned int dc;          pcre_uint32 dc;
3204          GETCHARINC(dc, eptr);          GETCHARINC(dc, eptr);
3205          ecode += length;          ecode += length;
3206    
# Line 3317  for (;;) Line 3310  for (;;)
3310        if (length > 1)        if (length > 1)
3311          {          {
3312  #ifdef SUPPORT_UCP  #ifdef SUPPORT_UCP
3313          unsigned int othercase;          pcre_uint32 othercase;
3314          if (op >= OP_STARI &&     /* Caseless */          if (op >= OP_STARI &&     /* Caseless */
3315              (othercase = UCD_OTHERCASE(fc)) != fc)              (othercase = UCD_OTHERCASE(fc)) != fc)
3316            oclength = PRIV(ord2utf)(othercase, occhars);            oclength = PRIV(ord2utf)(othercase, occhars);
# Line 3421  for (;;) Line 3414  for (;;)
3414      maximizing, find the maximum number of characters and work backwards. */      maximizing, find the maximum number of characters and work backwards. */
3415    
3416      DPRINTF(("matching %c{%d,%d} against subject %.*s\n", fc, min, max,      DPRINTF(("matching %c{%d,%d} against subject %.*s\n", fc, min, max,
3417        max, eptr));        max, (char *)eptr));
3418    
3419      if (op >= OP_STARI)  /* Caseless */      if (op >= OP_STARI)  /* Caseless */
3420        {        {
# Line 3444  for (;;) Line 3437  for (;;)
3437    
3438        for (i = 1; i <= min; i++)        for (i = 1; i <= min; i++)
3439          {          {
3440            pcre_uchar cc;
3441    
3442          if (eptr >= md->end_subject)          if (eptr >= md->end_subject)
3443            {            {
3444            SCHECK_PARTIAL();            SCHECK_PARTIAL();
3445            RRETURN(MATCH_NOMATCH);            RRETURN(MATCH_NOMATCH);
3446            }            }
3447          if (fc != *eptr && foc != *eptr) RRETURN(MATCH_NOMATCH);          cc = RAWUCHARTEST(eptr);
3448            if (fc != cc && foc != cc) RRETURN(MATCH_NOMATCH);
3449          eptr++;          eptr++;
3450          }          }
3451        if (min == max) continue;        if (min == max) continue;
# Line 3457  for (;;) Line 3453  for (;;)
3453          {          {
3454          for (fi = min;; fi++)          for (fi = min;; fi++)
3455            {            {
3456              pcre_uchar cc;
3457    
3458            RMATCH(eptr, ecode, offset_top, md, eptrb, RM24);            RMATCH(eptr, ecode, offset_top, md, eptrb, RM24);
3459            if (rrc != MATCH_NOMATCH) RRETURN(rrc);            if (rrc != MATCH_NOMATCH) RRETURN(rrc);
3460            if (fi >= max) RRETURN(MATCH_NOMATCH);            if (fi >= max) RRETURN(MATCH_NOMATCH);
# Line 3465  for (;;) Line 3463  for (;;)
3463              SCHECK_PARTIAL();              SCHECK_PARTIAL();
3464              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
3465              }              }
3466            if (fc != *eptr && foc != *eptr) RRETURN(MATCH_NOMATCH);            cc = RAWUCHARTEST(eptr);
3467              if (fc != cc && foc != cc) RRETURN(MATCH_NOMATCH);
3468            eptr++;            eptr++;
3469            }            }
3470          /* Control never gets here */          /* Control never gets here */
# Line 3475  for (;;) Line 3474  for (;;)
3474          pp = eptr;          pp = eptr;
3475          for (i = min; i < max; i++)          for (i = min; i < max; i++)
3476            {            {
3477              pcre_uchar cc;
3478    
3479            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
3480              {              {
3481              SCHECK_PARTIAL();              SCHECK_PARTIAL();
3482              break;              break;
3483              }              }
3484            if (fc != *eptr && foc != *eptr) break;            cc = RAWUCHARTEST(eptr);
3485              if (fc != cc && foc != cc) break;
3486            eptr++;            eptr++;
3487            }            }
3488    
# Line 3508  for (;;) Line 3510  for (;;)
3510            SCHECK_PARTIAL();            SCHECK_PARTIAL();
3511            RRETURN(MATCH_NOMATCH);            RRETURN(MATCH_NOMATCH);
3512            }            }
3513          if (fc != *eptr++) RRETURN(MATCH_NOMATCH);          if (fc != RAWUCHARINCTEST(eptr)) RRETURN(MATCH_NOMATCH);
3514          }          }
3515    
3516        if (min == max) continue;        if (min == max) continue;
# Line 3525  for (;;) Line 3527  for (;;)
3527              SCHECK_PARTIAL();              SCHECK_PARTIAL();
3528              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
3529              }              }
3530            if (fc != *eptr++) RRETURN(MATCH_NOMATCH);            if (fc != RAWUCHARINCTEST(eptr)) RRETURN(MATCH_NOMATCH);
3531            }            }
3532          /* Control never gets here */          /* Control never gets here */
3533          }          }
# Line 3539  for (;;) Line 3541  for (;;)
3541              SCHECK_PARTIAL();              SCHECK_PARTIAL();
3542              break;              break;
3543              }              }
3544            if (fc != *eptr) break;            if (fc != RAWUCHARTEST(eptr)) break;
3545            eptr++;            eptr++;
3546            }            }
3547          if (possessive) continue;          if (possessive) continue;
# Line 3568  for (;;) Line 3570  for (;;)
3570  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3571      if (utf)      if (utf)
3572        {        {
3573        register unsigned int ch, och;        register pcre_uint32 ch, och;
3574    
3575        ecode++;        ecode++;
3576        GETCHARINC(ch, ecode);        GETCHARINC(ch, ecode);
# Line 3595  for (;;) Line 3597  for (;;)
3597      else      else
3598  #endif  #endif
3599        {        {
3600        register unsigned int ch = ecode[1];        register pcre_uint32 ch = ecode[1];
3601        c = *eptr++;        c = *eptr++;
3602        if (ch == c || (op == OP_NOTI && TABLE_GET(ch, md->fcc, ch) == c))        if (ch == c || (op == OP_NOTI && TABLE_GET(ch, md->fcc, ch) == c))
3603          RRETURN(MATCH_NOMATCH);          RRETURN(MATCH_NOMATCH);
# Line 3690  for (;;) Line 3692  for (;;)
3692      characters and work backwards. */      characters and work backwards. */
3693    
3694      DPRINTF(("negative matching %c{%d,%d} against subject %.*s\n", fc, min, max,      DPRINTF(("negative matching %c{%d,%d} against subject %.*s\n", fc, min, max,
3695        max, eptr));        max, (char *)eptr));
3696    
3697      if (op >= OP_NOTSTARI)     /* Caseless */      if (op >= OP_NOTSTARI)     /* Caseless */
3698        {        {
# Line 3709  for (;;) Line 3711  for (;;)
3711  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3712        if (utf)        if (utf)
3713          {          {
3714          register unsigned int d;          register pcre_uint32 d;
3715          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
3716            {            {
3717            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
# Line 3744  for (;;) Line 3746  for (;;)
3746  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3747          if (utf)          if (utf)
3748            {            {
3749            register unsigned int d;            register pcre_uint32 d;
3750            for (fi = min;; fi++)            for (fi = min;; fi++)
3751              {              {
3752              RMATCH(eptr, ecode, offset_top, md, eptrb, RM28);              RMATCH(eptr, ecode, offset_top, md, eptrb, RM28);
# Line 3789  for (;;) Line 3791  for (;;)
3791  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3792          if (utf)          if (utf)
3793            {            {
3794            register unsigned int d;            register pcre_uint32 d;
3795            for (i = min; i < max; i++)            for (i = min; i < max; i++)
3796              {              {
3797              int len = 1;              int len = 1;
# Line 3846  for (;;) Line 3848  for (;;)
3848  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3849        if (utf)        if (utf)
3850          {          {
3851          register unsigned int d;          register pcre_uint32 d;
3852          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
3853            {            {
3854            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
# Line 3880  for (;;) Line 3882  for (;;)
3882  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3883          if (utf)          if (utf)
3884            {            {
3885            register unsigned int d;            register pcre_uint32 d;
3886            for (fi = min;; fi++)            for (fi = min;; fi++)
3887              {              {
3888              RMATCH(eptr, ecode, offset_top, md, eptrb, RM32);              RMATCH(eptr, ecode, offset_top, md, eptrb, RM32);
# Line 3924  for (;;) Line 3926  for (;;)
3926  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3927          if (utf)          if (utf)
3928            {            {
3929            register unsigned int d;            register pcre_uint32 d;
3930            for (i = min; i < max; i++)            for (i = min; i < max; i++)
3931              {              {
3932              int len = 1;              int len = 1;
# Line 4199  for (;;) Line 4201  for (;;)
4201                RRETURN(MATCH_NOMATCH);                RRETURN(MATCH_NOMATCH);
4202              }              }
4203            break;            break;
4204    
4205              case PT_CLIST:
4206              for (i = 1; i <= min; i++)
4207                {
4208                const pcre_uint32 *cp;
4209                if (eptr >= md->end_subject)
4210                  {
4211                  SCHECK_PARTIAL();
4212                  RRETURN(MATCH_NOMATCH);
4213                  }
4214                GETCHARINCTEST(c, eptr);
4215                cp = PRIV(ucd_caseless_sets) + UCD_CASESET(c);
4216                for (;;)
4217                  {
4218                  if (c < *cp)
4219                    { if (prop_fail_result) break; else { RRETURN(MATCH_NOMATCH); } }
4220                  if (c == *cp++)
4221                    { if (prop_fail_result) { RRETURN(MATCH_NOMATCH); } else break; }
4222                  }
4223                }
4224              break;
4225    
4226            /* This should not occur */            /* This should not occur */
4227    
4228            default:            default:
# Line 4219  for (;;) Line 4242  for (;;)
4242              SCHECK_PARTIAL();              SCHECK_PARTIAL();
4243              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4244              }              }
4245            GETCHARINCTEST(c, eptr);            else
           if (UCD_CATEGORY(c) == ucp_M) RRETURN(MATCH_NOMATCH);  
           while (eptr < md->end_subject)  
4246              {              {
4247              int len = 1;              int lgb, rgb;
4248              if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }              GETCHARINCTEST(c, eptr);
4249              if (UCD_CATEGORY(c) != ucp_M) break;              lgb = UCD_GRAPHBREAK(c);
4250              eptr += len;             while (eptr < md->end_subject)
4251                  {
4252                  int len = 1;
4253                  if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }
4254                  rgb = UCD_GRAPHBREAK(c);
4255                  if ((PRIV(ucp_gbtable)[lgb] & (1 << rgb)) == 0) break;
4256                  lgb = rgb;
4257                  eptr += len;
4258                  }
4259              }              }
4260            CHECK_PARTIAL();            CHECK_PARTIAL();
4261            }            }
4262          }          }
4263    
# Line 4252  for (;;) Line 4281  for (;;)
4281            if (md->partial != 0 &&            if (md->partial != 0 &&
4282                eptr + 1 >= md->end_subject &&                eptr + 1 >= md->end_subject &&
4283                NLBLOCK->nltype == NLTYPE_FIXED &&                NLBLOCK->nltype == NLTYPE_FIXED &&
4284                NLBLOCK->nllen == 2 &&                NLBLOCK->nllen == 2 &&
4285                *eptr == NLBLOCK->nl[0])                RAWUCHAR(eptr) == NLBLOCK->nl[0])
4286              {              {
4287              md->hitend = TRUE;              md->hitend = TRUE;
4288              if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);              if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
4289              }              }
# Line 4294  for (;;) Line 4323  for (;;)
4323              {              {
4324              default: RRETURN(MATCH_NOMATCH);              default: RRETURN(MATCH_NOMATCH);
4325    
4326              case 0x000d:              case CHAR_CR:
4327              if (eptr < md->end_subject && *eptr == 0x0a) eptr++;              if (eptr < md->end_subject && RAWUCHAR(eptr) == CHAR_LF) eptr++;
4328              break;              break;
4329    
4330              case 0x000a:              case CHAR_LF:
4331              break;              break;
4332    
4333              case 0x000b:              case CHAR_VT:
4334              case 0x000c:              case CHAR_FF:
4335              case 0x0085:              case CHAR_NEL:
4336    #ifndef EBCDIC
4337              case 0x2028:              case 0x2028:
4338              case 0x2029:              case 0x2029:
4339    #endif  /* Not EBCDIC */
4340              if (md->bsr_anycrlf) RRETURN(MATCH_NOMATCH);              if (md->bsr_anycrlf) RRETURN(MATCH_NOMATCH);
4341              break;              break;
4342              }              }
# Line 4323  for (;;) Line 4354  for (;;)
4354            GETCHARINC(c, eptr);            GETCHARINC(c, eptr);
4355            switch(c)            switch(c)
4356              {              {
4357                HSPACE_CASES: RRETURN(MATCH_NOMATCH);  /* Byte and multibyte cases */
4358              default: break;              default: break;
             case 0x09:      /* HT */  
             case 0x20:      /* SPACE */  
             case 0xa0:      /* NBSP */  
             case 0x1680:    /* OGHAM SPACE MARK */  
             case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
             case 0x2000:    /* EN QUAD */  
             case 0x2001:    /* EM QUAD */  
             case 0x2002:    /* EN SPACE */  
             case 0x2003:    /* EM SPACE */  
             case 0x2004:    /* THREE-PER-EM SPACE */  
             case 0x2005:    /* FOUR-PER-EM SPACE */  
             case 0x2006:    /* SIX-PER-EM SPACE */  
             case 0x2007:    /* FIGURE SPACE */  
             case 0x2008:    /* PUNCTUATION SPACE */  
             case 0x2009:    /* THIN SPACE */  
             case 0x200A:    /* HAIR SPACE */  
             case 0x202f:    /* NARROW NO-BREAK SPACE */  
             case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
             case 0x3000:    /* IDEOGRAPHIC SPACE */  
             RRETURN(MATCH_NOMATCH);  
4359              }              }
4360            }            }
4361          break;          break;
# Line 4359  for (;;) Line 4371  for (;;)
4371            GETCHARINC(c, eptr);            GETCHARINC(c, eptr);
4372            switch(c)            switch(c)
4373              {              {
4374                HSPACE_CASES: break;  /* Byte and multibyte cases */
4375              default: RRETURN(MATCH_NOMATCH);              default: RRETURN(MATCH_NOMATCH);
             case 0x09:      /* HT */  
             case 0x20:      /* SPACE */  
             case 0xa0:      /* NBSP */  
             case 0x1680:    /* OGHAM SPACE MARK */  
             case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
             case 0x2000:    /* EN QUAD */  
             case 0x2001:    /* EM QUAD */  
             case 0x2002:    /* EN SPACE */  
             case 0x2003:    /* EM SPACE */  
             case 0x2004:    /* THREE-PER-EM SPACE */  
             case 0x2005:    /* FOUR-PER-EM SPACE */  
             case 0x2006:    /* SIX-PER-EM SPACE */  
             case 0x2007:    /* FIGURE SPACE */  
             case 0x2008:    /* PUNCTUATION SPACE */  
             case 0x2009:    /* THIN SPACE */  
             case 0x200A:    /* HAIR SPACE */  
             case 0x202f:    /* NARROW NO-BREAK SPACE */  
             case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
             case 0x3000:    /* IDEOGRAPHIC SPACE */  
             break;  
4376              }              }
4377            }            }
4378          break;          break;
# Line 4395  for (;;) Line 4388  for (;;)
4388            GETCHARINC(c, eptr);            GETCHARINC(c, eptr);
4389            switch(c)            switch(c)
4390              {              {
4391                VSPACE_CASES: RRETURN(MATCH_NOMATCH);
4392              default: break;              default: break;
             case 0x0a:      /* LF */  
             case 0x0b:      /* VT */  
             case 0x0c:      /* FF */  
             case 0x0d:      /* CR */  
             case 0x85:      /* NEL */  
             case 0x2028:    /* LINE SEPARATOR */  
             case 0x2029:    /* PARAGRAPH SEPARATOR */  
             RRETURN(MATCH_NOMATCH);  
4393              }              }
4394            }            }
4395          break;          break;
# Line 4419  for (;;) Line 4405  for (;;)
4405            GETCHARINC(c, eptr);            GETCHARINC(c, eptr);
4406            switch(c)            switch(c)
4407              {              {
4408                VSPACE_CASES: break;
4409              default: RRETURN(MATCH_NOMATCH);              default: RRETURN(MATCH_NOMATCH);
             case 0x0a:      /* LF */  
             case 0x0b:      /* VT */  
             case 0x0c:      /* FF */  
             case 0x0d:      /* CR */  
             case 0x85:      /* NEL */  
             case 0x2028:    /* LINE SEPARATOR */  
             case 0x2029:    /* PARAGRAPH SEPARATOR */  
             break;  
4410              }              }
4411            }            }
4412          break;          break;
# Line 4449  for (;;) Line 4428  for (;;)
4428          case OP_DIGIT:          case OP_DIGIT:
4429          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
4430            {            {
4431              pcre_uchar cc;
4432    
4433            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
4434              {              {
4435              SCHECK_PARTIAL();              SCHECK_PARTIAL();
4436              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4437              }              }
4438            if (*eptr >= 128 || (md->ctypes[*eptr] & ctype_digit) == 0)            cc = RAWUCHAR(eptr);
4439              if (cc >= 128 || (md->ctypes[cc] & ctype_digit) == 0)
4440              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4441            eptr++;            eptr++;
4442            /* No need to skip more bytes - we know it's a 1-byte character */            /* No need to skip more bytes - we know it's a 1-byte character */
# Line 4464  for (;;) Line 4446  for (;;)
4446          case OP_NOT_WHITESPACE:          case OP_NOT_WHITESPACE:
4447          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
4448            {            {
4449              pcre_uchar cc;
4450    
4451            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
4452              {              {
4453              SCHECK_PARTIAL();              SCHECK_PARTIAL();
4454              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4455              }              }
4456            if (*eptr < 128 && (md->ctypes[*eptr] & ctype_space) != 0)            cc = RAWUCHAR(eptr);
4457              if (cc < 128 && (md->ctypes[cc] & ctype_space) != 0)
4458              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4459            eptr++;            eptr++;
4460            ACROSSCHAR(eptr < md->end_subject, *eptr, eptr++);            ACROSSCHAR(eptr < md->end_subject, *eptr, eptr++);
# Line 4479  for (;;) Line 4464  for (;;)
4464          case OP_WHITESPACE:          case OP_WHITESPACE:
4465          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
4466            {            {
4467              pcre_uchar cc;
4468    
4469            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
4470              {              {
4471              SCHECK_PARTIAL();              SCHECK_PARTIAL();
4472              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4473              }              }
4474            if (*eptr >= 128 || (md->ctypes[*eptr] & ctype_space) == 0)            cc = RAWUCHAR(eptr);
4475              if (cc >= 128 || (md->ctypes[cc] & ctype_space) == 0)
4476              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4477            eptr++;            eptr++;
4478            /* No need to skip more bytes - we know it's a 1-byte character */            /* No need to skip more bytes - we know it's a 1-byte character */
# Line 4494  for (;;) Line 4482  for (;;)
4482          case OP_NOT_WORDCHAR:          case OP_NOT_WORDCHAR:
4483          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
4484            {            {
4485              pcre_uchar cc;
4486    
4487            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
4488              {              {
4489              SCHECK_PARTIAL();              SCHECK_PARTIAL();
4490              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4491              }              }
4492            if (*eptr < 128 && (md->ctypes[*eptr] & ctype_word) != 0)            cc = RAWUCHAR(eptr);
4493              if (cc < 128 && (md->ctypes[cc] & ctype_word) != 0)
4494              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4495            eptr++;            eptr++;
4496            ACROSSCHAR(eptr < md->end_subject, *eptr, eptr++);            ACROSSCHAR(eptr < md->end_subject, *eptr, eptr++);
# Line 4509  for (;;) Line 4500  for (;;)
4500          case OP_WORDCHAR:          case OP_WORDCHAR:
4501          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
4502            {            {
4503              pcre_uchar cc;
4504    
4505            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
4506              {              {
4507              SCHECK_PARTIAL();              SCHECK_PARTIAL();
4508              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4509              }              }
4510            if (*eptr >= 128 || (md->ctypes[*eptr] & ctype_word) == 0)            cc = RAWUCHAR(eptr);
4511              if (cc >= 128 || (md->ctypes[cc] & ctype_word) == 0)
4512              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4513            eptr++;            eptr++;
4514            /* No need to skip more bytes - we know it's a 1-byte character */            /* No need to skip more bytes - we know it's a 1-byte character */
# Line 4545  for (;;) Line 4539  for (;;)
4539            if (md->partial != 0 &&            if (md->partial != 0 &&
4540                eptr + 1 >= md->end_subject &&                eptr + 1 >= md->end_subject &&
4541                NLBLOCK->nltype == NLTYPE_FIXED &&                NLBLOCK->nltype == NLTYPE_FIXED &&
4542                NLBLOCK->nllen == 2 &&                NLBLOCK->nllen == 2 &&
4543                *eptr == NLBLOCK->nl[0])                *eptr == NLBLOCK->nl[0])
4544              {              {
4545              md->hitend = TRUE;              md->hitend = TRUE;
4546              if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);              if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
4547              }              }
# Line 4585  for (;;) Line 4579  for (;;)
4579              {              {
4580              default: RRETURN(MATCH_NOMATCH);              default: RRETURN(MATCH_NOMATCH);
4581    
4582              case 0x000d:              case CHAR_CR:
4583              if (eptr < md->end_subject && *eptr == 0x0a) eptr++;              if (eptr < md->end_subject && *eptr == CHAR_LF) eptr++;
4584              break;              break;
4585    
4586              case 0x000a:              case CHAR_LF:
4587              break;              break;
4588    
4589              case 0x000b:              case CHAR_VT:
4590              case 0x000c:              case CHAR_FF:
4591              case 0x0085:              case CHAR_NEL:
4592  #ifdef COMPILE_PCRE16  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
4593              case 0x2028:              case 0x2028:
4594              case 0x2029:              case 0x2029:
4595  #endif  #endif
# Line 4616  for (;;) Line 4610  for (;;)
4610            switch(*eptr++)            switch(*eptr++)
4611              {              {
4612              default: break;              default: break;
4613              case 0x09:      /* HT */              HSPACE_BYTE_CASES:
4614              case 0x20:      /* SPACE */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
4615              case 0xa0:      /* NBSP */              HSPACE_MULTIBYTE_CASES:
 #ifdef COMPILE_PCRE16  
             case 0x1680:    /* OGHAM SPACE MARK */  
             case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
             case 0x2000:    /* EN QUAD */  
             case 0x2001:    /* EM QUAD */  
             case 0x2002:    /* EN SPACE */  
             case 0x2003:    /* EM SPACE */  
             case 0x2004:    /* THREE-PER-EM SPACE */  
             case 0x2005:    /* FOUR-PER-EM SPACE */  
             case 0x2006:    /* SIX-PER-EM SPACE */  
             case 0x2007:    /* FIGURE SPACE */  
             case 0x2008:    /* PUNCTUATION SPACE */  
             case 0x2009:    /* THIN SPACE */  
             case 0x200A:    /* HAIR SPACE */  
             case 0x202f:    /* NARROW NO-BREAK SPACE */  
             case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
             case 0x3000:    /* IDEOGRAPHIC SPACE */  
4616  #endif  #endif
4617              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4618              }              }
# Line 4653  for (;;) Line 4630  for (;;)
4630            switch(*eptr++)            switch(*eptr++)
4631              {              {
4632              default: RRETURN(MATCH_NOMATCH);              default: RRETURN(MATCH_NOMATCH);
4633              case 0x09:      /* HT */              HSPACE_BYTE_CASES:
4634              case 0x20:      /* SPACE */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
4635              case 0xa0:      /* NBSP */              HSPACE_MULTIBYTE_CASES:
 #ifdef COMPILE_PCRE16  
             case 0x1680:    /* OGHAM SPACE MARK */  
             case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
             case 0x2000:    /* EN QUAD */  
             case 0x2001:    /* EM QUAD */  
             case 0x2002:    /* EN SPACE */  
             case 0x2003:    /* EM SPACE */  
             case 0x2004:    /* THREE-PER-EM SPACE */  
             case 0x2005:    /* FOUR-PER-EM SPACE */  
             case 0x2006:    /* SIX-PER-EM SPACE */  
             case 0x2007:    /* FIGURE SPACE */  
             case 0x2008:    /* PUNCTUATION SPACE */  
             case 0x2009:    /* THIN SPACE */  
             case 0x200A:    /* HAIR SPACE */  
             case 0x202f:    /* NARROW NO-BREAK SPACE */  
             case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
             case 0x3000:    /* IDEOGRAPHIC SPACE */  
4636  #endif  #endif
4637              break;              break;
4638              }              }
# Line 4689  for (;;) Line 4649  for (;;)
4649              }              }
4650            switch(*eptr++)            switch(*eptr++)
4651              {              {
4652              default: break;              VSPACE_BYTE_CASES:
4653              case 0x0a:      /* LF */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
4654              case 0x0b:      /* VT */              VSPACE_MULTIBYTE_CASES:
             case 0x0c:      /* FF */  
             case 0x0d:      /* CR */  
             case 0x85:      /* NEL */  
 #ifdef COMPILE_PCRE16  
             case 0x2028:    /* LINE SEPARATOR */  
             case 0x2029:    /* PARAGRAPH SEPARATOR */  
4655  #endif  #endif
4656              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4657                default: break;
4658              }              }
4659            }            }
4660          break;          break;
# Line 4715  for (;;) Line 4670  for (;;)
4670            switch(*eptr++)            switch(*eptr++)
4671              {              {
4672              default: RRETURN(MATCH_NOMATCH);              default: RRETURN(MATCH_NOMATCH);
4673              case 0x0a:      /* LF */              VSPACE_BYTE_CASES:
4674              case 0x0b:      /* VT */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
4675              case 0x0c:      /* FF */              VSPACE_MULTIBYTE_CASES:
             case 0x0d:      /* CR */  
             case 0x85:      /* NEL */  
 #ifdef COMPILE_PCRE16  
             case 0x2028:    /* LINE SEPARATOR */  
             case 0x2029:    /* PARAGRAPH SEPARATOR */  
4676  #endif  #endif
4677              break;              break;
4678              }              }
# Line 5000  for (;;) Line 4950  for (;;)
4950              }              }
4951            /* Control never gets here */            /* Control never gets here */
4952    
4953            /* This should never occur */            case PT_CLIST:
4954              for (fi = min;; fi++)
4955                {
4956                const pcre_uint32 *cp;
4957                RMATCH(eptr, ecode, offset_top, md, eptrb, RM62);
4958                if (rrc != MATCH_NOMATCH) RRETURN(rrc);
4959                if (fi >= max) RRETURN(MATCH_NOMATCH);
4960                if (eptr >= md->end_subject)
4961                  {
4962                  SCHECK_PARTIAL();
4963                  RRETURN(MATCH_NOMATCH);
4964                  }
4965                GETCHARINCTEST(c, eptr);
4966                cp = PRIV(ucd_caseless_sets) + UCD_CASESET(c);
4967                for (;;)
4968                  {
4969                  if (c < *cp)
4970                    { if (prop_fail_result) break; else { RRETURN(MATCH_NOMATCH); } }
4971                  if (c == *cp++)
4972                    { if (prop_fail_result) { RRETURN(MATCH_NOMATCH); } else break; }
4973                  }
4974                }
4975              /* Control never gets here */
4976    
4977              /* This should never occur */
4978            default:            default:
4979            RRETURN(PCRE_ERROR_INTERNAL);            RRETURN(PCRE_ERROR_INTERNAL);
4980            }            }
# Line 5022  for (;;) Line 4995  for (;;)
4995              SCHECK_PARTIAL();              SCHECK_PARTIAL();
4996              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4997              }              }
4998            GETCHARINCTEST(c, eptr);            else
           if (UCD_CATEGORY(c) == ucp_M) RRETURN(MATCH_NOMATCH);  
           while (eptr < md->end_subject)  
4999              {              {
5000              int len = 1;              int lgb, rgb;
5001              if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }              GETCHARINCTEST(c, eptr);
5002              if (UCD_CATEGORY(c) != ucp_M) break;              lgb = UCD_GRAPHBREAK(c);
5003              eptr += len;              while (eptr < md->end_subject)
5004                  {
5005                  int len = 1;
5006                  if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }
5007                  rgb = UCD_GRAPHBREAK(c);
5008                  if ((PRIV(ucp_gbtable)[lgb] & (1 << rgb)) == 0) break;
5009                  lgb = rgb;
5010                  eptr += len;
5011                  }
5012              }              }
5013            CHECK_PARTIAL();            CHECK_PARTIAL();
5014            }            }
5015          }          }
5016        else        else
# Line 5059  for (;;) Line 5038  for (;;)
5038              if (md->partial != 0 &&    /* Take care with CRLF partial */              if (md->partial != 0 &&    /* Take care with CRLF partial */
5039                  eptr >= md->end_subject &&                  eptr >= md->end_subject &&
5040                  NLBLOCK->nltype == NLTYPE_FIXED &&                  NLBLOCK->nltype == NLTYPE_FIXED &&
5041                  NLBLOCK->nllen == 2 &&                  NLBLOCK->nllen == 2 &&
5042                  c == NLBLOCK->nl[0])                  c == NLBLOCK->nl[0])
5043                {                {
5044                md->hitend = TRUE;                md->hitend = TRUE;
5045                if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);                if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
5046                }                }
5047              break;              break;
5048    
5049              case OP_ALLANY:              case OP_ALLANY:
5050              case OP_ANYBYTE:              case OP_ANYBYTE:
5051              break;              break;
# Line 5075  for (;;) Line 5054  for (;;)
5054              switch(c)              switch(c)
5055                {                {
5056                default: RRETURN(MATCH_NOMATCH);                default: RRETURN(MATCH_NOMATCH);
5057                case 0x000d:                case CHAR_CR:
5058                if (eptr < md->end_subject && *eptr == 0x0a) eptr++;                if (eptr < md->end_subject && RAWUCHAR(eptr) == CHAR_LF) eptr++;
5059                break;                break;
5060                case 0x000a:  
5061                  case CHAR_LF:
5062                break;                break;
5063    
5064                case 0x000b:                case CHAR_VT:
5065                case 0x000c:                case CHAR_FF:
5066                case 0x0085:                case CHAR_NEL:
5067    #ifndef EBCDIC
5068                case 0x2028:                case 0x2028:
5069                case 0x2029:                case 0x2029:
5070    #endif  /* Not EBCDIC */
5071                if (md->bsr_anycrlf) RRETURN(MATCH_NOMATCH);                if (md->bsr_anycrlf) RRETURN(MATCH_NOMATCH);
5072                break;                break;
5073                }                }
# Line 5094  for (;;) Line 5076  for (;;)
5076              case OP_NOT_HSPACE:              case OP_NOT_HSPACE:
5077              switch(c)              switch(c)
5078                {                {
5079                  HSPACE_CASES: RRETURN(MATCH_NOMATCH);
5080                default: break;                default: break;
               case 0x09:      /* HT */  
               case 0x20:      /* SPACE */  
               case 0xa0:      /* NBSP */  
               case 0x1680:    /* OGHAM SPACE MARK */  
               case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
               case 0x2000:    /* EN QUAD */  
               case 0x2001:    /* EM QUAD */  
               case 0x2002:    /* EN SPACE */  
               case 0x2003:    /* EM SPACE */  
               case 0x2004:    /* THREE-PER-EM SPACE */  
               case 0x2005:    /* FOUR-PER-EM SPACE */  
               case 0x2006:    /* SIX-PER-EM SPACE */  
               case 0x2007:    /* FIGURE SPACE */  
               case 0x2008:    /* PUNCTUATION SPACE */  
               case 0x2009:    /* THIN SPACE */  
               case 0x200A:    /* HAIR SPACE */  
               case 0x202f:    /* NARROW NO-BREAK SPACE */  
               case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
               case 0x3000:    /* IDEOGRAPHIC SPACE */  
               RRETURN(MATCH_NOMATCH);  
5081                }                }
5082              break;              break;
5083    
5084              case OP_HSPACE:              case OP_HSPACE:
5085              switch(c)              switch(c)
5086                {                {
5087                  HSPACE_CASES: break;
5088                default: RRETURN(MATCH_NOMATCH);                default: RRETURN(MATCH_NOMATCH);
               case 0x09:      /* HT */  
               case 0x20:      /* SPACE */  
               case 0xa0:      /* NBSP */  
               case 0x1680:    /* OGHAM SPACE MARK */  
               case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
               case 0x2000:    /* EN QUAD */  
               case 0x2001:    /* EM QUAD */  
               case 0x2002:    /* EN SPACE */  
               case 0x2003:    /* EM SPACE */  
               case 0x2004:    /* THREE-PER-EM SPACE */  
               case 0x2005:    /* FOUR-PER-EM SPACE */  
               case 0x2006:    /* SIX-PER-EM SPACE */  
               case 0x2007:    /* FIGURE SPACE */  
               case 0x2008:    /* PUNCTUATION SPACE */  
               case 0x2009:    /* THIN SPACE */  
               case 0x200A:    /* HAIR SPACE */  
               case 0x202f:    /* NARROW NO-BREAK SPACE */  
               case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
               case 0x3000:    /* IDEOGRAPHIC SPACE */  
               break;  
5089                }                }
5090              break;              break;
5091    
5092              case OP_NOT_VSPACE:              case OP_NOT_VSPACE:
5093              switch(c)              switch(c)
5094                {                {
5095                  VSPACE_CASES: RRETURN(MATCH_NOMATCH);
5096                default: break;                default: break;
               case 0x0a:      /* LF */  
               case 0x0b:      /* VT */  
               case 0x0c:      /* FF */  
               case 0x0d:      /* CR */  
               case 0x85:      /* NEL */  
               case 0x2028:    /* LINE SEPARATOR */  
               case 0x2029:    /* PARAGRAPH SEPARATOR */  
               RRETURN(MATCH_NOMATCH);  
5097                }                }
5098              break;              break;
5099    
5100              case OP_VSPACE:              case OP_VSPACE:
5101              switch(c)              switch(c)
5102                {                {
5103                  VSPACE_CASES: break;
5104                default: RRETURN(MATCH_NOMATCH);                default: RRETURN(MATCH_NOMATCH);
               case 0x0a:      /* LF */  
               case 0x0b:      /* VT */  
               case 0x0c:      /* FF */  
               case 0x0d:      /* CR */  
               case 0x85:      /* NEL */  
               case 0x2028:    /* LINE SEPARATOR */  
               case 0x2029:    /* PARAGRAPH SEPARATOR */  
               break;  
5105                }                }
5106              break;              break;
5107    
# Line 5233  for (;;) Line 5163  for (;;)
5163              if (md->partial != 0 &&    /* Take care with CRLF partial */              if (md->partial != 0 &&    /* Take care with CRLF partial */
5164                  eptr >= md->end_subject &&                  eptr >= md->end_subject &&
5165                  NLBLOCK->nltype == NLTYPE_FIXED &&                  NLBLOCK->nltype == NLTYPE_FIXED &&
5166                  NLBLOCK->nllen == 2 &&                  NLBLOCK->nllen == 2 &&
5167                  c == NLBLOCK->nl[0])                  c == NLBLOCK->nl[0])
5168                {                {
5169                md->hitend = TRUE;                md->hitend = TRUE;
5170                if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);                if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
5171                }                }
5172              break;              break;
5173    
5174              case OP_ALLANY:              case OP_ALLANY:
5175              case OP_ANYBYTE:              case OP_ANYBYTE:
5176              break;              break;
# Line 5249  for (;;) Line 5179  for (;;)
5179              switch(c)              switch(c)
5180                {                {
5181                default: RRETURN(MATCH_NOMATCH);                default: RRETURN(MATCH_NOMATCH);
5182                case 0x000d:                case CHAR_CR:
5183                if (eptr < md->end_subject && *eptr == 0x0a) eptr++;                if (eptr < md->end_subject && *eptr == CHAR_LF) eptr++;
5184                break;                break;
5185    
5186                case 0x000a:                case CHAR_LF:
5187                break;                break;
5188    
5189                case 0x000b:                case CHAR_VT:
5190                case 0x000c:                case CHAR_FF:
5191                case 0x0085:                case CHAR_NEL:
5192  #ifdef COMPILE_PCRE16  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5193                case 0x2028:                case 0x2028:
5194                case 0x2029:                case 0x2029:
5195  #endif  #endif
# Line 5272  for (;;) Line 5202  for (;;)
5202              switch(c)              switch(c)
5203                {                {
5204                default: break;                default: break;
5205                case 0x09:      /* HT */                HSPACE_BYTE_CASES:
5206                case 0x20:      /* SPACE */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5207                case 0xa0:      /* NBSP */                HSPACE_MULTIBYTE_CASES:
 #ifdef COMPILE_PCRE16  
               case 0x1680:    /* OGHAM SPACE MARK */  
               case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
               case 0x2000:    /* EN QUAD */  
               case 0x2001:    /* EM QUAD */  
               case 0x2002:    /* EN SPACE */  
               case 0x2003:    /* EM SPACE */  
               case 0x2004:    /* THREE-PER-EM SPACE */  
               case 0x2005:    /* FOUR-PER-EM SPACE */  
               case 0x2006:    /* SIX-PER-EM SPACE */  
               case 0x2007:    /* FIGURE SPACE */  
               case 0x2008:    /* PUNCTUATION SPACE */  
               case 0x2009:    /* THIN SPACE */  
               case 0x200A:    /* HAIR SPACE */  
               case 0x202f:    /* NARROW NO-BREAK SPACE */  
               case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
               case 0x3000:    /* IDEOGRAPHIC SPACE */  
5208  #endif  #endif
5209                RRETURN(MATCH_NOMATCH);                RRETURN(MATCH_NOMATCH);
5210                }                }
# Line 5301  for (;;) Line 5214  for (;;)
5214              switch(c)              switch(c)
5215                {                {
5216                default: RRETURN(MATCH_NOMATCH);                default: RRETURN(MATCH_NOMATCH);
5217                case 0x09:      /* HT */                HSPACE_BYTE_CASES:
5218                case 0x20:      /* SPACE */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5219                case 0xa0:      /* NBSP */                HSPACE_MULTIBYTE_CASES:
 #ifdef COMPILE_PCRE16  
               case 0x1680:    /* OGHAM SPACE MARK */  
               case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
               case 0x2000:    /* EN QUAD */  
               case 0x2001:    /* EM QUAD */  
               case 0x2002:    /* EN SPACE */  
               case 0x2003:    /* EM SPACE */  
               case 0x2004:    /* THREE-PER-EM SPACE */  
               case 0x2005:    /* FOUR-PER-EM SPACE */  
               case 0x2006:    /* SIX-PER-EM SPACE */  
               case 0x2007:    /* FIGURE SPACE */  
               case 0x2008:    /* PUNCTUATION SPACE */  
               case 0x2009:    /* THIN SPACE */  
               case 0x200A:    /* HAIR SPACE */  
               case 0x202f:    /* NARROW NO-BREAK SPACE */  
               case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
               case 0x3000:    /* IDEOGRAPHIC SPACE */  
5220  #endif  #endif
5221                break;                break;
5222                }                }
# Line 5330  for (;;) Line 5226  for (;;)
5226              switch(c)              switch(c)
5227                {                {
5228                default: break;                default: break;
5229                case 0x0a:      /* LF */                VSPACE_BYTE_CASES:
5230                case 0x0b:      /* VT */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5231                case 0x0c:      /* FF */                VSPACE_MULTIBYTE_CASES:
               case 0x0d:      /* CR */  
               case 0x85:      /* NEL */  
 #ifdef COMPILE_PCRE16  
               case 0x2028:    /* LINE SEPARATOR */  
               case 0x2029:    /* PARAGRAPH SEPARATOR */  
5232  #endif  #endif
5233                RRETURN(MATCH_NOMATCH);                RRETURN(MATCH_NOMATCH);
5234                }                }
# Line 5347  for (;;) Line 5238  for (;;)
5238              switch(c)              switch(c)
5239                {                {
5240                default: RRETURN(MATCH_NOMATCH);                default: RRETURN(MATCH_NOMATCH);
5241                case 0x0a:      /* LF */                VSPACE_BYTE_CASES:
5242                case 0x0b:      /* VT */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5243                case 0x0c:      /* FF */                VSPACE_MULTIBYTE_CASES:
               case 0x0d:      /* CR */  
               case 0x85:      /* NEL */  
 #ifdef COMPILE_PCRE16  
               case 0x2028:    /* LINE SEPARATOR */  
               case 0x2029:    /* PARAGRAPH SEPARATOR */  
5244  #endif  #endif
5245                break;                break;
5246                }                }
# Line 5557  for (;;) Line 5443  for (;;)
5443              eptr+= len;              eptr+= len;
5444              }              }
5445            break;            break;
5446    
5447              case PT_CLIST:
5448              for (i = min; i < max; i++)
5449                {
5450                const pcre_uint32 *cp;
5451                int len = 1;
5452                if (eptr >= md->end_subject)
5453                  {
5454                  SCHECK_PARTIAL();
5455                  break;
5456                  }
5457                GETCHARLENTEST(c, eptr, len);
5458                cp = PRIV(ucd_caseless_sets) + UCD_CASESET(c);
5459                for (;;)
5460                  {
5461                  if (c < *cp)
5462                    { if (prop_fail_result) break; else goto GOT_MAX; }
5463                  if (c == *cp++)
5464                    { if (prop_fail_result) goto GOT_MAX; else break; }
5465                  }
5466                eptr += len;
5467                }
5468              GOT_MAX:
5469              break;
5470    
5471            default:            default:
5472            RRETURN(PCRE_ERROR_INTERNAL);            RRETURN(PCRE_ERROR_INTERNAL);
# Line 5581  for (;;) Line 5491  for (;;)
5491          {          {
5492          for (i = min; i < max; i++)          for (i = min; i < max; i++)
5493            {            {
           int len = 1;  
5494            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
5495              {              {
5496              SCHECK_PARTIAL();              SCHECK_PARTIAL();
5497              break;              break;
5498              }              }
5499            if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }            else
           if (UCD_CATEGORY(c) == ucp_M) break;  
           eptr += len;  
           while (eptr < md->end_subject)  
5500              {              {
5501              len = 1;              int lgb, rgb;
5502              if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }              GETCHARINCTEST(c, eptr);
5503              if (UCD_CATEGORY(c) != ucp_M) break;              lgb = UCD_GRAPHBREAK(c);
5504              eptr += len;              while (eptr < md->end_subject)
5505                  {
5506                  int len = 1;
5507                  if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }
5508                  rgb = UCD_GRAPHBREAK(c);
5509                  if ((PRIV(ucp_gbtable)[lgb] & (1 << rgb)) == 0) break;
5510                  lgb = rgb;
5511                  eptr += len;
5512                  }
5513              }              }
5514            CHECK_PARTIAL();            CHECK_PARTIAL();
5515            }            }
5516    
5517          /* eptr is now past the end of the maximum run */          /* eptr is now past the end of the maximum run */
# Line 5644  for (;;) Line 5558  for (;;)
5558                if (md->partial != 0 &&    /* Take care with CRLF partial */                if (md->partial != 0 &&    /* Take care with CRLF partial */
5559                    eptr + 1 >= md->end_subject &&                    eptr + 1 >= md->end_subject &&
5560                    NLBLOCK->nltype == NLTYPE_FIXED &&                    NLBLOCK->nltype == NLTYPE_FIXED &&
5561                    NLBLOCK->nllen == 2 &&                    NLBLOCK->nllen == 2 &&
5562                    *eptr == NLBLOCK->nl[0])                    RAWUCHAR(eptr) == NLBLOCK->nl[0])
5563                  {                  {
5564                  md->hitend = TRUE;                  md->hitend = TRUE;
5565                  if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);                  if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
5566                  }                  }
# Line 5670  for (;;) Line 5584  for (;;)
5584                if (md->partial != 0 &&    /* Take care with CRLF partial */                if (md->partial != 0 &&    /* Take care with CRLF partial */
5585                    eptr + 1 >= md->end_subject &&                    eptr + 1 >= md->end_subject &&
5586                    NLBLOCK->nltype == NLTYPE_FIXED &&                    NLBLOCK->nltype == NLTYPE_FIXED &&
5587                    NLBLOCK->nllen == 2 &&                    NLBLOCK->nllen == 2 &&
5588                    *eptr == NLBLOCK->nl[0])                    RAWUCHAR(eptr) == NLBLOCK->nl[0])
5589                  {                  {
5590                  md->hitend = TRUE;                  md->hitend = TRUE;
5591                  if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);                  if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
5592                  }                  }
# Line 5725  for (;;) Line 5639  for (;;)
5639                break;                break;
5640                }                }
5641              GETCHARLEN(c, eptr, len);              GETCHARLEN(c, eptr, len);
5642              if (c == 0x000d)              if (c == CHAR_CR)
5643                {                {
5644                if (++eptr >= md->end_subject) break;                if (++eptr >= md->end_subject) break;
5645                if (*eptr == 0x000a) eptr++;                if (RAWUCHAR(eptr) == CHAR_LF) eptr++;
5646                }                }
5647              else              else
5648                {                {
5649                if (c != 0x000a &&                if (c != CHAR_LF &&
5650                    (md->bsr_anycrlf ||                    (md->bsr_anycrlf ||
5651                     (c != 0x000b && c != 0x000c &&                     (c != CHAR_VT && c != CHAR_FF && c != CHAR_NEL
5652                      c != 0x0085 && c != 0x2028 && c != 0x2029)))  #ifndef EBCDIC
5653                        && c != 0x2028 && c != 0x2029
5654    #endif  /* Not EBCDIC */
5655                        )))
5656                  break;                  break;
5657                eptr += len;                eptr += len;
5658                }                }
# Line 5756  for (;;) Line 5673  for (;;)
5673              GETCHARLEN(c, eptr, len);              GETCHARLEN(c, eptr, len);
5674              switch(c)              switch(c)
5675                {                {
5676                  HSPACE_CASES: gotspace = TRUE; break;
5677                default: gotspace = FALSE; break;                default: gotspace = FALSE; break;
               case 0x09:      /* HT */  
               case 0x20:      /* SPACE */  
               case 0xa0:      /* NBSP */  
               case 0x1680:    /* OGHAM SPACE MARK */  
               case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
               case 0x2000:    /* EN QUAD */  
               case 0x2001:    /* EM QUAD */  
               case 0x2002:    /* EN SPACE */  
               case 0x2003:    /* EM SPACE */  
               case 0x2004:    /* THREE-PER-EM SPACE */  
               case 0x2005:    /* FOUR-PER-EM SPACE */  
               case 0x2006:    /* SIX-PER-EM SPACE */  
               case 0x2007:    /* FIGURE SPACE */  
               case 0x2008:    /* PUNCTUATION SPACE */  
               case 0x2009:    /* THIN SPACE */  
               case 0x200A:    /* HAIR SPACE */  
               case 0x202f:    /* NARROW NO-BREAK SPACE */  
               case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
               case 0x3000:    /* IDEOGRAPHIC SPACE */  
               gotspace = TRUE;  
               break;  
5678                }                }
5679              if (gotspace == (ctype == OP_NOT_HSPACE)) break;              if (gotspace == (ctype == OP_NOT_HSPACE)) break;
5680              eptr += len;              eptr += len;
# Line 5798  for (;;) Line 5695  for (;;)
5695              GETCHARLEN(c, eptr, len);              GETCHARLEN(c, eptr, len);
5696              switch(c)              switch(c)
5697                {                {
5698                  VSPACE_CASES: gotspace = TRUE; break;
5699                default: gotspace = FALSE; break;                default: gotspace = FALSE; break;
               case 0x0a:      /* LF */  
               case 0x0b:      /* VT */  
               case 0x0c:      /* FF */  
               case 0x0d:      /* CR */  
               case 0x85:      /* NEL */  
               case 0x2028:    /* LINE SEPARATOR */  
               case 0x2029:    /* PARAGRAPH SEPARATOR */  
               gotspace = TRUE;  
               break;  
5700                }                }
5701              if (gotspace == (ctype == OP_NOT_VSPACE)) break;              if (gotspace == (ctype == OP_NOT_VSPACE)) break;
5702              eptr += len;              eptr += len;
# Line 5921  for (;;) Line 5810  for (;;)
5810            if (rrc != MATCH_NOMATCH) RRETURN(rrc);            if (rrc != MATCH_NOMATCH) RRETURN(rrc);
5811            if (eptr-- == pp) break;        /* Stop if tried at original pos */            if (eptr-- == pp) break;        /* Stop if tried at original pos */
5812            BACKCHAR(eptr);            BACKCHAR(eptr);
5813            if (ctype == OP_ANYNL && eptr > pp  && *eptr == '\n' &&            if (ctype == OP_ANYNL && eptr > pp  && RAWUCHAR(eptr) == CHAR_NL &&
5814                eptr[-1] == '\r') eptr--;                RAWUCHAR(eptr - 1) == CHAR_CR) eptr--;
5815            }            }
5816          }          }
5817        else        else
# Line 5943  for (;;) Line 5832  for (;;)
5832              if (md->partial != 0 &&    /* Take care with CRLF partial */              if (md->partial != 0 &&    /* Take care with CRLF partial */
5833                  eptr + 1 >= md->end_subject &&                  eptr + 1 >= md->end_subject &&
5834                  NLBLOCK->nltype == NLTYPE_FIXED &&                  NLBLOCK->nltype == NLTYPE_FIXED &&
5835                  NLBLOCK->nllen == 2 &&                  NLBLOCK->nllen == 2 &&
5836                  *eptr == NLBLOCK->nl[0])                  *eptr == NLBLOCK->nl[0])
5837                {                {
5838                md->hitend = TRUE;                md->hitend = TRUE;
5839                if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);                if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
5840                }                }
# Line 5973  for (;;) Line 5862  for (;;)
5862                break;                break;
5863                }                }
5864              c = *eptr;              c = *eptr;
5865              if (c == 0x000d)              if (c == CHAR_CR)
5866                {                {
5867                if (++eptr >= md->end_subject) break;                if (++eptr >= md->end_subject) break;
5868                if (*eptr == 0x000a) eptr++;                if (*eptr == CHAR_LF) eptr++;
5869                }                }
5870              else              else
5871                {                {
5872                if (c != 0x000a && (md->bsr_anycrlf ||                if (c != CHAR_LF && (md->bsr_anycrlf ||
5873                  (c != 0x000b && c != 0x000c && c != 0x0085                   (c != CHAR_VT && c != CHAR_FF && c != CHAR_NEL
5874  #ifdef COMPILE_PCRE16  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5875                  && c != 0x2028 && c != 0x2029                   && c != 0x2028 && c != 0x2029
5876  #endif  #endif
5877                  ))) break;                   ))) break;
5878                eptr++;                eptr++;
5879                }                }
5880              }              }
# Line 5999  for (;;) Line 5888  for (;;)
5888                SCHECK_PARTIAL();                SCHECK_PARTIAL();
5889                break;                break;
5890                }                }
5891              c = *eptr;              switch(*eptr)
5892              if (c == 0x09 || c == 0x20 || c == 0xa0                {
5893  #ifdef COMPILE_PCRE16                default: eptr++; break;
5894                || c == 0x1680 || c == 0x180e || (c >= 0x2000 && c <= 0x200A)                HSPACE_BYTE_CASES:
5895                || c == 0x202f || c == 0x205f || c == 0x3000  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5896                  HSPACE_MULTIBYTE_CASES:
5897  #endif  #endif
5898                ) break;                goto ENDLOOP00;
5899              eptr++;                }
5900              }              }
5901              ENDLOOP00:
5902            break;            break;
5903    
5904            case OP_HSPACE:            case OP_HSPACE:
# Line 6018  for (;;) Line 5909  for (;;)
5909                SCHECK_PARTIAL();                SCHECK_PARTIAL();
5910                break;                break;
5911                }                }
5912              c = *eptr;              switch(*eptr)
5913              if (c != 0x09 && c != 0x20 && c != 0xa0                {
5914  #ifdef COMPILE_PCRE16                default: goto ENDLOOP01;
5915                && c != 0x1680 && c != 0x180e && (c < 0x2000 || c > 0x200A)                HSPACE_BYTE_CASES:
5916                && c != 0x202f && c != 0x205f && c != 0x3000  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5917                  HSPACE_MULTIBYTE_CASES:
5918  #endif  #endif
5919                ) break;                eptr++; break;
5920              eptr++;                }
5921              }              }
5922              ENDLOOP01:
5923            break;            break;
5924    
5925            case OP_NOT_VSPACE:            case OP_NOT_VSPACE:
# Line 6037  for (;;) Line 5930  for (;;)
5930                SCHECK_PARTIAL();                SCHECK_PARTIAL();
5931                break;                break;
5932                }                }
5933              c = *eptr;              switch(*eptr)
5934              if (c == 0x0a || c == 0x0b || c == 0x0c || c == 0x0d || c == 0x85                {
5935  #ifdef COMPILE_PCRE16                default: eptr++; break;
5936                || c == 0x2028 || c == 0x2029                VSPACE_BYTE_CASES:
5937    #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5938                  VSPACE_MULTIBYTE_CASES:
5939  #endif  #endif
5940                ) break;                goto ENDLOOP02;
5941              eptr++;                }
5942              }              }
5943              ENDLOOP02:
5944            break;            break;
5945    
5946            case OP_VSPACE:            case OP_VSPACE:
# Line 6055  for (;;) Line 5951  for (;;)
5951                SCHECK_PARTIAL();                SCHECK_PARTIAL();
5952                break;                break;
5953                }                }
5954              c = *eptr;              switch(*eptr)
5955              if (c != 0x0a && c != 0x0b && c != 0x0c && c != 0x0d && c != 0x85                {
5956  #ifdef COMPILE_PCRE16                default: goto ENDLOOP03;
5957                && c != 0x2028 && c != 0x2029                VSPACE_BYTE_CASES:
5958    #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5959                  VSPACE_MULTIBYTE_CASES:
5960  #endif  #endif
5961                ) break;                eptr++; break;
5962              eptr++;                }
5963              }              }
5964              ENDLOOP03:
5965            break;            break;
5966    
5967            case OP_NOT_DIGIT:            case OP_NOT_DIGIT:
# Line 6159  for (;;) Line 6058  for (;;)
6058            RMATCH(eptr, ecode, offset_top, md, eptrb, RM47);            RMATCH(eptr, ecode, offset_top, md, eptrb, RM47);
6059            if (rrc != MATCH_NOMATCH) RRETURN(rrc);            if (rrc != MATCH_NOMATCH) RRETURN(rrc);
6060            eptr--;            eptr--;
6061            if (ctype == OP_ANYNL && eptr > pp  && *eptr == '\n' &&            if (ctype == OP_ANYNL && eptr > pp  && *eptr == CHAR_LF &&
6062                eptr[-1] == '\r') eptr--;                eptr[-1] == CHAR_CR) eptr--;
6063            }            }
6064          }          }
6065    
# Line 6279  Undefine all the macros that were define Line 6178  Undefine all the macros that were define
6178  ***************************************************************************/  ***************************************************************************/
6179    
6180    
6181    #ifdef NO_RECURSE
6182    /*************************************************
6183    *          Release allocated heap frames         *
6184    *************************************************/
6185    
6186    /* This function releases all the allocated frames. The base frame is on the
6187    machine stack, and so must not be freed.
6188    
6189    Argument: the address of the base frame
6190    Returns:  nothing
6191    */
6192    
6193    static void
6194    release_match_heapframes (heapframe *frame_base)
6195    {
6196    heapframe *nextframe = frame_base->Xnextframe;
6197    while (nextframe != NULL)
6198      {
6199      heapframe *oldframe = nextframe;
6200      nextframe = nextframe->Xnextframe;
6201      (PUBL(stack_free))(oldframe);
6202      }
6203    }
6204    #endif
6205    
6206    
6207  /*************************************************  /*************************************************
6208  *         Execute a Regular Expression           *  *         Execute a Regular Expression           *
# Line 6304  Returns:          > 0 => success; value Line 6228  Returns:          > 0 => success; value
6228                   < -1 => some kind of unexpected problem                   < -1 => some kind of unexpected problem
6229  */  */
6230    
6231  #ifdef COMPILE_PCRE8  #if defined COMPILE_PCRE8
6232  PCRE_EXP_DEFN int PCRE_CALL_CONVENTION  PCRE_EXP_DEFN int PCRE_CALL_CONVENTION
6233  pcre_exec(const pcre *argument_re, const pcre_extra *extra_data,  pcre_exec(const pcre *argument_re, const pcre_extra *extra_data,
6234    PCRE_SPTR subject, int length, int start_offset, int options, int *offsets,    PCRE_SPTR subject, int length, int start_offset, int options, int *offsets,
6235    int offsetcount)    int offsetcount)
6236  #else  #elif defined COMPILE_PCRE16
6237  PCRE_EXP_DEFN int PCRE_CALL_CONVENTION  PCRE_EXP_DEFN int PCRE_CALL_CONVENTION
6238  pcre16_exec(const pcre16 *argument_re, const pcre16_extra *extra_data,  pcre16_exec(const pcre16 *argument_re, const pcre16_extra *extra_data,
6239    PCRE_SPTR16 subject, int length, int start_offset, int options, int *offsets,    PCRE_SPTR16 subject, int length, int start_offset, int options, int *offsets,
6240    int offsetcount)    int offsetcount)
6241    #elif defined COMPILE_PCRE32
6242    PCRE_EXP_DEFN int PCRE_CALL_CONVENTION
6243    pcre32_exec(const pcre32 *argument_re, const pcre32_extra *extra_data,
6244      PCRE_SPTR32 subject, int length, int start_offset, int options, int *offsets,
6245      int offsetcount)
6246  #endif  #endif
6247  {  {
6248  int rc, ocount, arg_offset_max;  int rc, ocount, arg_offset_max;
# Line 6341  PCRE_PUCHAR req_char_ptr = start_match - Line 6270  PCRE_PUCHAR req_char_ptr = start_match -
6270  const pcre_study_data *study;  const pcre_study_data *study;
6271  const REAL_PCRE *re = (const REAL_PCRE *)argument_re;  const REAL_PCRE *re = (const REAL_PCRE *)argument_re;
6272    
6273    #ifdef NO_RECURSE
6274    heapframe frame_zero;
6275    frame_zero.Xprevframe = NULL;            /* Marks the top level */
6276    frame_zero.Xnextframe = NULL;            /* None are allocated yet */
6277    md->match_frames_base = &frame_zero;
6278    #endif
6279    
6280  /* Check for the special magic call that measures the size of the stack used  /* Check for the special magic call that measures the size of the stack used
6281  per recursive call of match(). Without the funny casting for sizeof, a Windows  per recursive call of match(). Without the funny casting for sizeof, a Windows
6282  compiler gave this error: "unary minus operator applied to unsigned type,  compiler gave this error: "unary minus operator applied to unsigned type,
6283  result still unsigned". Hopefully the cast fixes that. */  result still unsigned". Hopefully the cast fixes that. */
6284    
# Line 6397  if (utf && (options & PCRE_NO_UTF8_CHECK Line 6333  if (utf && (options & PCRE_NO_UTF8_CHECK
6333        offsets[0] = erroroffset;        offsets[0] = erroroffset;
6334        offsets[1] = errorcode;        offsets[1] = errorcode;
6335        }        }
6336  #ifdef COMPILE_PCRE16  #if defined COMPILE_PCRE8
     return (errorcode <= PCRE_UTF16_ERR1 && md->partial > 1)?  
       PCRE_ERROR_SHORTUTF16 : PCRE_ERROR_BADUTF16;  
 #else  
6337      return (errorcode <= PCRE_UTF8_ERR5 && md->partial > 1)?      return (errorcode <= PCRE_UTF8_ERR5 && md->partial > 1)?
6338        PCRE_ERROR_SHORTUTF8 : PCRE_ERROR_BADUTF8;        PCRE_ERROR_SHORTUTF8 : PCRE_ERROR_BADUTF8;
6339    #elif defined COMPILE_PCRE16
6340        return (errorcode <= PCRE_UTF16_ERR1 && md->partial > 1)?
6341          PCRE_ERROR_SHORTUTF16 : PCRE_ERROR_BADUTF16;
6342    #elif defined COMPILE_PCRE32
6343        return PCRE_ERROR_BADUTF32;
6344  #endif  #endif
6345      }      }
6346    #if defined COMPILE_PCRE8 || defined COMPILE_PCRE16
6347    /* Check that a start_offset points to the start of a UTF character. */    /* Check that a start_offset points to the start of a UTF character. */
6348    if (start_offset > 0 && start_offset < length &&    if (start_offset > 0 && start_offset < length &&
6349        NOT_FIRSTCHAR(((PCRE_PUCHAR)subject)[start_offset]))        NOT_FIRSTCHAR(((PCRE_PUCHAR)subject)[start_offset]))
6350      return PCRE_ERROR_BADUTF8_OFFSET;      return PCRE_ERROR_BADUTF8_OFFSET;
6351    #endif
6352    }    }
6353  #endif  #endif
6354    
# Line 6427  if (extra_data != NULL Line 6366  if (extra_data != NULL
6366                      PCRE_NOTEMPTY | PCRE_NOTEMPTY_ATSTART |                      PCRE_NOTEMPTY | PCRE_NOTEMPTY_ATSTART |
6367                      PCRE_PARTIAL_SOFT | PCRE_PARTIAL_HARD)) == 0)                      PCRE_PARTIAL_SOFT | PCRE_PARTIAL_HARD)) == 0)
6368    {    {
6369    rc = PRIV(jit_exec)(re, extra_data->executable_jit,    rc = PRIV(jit_exec)(re, extra_data, (const pcre_uchar *)subject, length,
6370      (const pcre_uchar *)subject, length, start_offset, options,         start_offset, options, offsets, offsetcount);
     ((extra_data->flags & PCRE_EXTRA_MATCH_LIMIT) == 0)  
     ? MATCH_LIMIT : extra_data->match_limit, offsets, offsetcount,  
     ((extra_data->flags & PCRE_EXTRA_MARK) != 0) ? extra_data->mark : NULL);  
6371    
6372    /* PCRE_ERROR_NULL means that the selected normal or partial matching    /* PCRE_ERROR_NULL means that the selected normal or partial matching
6373    mode is not compiled. In this case we simply fallback to interpreter. */    mode is not compiled. In this case we simply fallback to interpreter. */
# Line 6720  for(;;) Line 6656  for(;;)
6656    
6657      if (has_first_char)      if (has_first_char)
6658        {        {
6659          pcre_uchar smc;
6660    
6661        if (first_char != first_char2)        if (first_char != first_char2)
6662          while (start_match < end_subject &&          while (start_match < end_subject &&
6663              *start_match != first_char && *start_match != first_char2)            (smc = RAWUCHARTEST(start_match)) != first_char && smc != first_char2)
6664            start_match++;            start_match++;
6665        else        else
6666          while (start_match < end_subject && *start_match != first_char)          while (start_match < end_subject && RAWUCHARTEST(start_match) != first_char)
6667            start_match++;            start_match++;
6668        }        }
6669    
# Line 6757  for(;;) Line 6695  for(;;)
6695          if (start_match[-1] == CHAR_CR &&          if (start_match[-1] == CHAR_CR &&
6696               (md->nltype == NLTYPE_ANY || md->nltype == NLTYPE_ANYCRLF) &&               (md->nltype == NLTYPE_ANY || md->nltype == NLTYPE_ANYCRLF) &&
6697               start_match < end_subject &&               start_match < end_subject &&
6698               *start_match == CHAR_NL)               RAWUCHARTEST(start_match) == CHAR_NL)
6699            start_match++;            start_match++;
6700          }          }
6701        }        }
# Line 6768  for(;;) Line 6706  for(;;)
6706        {        {
6707        while (start_match < end_subject)        while (start_match < end_subject)
6708          {          {
6709          register unsigned int c = *start_match;          register pcre_uint32 c = RAWUCHARTEST(start_match);
6710  #ifndef COMPILE_PCRE8  #ifndef COMPILE_PCRE8
6711          if (c > 255) c = 255;          if (c > 255) c = 255;
6712  #endif  #endif
# Line 6836  for(;;) Line 6774  for(;;)
6774            {            {
6775            while (p < end_subject)            while (p < end_subject)
6776              {              {
6777              register int pp = *p++;              register pcre_uint32 pp = RAWUCHARINCTEST(p);
6778              if (pp == req_char || pp == req_char2) { p--; break; }              if (pp == req_char || pp == req_char2) { p--; break; }
6779              }              }
6780            }            }
# Line 6844  for(;;) Line 6782  for(;;)
6782            {            {
6783            while (p < end_subject)            while (p < end_subject)
6784              {              {
6785              if (*p++ == req_char) { p--; break; }              if (RAWUCHARINCTEST(p) == req_char) { p--; break; }
6786              }              }
6787            }            }
6788    
# Line 7031  if (rc == MATCH_MATCH || rc == MATCH_ACC Line 6969  if (rc == MATCH_MATCH || rc == MATCH_ACC
6969      {      {
6970      register int *iptr, *iend;      register int *iptr, *iend;
6971      int resetcount = 2 + re->top_bracket * 2;      int resetcount = 2 + re->top_bracket * 2;
6972      if (resetcount > offsetcount) resetcount = ocount;      if (resetcount > offsetcount) resetcount = offsetcount;
6973      iptr = offsets + md->end_offset_top;      iptr = offsets + md->end_offset_top;
6974      iend = offsets + resetcount;      iend = offsets + resetcount;
6975      while (iptr < iend) *iptr++ = -1;      while (iptr < iend) *iptr++ = -1;
# Line 7052  if (rc == MATCH_MATCH || rc == MATCH_ACC Line 6990  if (rc == MATCH_MATCH || rc == MATCH_ACC
6990    if (extra_data != NULL && (extra_data->flags & PCRE_EXTRA_MARK) != 0)    if (extra_data != NULL && (extra_data->flags & PCRE_EXTRA_MARK) != 0)
6991      *(extra_data->mark) = (pcre_uchar *)md->mark;      *(extra_data->mark) = (pcre_uchar *)md->mark;
6992    DPRINTF((">>>> returning %d\n", rc));    DPRINTF((">>>> returning %d\n", rc));
6993    #ifdef NO_RECURSE
6994      release_match_heapframes(&frame_zero);
6995    #endif
6996    return rc;    return rc;
6997    }    }
6998    
# Line 7069  if (using_temporary_offsets) Line 7010  if (using_temporary_offsets)
7010  if (rc != MATCH_NOMATCH && rc != PCRE_ERROR_PARTIAL)  if (rc != MATCH_NOMATCH && rc != PCRE_ERROR_PARTIAL)
7011    {    {
7012    DPRINTF((">>>> error: returning %d\n", rc));    DPRINTF((">>>> error: returning %d\n", rc));
7013    #ifdef NO_RECURSE
7014      release_match_heapframes(&frame_zero);
7015    #endif
7016    return rc;    return rc;
7017    }    }
7018    
# Line 7098  else Line 7042  else
7042    
7043  if (extra_data != NULL && (extra_data->flags & PCRE_EXTRA_MARK) != 0)  if (extra_data != NULL && (extra_data->flags & PCRE_EXTRA_MARK) != 0)
7044    *(extra_data->mark) = (pcre_uchar *)md->nomatch_mark;    *(extra_data->mark) = (pcre_uchar *)md->nomatch_mark;
7045    #ifdef NO_RECURSE
7046      release_match_heapframes(&frame_zero);
7047    #endif
7048  return rc;  return rc;
7049  }  }
7050    

Legend:
Removed from v.929  
changed lines
  Added in v.1135

  ViewVC Help
Powered by ViewVC 1.1.5