/[pcre]/code/trunk/pcre_exec.c
ViewVC logotype

Diff of /code/trunk/pcre_exec.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1011 by ph10, Sat Aug 25 11:36:15 2012 UTC revision 1135 by chpe, Thu Oct 18 18:35:37 2012 UTC
# Line 92  because the offset vector is always a mu Line 92  because the offset vector is always a mu
92  static const char rep_min[] = { 0, 0, 1, 1, 0, 0 };  static const char rep_min[] = { 0, 0, 1, 1, 0, 0 };
93  static const char rep_max[] = { 0, 0, 0, 0, 1, 1 };  static const char rep_max[] = { 0, 0, 0, 0, 1, 1 };
94    
   
   
95  #ifdef PCRE_DEBUG  #ifdef PCRE_DEBUG
96  /*************************************************  /*************************************************
97  *        Debugging function to print chars       *  *        Debugging function to print chars       *
# Line 114  Returns:     nothing Line 112  Returns:     nothing
112  static void  static void
113  pchars(const pcre_uchar *p, int length, BOOL is_subject, match_data *md)  pchars(const pcre_uchar *p, int length, BOOL is_subject, match_data *md)
114  {  {
115  unsigned int c;  pcre_uint32 c;
116    BOOL utf = md->utf;
117  if (is_subject && length > md->end_subject - p) length = md->end_subject - p;  if (is_subject && length > md->end_subject - p) length = md->end_subject - p;
118  while (length-- > 0)  while (length-- > 0)
119    if (isprint(c = *(p++))) printf("%c", c); else printf("\\x%02x", c);    if (isprint(c = RAWUCHARINCTEST(p))) printf("%c", (char)c); else printf("\\x{%02x}", c);
120  }  }
121  #endif  #endif
122    
# Line 150  match_ref(int offset, register PCRE_PUCH Line 149  match_ref(int offset, register PCRE_PUCH
149  {  {
150  PCRE_PUCHAR eptr_start = eptr;  PCRE_PUCHAR eptr_start = eptr;
151  register PCRE_PUCHAR p = md->start_subject + md->offset_vector[offset];  register PCRE_PUCHAR p = md->start_subject + md->offset_vector[offset];
152    BOOL utf = md->utf;
153    
154  #ifdef PCRE_DEBUG  #ifdef PCRE_DEBUG
155  if (eptr >= md->end_subject)  if (eptr >= md->end_subject)
# Line 177  if (caseless) Line 177  if (caseless)
177    {    {
178  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
179  #ifdef SUPPORT_UCP  #ifdef SUPPORT_UCP
180    if (md->utf)    if (utf)
181      {      {
182      /* Match characters up to the end of the reference. NOTE: the number of      /* Match characters up to the end of the reference. NOTE: the number of
183      bytes matched may differ, because there are some characters whose upper and      data units matched may differ, because in UTF-8 there are some characters
184      lower case versions code as different numbers of bytes. For example, U+023A      whose upper and lower case versions code have different numbers of bytes.
185      (2 bytes in UTF-8) is the upper case version of U+2C65 (3 bytes in UTF-8);      For example, U+023A (2 bytes in UTF-8) is the upper case version of U+2C65
186      a sequence of 3 of the former uses 6 bytes, as does a sequence of two of      (3 bytes in UTF-8); a sequence of 3 of the former uses 6 bytes, as does a
187      the latter. It is important, therefore, to check the length along the      sequence of two of the latter. It is important, therefore, to check the
188      reference, not along the subject (earlier code did this wrong). */      length along the reference, not along the subject (earlier code did this
189        wrong). */
190    
191      PCRE_PUCHAR endptr = p + length;      PCRE_PUCHAR endptr = p + length;
192      while (p < endptr)      while (p < endptr)
193        {        {
194        int c, d;        pcre_uint32 c, d;
195          const ucd_record *ur;
196        if (eptr >= md->end_subject) return -2;   /* Partial match */        if (eptr >= md->end_subject) return -2;   /* Partial match */
197        GETCHARINC(c, eptr);        GETCHARINC(c, eptr);
198        GETCHARINC(d, p);        GETCHARINC(d, p);
199        if (c != d && c != UCD_OTHERCASE(d)) return -1;        ur = GET_UCD(d);
200          if (c != d && c != d + ur->other_case)
201            {
202            const pcre_uint32 *pp = PRIV(ucd_caseless_sets) + ur->caseset;
203            for (;;)
204              {
205              if (c < *pp) return -1;
206              if (c == *pp++) break;
207              }
208            }
209        }        }
210      }      }
211    else    else
# Line 206  if (caseless) Line 217  if (caseless)
217      {      {
218      while (length-- > 0)      while (length-- > 0)
219        {        {
220          pcre_uchar cc, cp;
221        if (eptr >= md->end_subject) return -2;   /* Partial match */        if (eptr >= md->end_subject) return -2;   /* Partial match */
222        if (TABLE_GET(*p, md->lcc, *p) != TABLE_GET(*eptr, md->lcc, *eptr)) return -1;        cc = RAWUCHARTEST(eptr);
223          cp = RAWUCHARTEST(p);
224          if (TABLE_GET(cp, md->lcc, cp) != TABLE_GET(cc, md->lcc, cc)) return -1;
225        p++;        p++;
226        eptr++;        eptr++;
227        }        }
# Line 222  else Line 236  else
236    while (length-- > 0)    while (length-- > 0)
237      {      {
238      if (eptr >= md->end_subject) return -2;   /* Partial match */      if (eptr >= md->end_subject) return -2;   /* Partial match */
239      if (*p++ != *eptr++) return -1;      if (RAWUCHARINCTEST(p) != RAWUCHARINCTEST(eptr)) return -1;
240      }      }
241    }    }
242    
# Line 296  actually used in this definition. */ Line 310  actually used in this definition. */
310    }    }
311  #define RRETURN(ra) \  #define RRETURN(ra) \
312    { \    { \
313    printf("match() returned %d from line %d ", ra, __LINE__); \    printf("match() returned %d from line %d\n", ra, __LINE__); \
314    return ra; \    return ra; \
315    }    }
316  #else  #else
# Line 387  typedef struct heapframe { Line 401  typedef struct heapframe {
401    
402  #ifdef SUPPORT_UCP  #ifdef SUPPORT_UCP
403    int Xprop_type;    int Xprop_type;
404    int Xprop_value;    unsigned int Xprop_value;
405    int Xprop_fail_result;    int Xprop_fail_result;
406    int Xoclength;    int Xoclength;
407    pcre_uchar Xocchars[6];    pcre_uchar Xocchars[6];
# Line 488  so they can be ordinary variables in all Line 502  so they can be ordinary variables in all
502    
503  register int  rrc;         /* Returns from recursive calls */  register int  rrc;         /* Returns from recursive calls */
504  register int  i;           /* Used for loops not involving calls to RMATCH() */  register int  i;           /* Used for loops not involving calls to RMATCH() */
505  register unsigned int c;   /* Character values not kept over RMATCH() calls */  register pcre_uint32 c;    /* Character values not kept over RMATCH() calls */
506  register BOOL utf;         /* Local copy of UTF flag for speed */  register BOOL utf;         /* Local copy of UTF flag for speed */
507    
508  BOOL minimize, possessive; /* Quantifier options */  BOOL minimize, possessive; /* Quantifier options */
# Line 605  BOOL prev_is_word; Line 619  BOOL prev_is_word;
619    
620  #ifdef SUPPORT_UCP  #ifdef SUPPORT_UCP
621  int prop_type;  int prop_type;
622  int prop_value;  unsigned int prop_value;
623  int prop_fail_result;  int prop_fail_result;
624  int oclength;  int oclength;
625  pcre_uchar occhars[6];  pcre_uchar occhars[6];
# Line 618  int max; Line 632  int max;
632  int min;  int min;
633  int number;  int number;
634  int offset;  int offset;
635  int op;  pcre_uchar op;
636  int save_capture_last;  int save_capture_last;
637  int save_offset1, save_offset2, save_offset3;  int save_offset1, save_offset2, save_offset3;
638  int stacksave[REC_STACK_SAVE_MAX];  int stacksave[REC_STACK_SAVE_MAX];
# Line 737  for (;;) Line 751  for (;;)
751      unaltered. */      unaltered. */
752    
753      else if (rrc == MATCH_SKIP_ARG &&      else if (rrc == MATCH_SKIP_ARG &&
754          STRCMP_UC_UC(ecode + 2, md->start_match_ptr) == 0)          STRCMP_UC_UC_TEST(ecode + 2, md->start_match_ptr) == 0)
755        {        {
756        md->start_match_ptr = eptr;        md->start_match_ptr = eptr;
757        RRETURN(MATCH_SKIP);        RRETURN(MATCH_SKIP);
# Line 1262  for (;;) Line 1276  for (;;)
1276          cb.version          = 2;   /* Version 1 of the callout block */          cb.version          = 2;   /* Version 1 of the callout block */
1277          cb.callout_number   = ecode[LINK_SIZE+2];          cb.callout_number   = ecode[LINK_SIZE+2];
1278          cb.offset_vector    = md->offset_vector;          cb.offset_vector    = md->offset_vector;
1279  #ifdef COMPILE_PCRE8  #if defined COMPILE_PCRE8
1280          cb.subject          = (PCRE_SPTR)md->start_subject;          cb.subject          = (PCRE_SPTR)md->start_subject;
1281  #else  #elif defined COMPILE_PCRE16
1282          cb.subject          = (PCRE_SPTR16)md->start_subject;          cb.subject          = (PCRE_SPTR16)md->start_subject;
1283    #elif defined COMPILE_PCRE32
1284            cb.subject          = (PCRE_SPTR32)md->start_subject;
1285  #endif  #endif
1286          cb.subject_length   = (int)(md->end_subject - md->start_subject);          cb.subject_length   = (int)(md->end_subject - md->start_subject);
1287          cb.start_match      = (int)(mstart - md->start_subject);          cb.start_match      = (int)(mstart - md->start_subject);
# Line 1685  for (;;) Line 1701  for (;;)
1701        cb.version          = 2;   /* Version 1 of the callout block */        cb.version          = 2;   /* Version 1 of the callout block */
1702        cb.callout_number   = ecode[1];        cb.callout_number   = ecode[1];
1703        cb.offset_vector    = md->offset_vector;        cb.offset_vector    = md->offset_vector;
1704  #ifdef COMPILE_PCRE8  #if defined COMPILE_PCRE8
1705        cb.subject          = (PCRE_SPTR)md->start_subject;        cb.subject          = (PCRE_SPTR)md->start_subject;
1706  #else  #elif defined COMPILE_PCRE16
1707        cb.subject          = (PCRE_SPTR16)md->start_subject;        cb.subject          = (PCRE_SPTR16)md->start_subject;
1708    #elif defined COMPILE_PCRE32
1709          cb.subject          = (PCRE_SPTR32)md->start_subject;
1710  #endif  #endif
1711        cb.subject_length   = (int)(md->end_subject - md->start_subject);        cb.subject_length   = (int)(md->end_subject - md->start_subject);
1712        cb.start_match      = (int)(mstart - md->start_subject);        cb.start_match      = (int)(mstart - md->start_subject);
# Line 2079  for (;;) Line 2097  for (;;)
2097              eptr + 1 >= md->end_subject &&              eptr + 1 >= md->end_subject &&
2098              NLBLOCK->nltype == NLTYPE_FIXED &&              NLBLOCK->nltype == NLTYPE_FIXED &&
2099              NLBLOCK->nllen == 2 &&              NLBLOCK->nllen == 2 &&
2100              *eptr == NLBLOCK->nl[0])              RAWUCHARTEST(eptr) == NLBLOCK->nl[0])
2101            {            {
2102            md->hitend = TRUE;            md->hitend = TRUE;
2103            if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);            if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
# Line 2123  for (;;) Line 2141  for (;;)
2141            eptr + 1 >= md->end_subject &&            eptr + 1 >= md->end_subject &&
2142            NLBLOCK->nltype == NLTYPE_FIXED &&            NLBLOCK->nltype == NLTYPE_FIXED &&
2143            NLBLOCK->nllen == 2 &&            NLBLOCK->nllen == 2 &&
2144            *eptr == NLBLOCK->nl[0])            RAWUCHARTEST(eptr) == NLBLOCK->nl[0])
2145          {          {
2146          md->hitend = TRUE;          md->hitend = TRUE;
2147          if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);          if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
# Line 2266  for (;;) Line 2284  for (;;)
2284          eptr + 1 >= md->end_subject &&          eptr + 1 >= md->end_subject &&
2285          NLBLOCK->nltype == NLTYPE_FIXED &&          NLBLOCK->nltype == NLTYPE_FIXED &&
2286          NLBLOCK->nllen == 2 &&          NLBLOCK->nllen == 2 &&
2287          *eptr == NLBLOCK->nl[0])          RAWUCHARTEST(eptr) == NLBLOCK->nl[0])
2288        {        {
2289        md->hitend = TRUE;        md->hitend = TRUE;
2290        if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);        if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
# Line 2415  for (;;) Line 2433  for (;;)
2433        {        {
2434        default: RRETURN(MATCH_NOMATCH);        default: RRETURN(MATCH_NOMATCH);
2435    
2436        case 0x000d:        case CHAR_CR:
2437        if (eptr >= md->end_subject)        if (eptr >= md->end_subject)
2438          {          {
2439          SCHECK_PARTIAL();          SCHECK_PARTIAL();
2440          }          }
2441        else if (*eptr == 0x0a) eptr++;        else if (RAWUCHARTEST(eptr) == CHAR_LF) eptr++;
2442        break;        break;
2443    
2444        case 0x000a:        case CHAR_LF:
2445        break;        break;
2446    
2447        case 0x000b:        case CHAR_VT:
2448        case 0x000c:        case CHAR_FF:
2449        case 0x0085:        case CHAR_NEL:
2450    #ifndef EBCDIC
2451        case 0x2028:        case 0x2028:
2452        case 0x2029:        case 0x2029:
2453    #endif  /* Not EBCDIC */
2454        if (md->bsr_anycrlf) RRETURN(MATCH_NOMATCH);        if (md->bsr_anycrlf) RRETURN(MATCH_NOMATCH);
2455        break;        break;
2456        }        }
# Line 2446  for (;;) Line 2466  for (;;)
2466      GETCHARINCTEST(c, eptr);      GETCHARINCTEST(c, eptr);
2467      switch(c)      switch(c)
2468        {        {
2469          HSPACE_CASES: RRETURN(MATCH_NOMATCH);  /* Byte and multibyte cases */
2470        default: break;        default: break;
       case 0x09:      /* HT */  
       case 0x20:      /* SPACE */  
       case 0xa0:      /* NBSP */  
       case 0x1680:    /* OGHAM SPACE MARK */  
       case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
       case 0x2000:    /* EN QUAD */  
       case 0x2001:    /* EM QUAD */  
       case 0x2002:    /* EN SPACE */  
       case 0x2003:    /* EM SPACE */  
       case 0x2004:    /* THREE-PER-EM SPACE */  
       case 0x2005:    /* FOUR-PER-EM SPACE */  
       case 0x2006:    /* SIX-PER-EM SPACE */  
       case 0x2007:    /* FIGURE SPACE */  
       case 0x2008:    /* PUNCTUATION SPACE */  
       case 0x2009:    /* THIN SPACE */  
       case 0x200A:    /* HAIR SPACE */  
       case 0x202f:    /* NARROW NO-BREAK SPACE */  
       case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
       case 0x3000:    /* IDEOGRAPHIC SPACE */  
       RRETURN(MATCH_NOMATCH);  
2471        }        }
2472      ecode++;      ecode++;
2473      break;      break;
# Line 2480  for (;;) Line 2481  for (;;)
2481      GETCHARINCTEST(c, eptr);      GETCHARINCTEST(c, eptr);
2482      switch(c)      switch(c)
2483        {        {
2484          HSPACE_CASES: break;  /* Byte and multibyte cases */
2485        default: RRETURN(MATCH_NOMATCH);        default: RRETURN(MATCH_NOMATCH);
       case 0x09:      /* HT */  
       case 0x20:      /* SPACE */  
       case 0xa0:      /* NBSP */  
       case 0x1680:    /* OGHAM SPACE MARK */  
       case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
       case 0x2000:    /* EN QUAD */  
       case 0x2001:    /* EM QUAD */  
       case 0x2002:    /* EN SPACE */  
       case 0x2003:    /* EM SPACE */  
       case 0x2004:    /* THREE-PER-EM SPACE */  
       case 0x2005:    /* FOUR-PER-EM SPACE */  
       case 0x2006:    /* SIX-PER-EM SPACE */  
       case 0x2007:    /* FIGURE SPACE */  
       case 0x2008:    /* PUNCTUATION SPACE */  
       case 0x2009:    /* THIN SPACE */  
       case 0x200A:    /* HAIR SPACE */  
       case 0x202f:    /* NARROW NO-BREAK SPACE */  
       case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
       case 0x3000:    /* IDEOGRAPHIC SPACE */  
       break;  
2486        }        }
2487      ecode++;      ecode++;
2488      break;      break;
# Line 2514  for (;;) Line 2496  for (;;)
2496      GETCHARINCTEST(c, eptr);      GETCHARINCTEST(c, eptr);
2497      switch(c)      switch(c)
2498        {        {
2499          VSPACE_CASES: RRETURN(MATCH_NOMATCH);
2500        default: break;        default: break;
       case 0x0a:      /* LF */  
       case 0x0b:      /* VT */  
       case 0x0c:      /* FF */  
       case 0x0d:      /* CR */  
       case 0x85:      /* NEL */  
       case 0x2028:    /* LINE SEPARATOR */  
       case 0x2029:    /* PARAGRAPH SEPARATOR */  
       RRETURN(MATCH_NOMATCH);  
2501        }        }
2502      ecode++;      ecode++;
2503      break;      break;
# Line 2536  for (;;) Line 2511  for (;;)
2511      GETCHARINCTEST(c, eptr);      GETCHARINCTEST(c, eptr);
2512      switch(c)      switch(c)
2513        {        {
2514          VSPACE_CASES: break;
2515        default: RRETURN(MATCH_NOMATCH);        default: RRETURN(MATCH_NOMATCH);
       case 0x0a:      /* LF */  
       case 0x0b:      /* VT */  
       case 0x0c:      /* FF */  
       case 0x0d:      /* CR */  
       case 0x85:      /* NEL */  
       case 0x2028:    /* LINE SEPARATOR */  
       case 0x2029:    /* PARAGRAPH SEPARATOR */  
       break;  
2516        }        }
2517      ecode++;      ecode++;
2518      break;      break;
# Line 2562  for (;;) Line 2530  for (;;)
2530        }        }
2531      GETCHARINCTEST(c, eptr);      GETCHARINCTEST(c, eptr);
2532        {        {
2533          const pcre_uint32 *cp;
2534        const ucd_record *prop = GET_UCD(c);        const ucd_record *prop = GET_UCD(c);
2535    
2536        switch(ecode[1])        switch(ecode[1])
# Line 2622  for (;;) Line 2591  for (;;)
2591            RRETURN(MATCH_NOMATCH);            RRETURN(MATCH_NOMATCH);
2592          break;          break;
2593    
2594            case PT_CLIST:
2595            cp = PRIV(ucd_caseless_sets) + prop->caseset;
2596            for (;;)
2597              {
2598              if (c < *cp)
2599                { if (op == OP_PROP) { RRETURN(MATCH_NOMATCH); } else break; }
2600              if (c == *cp++)
2601                { if (op == OP_PROP) break; else { RRETURN(MATCH_NOMATCH); } }
2602              }
2603            break;
2604    
2605          /* This should never occur */          /* This should never occur */
2606    
2607          default:          default:
# Line 2642  for (;;) Line 2622  for (;;)
2622        RRETURN(MATCH_NOMATCH);        RRETURN(MATCH_NOMATCH);
2623        }        }
2624      else      else
2625        {        {
2626        int lgb, rgb;        int lgb, rgb;
2627        GETCHARINCTEST(c, eptr);        GETCHARINCTEST(c, eptr);
2628        lgb = UCD_GRAPHBREAK(c);        lgb = UCD_GRAPHBREAK(c);
2629        while (eptr < md->end_subject)        while (eptr < md->end_subject)
2630          {          {
2631          int len = 1;          int len = 1;
2632          if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }          if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }
2633          rgb = UCD_GRAPHBREAK(c);          rgb = UCD_GRAPHBREAK(c);
2634          if (PRIV(ucp_gbtable)[lgb * ucp_gbCount + rgb] == 0) break;          if ((PRIV(ucp_gbtable)[lgb] & (1 << rgb)) == 0) break;
2635          lgb = rgb;          lgb = rgb;
2636          eptr += len;          eptr += len;
2637          }          }
2638        }        }
2639      CHECK_PARTIAL();      CHECK_PARTIAL();
2640      ecode++;      ecode++;
2641      break;      break;
2642  #endif  #endif  /* SUPPORT_UCP */
2643    
2644    
2645      /* Match a back reference, possibly repeatedly. Look past the end of the      /* Match a back reference, possibly repeatedly. Look past the end of the
# Line 3168  for (;;) Line 3148  for (;;)
3148          CHECK_PARTIAL();             /* Not SCHECK_PARTIAL() */          CHECK_PARTIAL();             /* Not SCHECK_PARTIAL() */
3149          RRETURN(MATCH_NOMATCH);          RRETURN(MATCH_NOMATCH);
3150          }          }
3151        while (length-- > 0) if (*ecode++ != *eptr++) RRETURN(MATCH_NOMATCH);        while (length-- > 0) if (*ecode++ != RAWUCHARINC(eptr)) RRETURN(MATCH_NOMATCH);
3152        }        }
3153      else      else
3154  #endif  #endif
# Line 3208  for (;;) Line 3188  for (;;)
3188    
3189        if (fc < 128)        if (fc < 128)
3190          {          {
3191          if (md->lcc[fc]          pcre_uchar cc = RAWUCHAR(eptr);
3192              != TABLE_GET(*eptr, md->lcc, *eptr)) RRETURN(MATCH_NOMATCH);          if (md->lcc[fc] != TABLE_GET(cc, md->lcc, cc)) RRETURN(MATCH_NOMATCH);
3193          ecode++;          ecode++;
3194          eptr++;          eptr++;
3195          }          }
# Line 3220  for (;;) Line 3200  for (;;)
3200    
3201        else        else
3202          {          {
3203          unsigned int dc;          pcre_uint32 dc;
3204          GETCHARINC(dc, eptr);          GETCHARINC(dc, eptr);
3205          ecode += length;          ecode += length;
3206    
# Line 3330  for (;;) Line 3310  for (;;)
3310        if (length > 1)        if (length > 1)
3311          {          {
3312  #ifdef SUPPORT_UCP  #ifdef SUPPORT_UCP
3313          unsigned int othercase;          pcre_uint32 othercase;
3314          if (op >= OP_STARI &&     /* Caseless */          if (op >= OP_STARI &&     /* Caseless */
3315              (othercase = UCD_OTHERCASE(fc)) != fc)              (othercase = UCD_OTHERCASE(fc)) != fc)
3316            oclength = PRIV(ord2utf)(othercase, occhars);            oclength = PRIV(ord2utf)(othercase, occhars);
# Line 3457  for (;;) Line 3437  for (;;)
3437    
3438        for (i = 1; i <= min; i++)        for (i = 1; i <= min; i++)
3439          {          {
3440            pcre_uchar cc;
3441    
3442          if (eptr >= md->end_subject)          if (eptr >= md->end_subject)
3443            {            {
3444            SCHECK_PARTIAL();            SCHECK_PARTIAL();
3445            RRETURN(MATCH_NOMATCH);            RRETURN(MATCH_NOMATCH);
3446            }            }
3447          if (fc != *eptr && foc != *eptr) RRETURN(MATCH_NOMATCH);          cc = RAWUCHARTEST(eptr);
3448            if (fc != cc && foc != cc) RRETURN(MATCH_NOMATCH);
3449          eptr++;          eptr++;
3450          }          }
3451        if (min == max) continue;        if (min == max) continue;
# Line 3470  for (;;) Line 3453  for (;;)
3453          {          {
3454          for (fi = min;; fi++)          for (fi = min;; fi++)
3455            {            {
3456              pcre_uchar cc;
3457    
3458            RMATCH(eptr, ecode, offset_top, md, eptrb, RM24);            RMATCH(eptr, ecode, offset_top, md, eptrb, RM24);
3459            if (rrc != MATCH_NOMATCH) RRETURN(rrc);            if (rrc != MATCH_NOMATCH) RRETURN(rrc);
3460            if (fi >= max) RRETURN(MATCH_NOMATCH);            if (fi >= max) RRETURN(MATCH_NOMATCH);
# Line 3478  for (;;) Line 3463  for (;;)
3463              SCHECK_PARTIAL();              SCHECK_PARTIAL();
3464              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
3465              }              }
3466            if (fc != *eptr && foc != *eptr) RRETURN(MATCH_NOMATCH);            cc = RAWUCHARTEST(eptr);
3467              if (fc != cc && foc != cc) RRETURN(MATCH_NOMATCH);
3468            eptr++;            eptr++;
3469            }            }
3470          /* Control never gets here */          /* Control never gets here */
# Line 3488  for (;;) Line 3474  for (;;)
3474          pp = eptr;          pp = eptr;
3475          for (i = min; i < max; i++)          for (i = min; i < max; i++)
3476            {            {
3477              pcre_uchar cc;
3478    
3479            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
3480              {              {
3481              SCHECK_PARTIAL();              SCHECK_PARTIAL();
3482              break;              break;
3483              }              }
3484            if (fc != *eptr && foc != *eptr) break;            cc = RAWUCHARTEST(eptr);
3485              if (fc != cc && foc != cc) break;
3486            eptr++;            eptr++;
3487            }            }
3488    
# Line 3521  for (;;) Line 3510  for (;;)
3510            SCHECK_PARTIAL();            SCHECK_PARTIAL();
3511            RRETURN(MATCH_NOMATCH);            RRETURN(MATCH_NOMATCH);
3512            }            }
3513          if (fc != *eptr++) RRETURN(MATCH_NOMATCH);          if (fc != RAWUCHARINCTEST(eptr)) RRETURN(MATCH_NOMATCH);
3514          }          }
3515    
3516        if (min == max) continue;        if (min == max) continue;
# Line 3538  for (;;) Line 3527  for (;;)
3527              SCHECK_PARTIAL();              SCHECK_PARTIAL();
3528              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
3529              }              }
3530            if (fc != *eptr++) RRETURN(MATCH_NOMATCH);            if (fc != RAWUCHARINCTEST(eptr)) RRETURN(MATCH_NOMATCH);
3531            }            }
3532          /* Control never gets here */          /* Control never gets here */
3533          }          }
# Line 3552  for (;;) Line 3541  for (;;)
3541              SCHECK_PARTIAL();              SCHECK_PARTIAL();
3542              break;              break;
3543              }              }
3544            if (fc != *eptr) break;            if (fc != RAWUCHARTEST(eptr)) break;
3545            eptr++;            eptr++;
3546            }            }
3547          if (possessive) continue;          if (possessive) continue;
# Line 3581  for (;;) Line 3570  for (;;)
3570  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3571      if (utf)      if (utf)
3572        {        {
3573        register unsigned int ch, och;        register pcre_uint32 ch, och;
3574    
3575        ecode++;        ecode++;
3576        GETCHARINC(ch, ecode);        GETCHARINC(ch, ecode);
# Line 3608  for (;;) Line 3597  for (;;)
3597      else      else
3598  #endif  #endif
3599        {        {
3600        register unsigned int ch = ecode[1];        register pcre_uint32 ch = ecode[1];
3601        c = *eptr++;        c = *eptr++;
3602        if (ch == c || (op == OP_NOTI && TABLE_GET(ch, md->fcc, ch) == c))        if (ch == c || (op == OP_NOTI && TABLE_GET(ch, md->fcc, ch) == c))
3603          RRETURN(MATCH_NOMATCH);          RRETURN(MATCH_NOMATCH);
# Line 3722  for (;;) Line 3711  for (;;)
3711  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3712        if (utf)        if (utf)
3713          {          {
3714          register unsigned int d;          register pcre_uint32 d;
3715          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
3716            {            {
3717            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
# Line 3757  for (;;) Line 3746  for (;;)
3746  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3747          if (utf)          if (utf)
3748            {            {
3749            register unsigned int d;            register pcre_uint32 d;
3750            for (fi = min;; fi++)            for (fi = min;; fi++)
3751              {              {
3752              RMATCH(eptr, ecode, offset_top, md, eptrb, RM28);              RMATCH(eptr, ecode, offset_top, md, eptrb, RM28);
# Line 3802  for (;;) Line 3791  for (;;)
3791  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3792          if (utf)          if (utf)
3793            {            {
3794            register unsigned int d;            register pcre_uint32 d;
3795            for (i = min; i < max; i++)            for (i = min; i < max; i++)
3796              {              {
3797              int len = 1;              int len = 1;
# Line 3859  for (;;) Line 3848  for (;;)
3848  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3849        if (utf)        if (utf)
3850          {          {
3851          register unsigned int d;          register pcre_uint32 d;
3852          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
3853            {            {
3854            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
# Line 3893  for (;;) Line 3882  for (;;)
3882  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3883          if (utf)          if (utf)
3884            {            {
3885            register unsigned int d;            register pcre_uint32 d;
3886            for (fi = min;; fi++)            for (fi = min;; fi++)
3887              {              {
3888              RMATCH(eptr, ecode, offset_top, md, eptrb, RM32);              RMATCH(eptr, ecode, offset_top, md, eptrb, RM32);
# Line 3937  for (;;) Line 3926  for (;;)
3926  #ifdef SUPPORT_UTF  #ifdef SUPPORT_UTF
3927          if (utf)          if (utf)
3928            {            {
3929            register unsigned int d;            register pcre_uint32 d;
3930            for (i = min; i < max; i++)            for (i = min; i < max; i++)
3931              {              {
3932              int len = 1;              int len = 1;
# Line 4212  for (;;) Line 4201  for (;;)
4201                RRETURN(MATCH_NOMATCH);                RRETURN(MATCH_NOMATCH);
4202              }              }
4203            break;            break;
4204    
4205              case PT_CLIST:
4206              for (i = 1; i <= min; i++)
4207                {
4208                const pcre_uint32 *cp;
4209                if (eptr >= md->end_subject)
4210                  {
4211                  SCHECK_PARTIAL();
4212                  RRETURN(MATCH_NOMATCH);
4213                  }
4214                GETCHARINCTEST(c, eptr);
4215                cp = PRIV(ucd_caseless_sets) + UCD_CASESET(c);
4216                for (;;)
4217                  {
4218                  if (c < *cp)
4219                    { if (prop_fail_result) break; else { RRETURN(MATCH_NOMATCH); } }
4220                  if (c == *cp++)
4221                    { if (prop_fail_result) { RRETURN(MATCH_NOMATCH); } else break; }
4222                  }
4223                }
4224              break;
4225    
4226            /* This should not occur */            /* This should not occur */
4227    
4228            default:            default:
# Line 4233  for (;;) Line 4243  for (;;)
4243              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4244              }              }
4245            else            else
4246              {              {
4247              int lgb, rgb;              int lgb, rgb;
4248              GETCHARINCTEST(c, eptr);              GETCHARINCTEST(c, eptr);
4249              lgb = UCD_GRAPHBREAK(c);              lgb = UCD_GRAPHBREAK(c);
4250             while (eptr < md->end_subject)             while (eptr < md->end_subject)
4251                {                {
4252                int len = 1;                int len = 1;
4253                if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }                if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }
4254                rgb = UCD_GRAPHBREAK(c);                rgb = UCD_GRAPHBREAK(c);
4255                if (PRIV(ucp_gbtable)[lgb * ucp_gbCount + rgb] == 0) break;                if ((PRIV(ucp_gbtable)[lgb] & (1 << rgb)) == 0) break;
4256                lgb = rgb;                lgb = rgb;
4257                eptr += len;                eptr += len;
4258                }                }
4259              }              }
4260            CHECK_PARTIAL();            CHECK_PARTIAL();
4261            }            }
# Line 4272  for (;;) Line 4282  for (;;)
4282                eptr + 1 >= md->end_subject &&                eptr + 1 >= md->end_subject &&
4283                NLBLOCK->nltype == NLTYPE_FIXED &&                NLBLOCK->nltype == NLTYPE_FIXED &&
4284                NLBLOCK->nllen == 2 &&                NLBLOCK->nllen == 2 &&
4285                *eptr == NLBLOCK->nl[0])                RAWUCHAR(eptr) == NLBLOCK->nl[0])
4286              {              {
4287              md->hitend = TRUE;              md->hitend = TRUE;
4288              if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);              if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
# Line 4313  for (;;) Line 4323  for (;;)
4323              {              {
4324              default: RRETURN(MATCH_NOMATCH);              default: RRETURN(MATCH_NOMATCH);
4325    
4326              case 0x000d:              case CHAR_CR:
4327              if (eptr < md->end_subject && *eptr == 0x0a) eptr++;              if (eptr < md->end_subject && RAWUCHAR(eptr) == CHAR_LF) eptr++;
4328              break;              break;
4329    
4330              case 0x000a:              case CHAR_LF:
4331              break;              break;
4332    
4333              case 0x000b:              case CHAR_VT:
4334              case 0x000c:              case CHAR_FF:
4335              case 0x0085:              case CHAR_NEL:
4336    #ifndef EBCDIC
4337              case 0x2028:              case 0x2028:
4338              case 0x2029:              case 0x2029:
4339    #endif  /* Not EBCDIC */
4340              if (md->bsr_anycrlf) RRETURN(MATCH_NOMATCH);              if (md->bsr_anycrlf) RRETURN(MATCH_NOMATCH);
4341              break;              break;
4342              }              }
# Line 4342  for (;;) Line 4354  for (;;)
4354            GETCHARINC(c, eptr);            GETCHARINC(c, eptr);
4355            switch(c)            switch(c)
4356              {              {
4357                HSPACE_CASES: RRETURN(MATCH_NOMATCH);  /* Byte and multibyte cases */
4358              default: break;              default: break;
             case 0x09:      /* HT */  
             case 0x20:      /* SPACE */  
             case 0xa0:      /* NBSP */  
             case 0x1680:    /* OGHAM SPACE MARK */  
             case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
             case 0x2000:    /* EN QUAD */  
             case 0x2001:    /* EM QUAD */  
             case 0x2002:    /* EN SPACE */  
             case 0x2003:    /* EM SPACE */  
             case 0x2004:    /* THREE-PER-EM SPACE */  
             case 0x2005:    /* FOUR-PER-EM SPACE */  
             case 0x2006:    /* SIX-PER-EM SPACE */  
             case 0x2007:    /* FIGURE SPACE */  
             case 0x2008:    /* PUNCTUATION SPACE */  
             case 0x2009:    /* THIN SPACE */  
             case 0x200A:    /* HAIR SPACE */  
             case 0x202f:    /* NARROW NO-BREAK SPACE */  
             case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
             case 0x3000:    /* IDEOGRAPHIC SPACE */  
             RRETURN(MATCH_NOMATCH);  
4359              }              }
4360            }            }
4361          break;          break;
# Line 4378  for (;;) Line 4371  for (;;)
4371            GETCHARINC(c, eptr);            GETCHARINC(c, eptr);
4372            switch(c)            switch(c)
4373              {              {
4374                HSPACE_CASES: break;  /* Byte and multibyte cases */
4375              default: RRETURN(MATCH_NOMATCH);              default: RRETURN(MATCH_NOMATCH);
             case 0x09:      /* HT */  
             case 0x20:      /* SPACE */  
             case 0xa0:      /* NBSP */  
             case 0x1680:    /* OGHAM SPACE MARK */  
             case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
             case 0x2000:    /* EN QUAD */  
             case 0x2001:    /* EM QUAD */  
             case 0x2002:    /* EN SPACE */  
             case 0x2003:    /* EM SPACE */  
             case 0x2004:    /* THREE-PER-EM SPACE */  
             case 0x2005:    /* FOUR-PER-EM SPACE */  
             case 0x2006:    /* SIX-PER-EM SPACE */  
             case 0x2007:    /* FIGURE SPACE */  
             case 0x2008:    /* PUNCTUATION SPACE */  
             case 0x2009:    /* THIN SPACE */  
             case 0x200A:    /* HAIR SPACE */  
             case 0x202f:    /* NARROW NO-BREAK SPACE */  
             case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
             case 0x3000:    /* IDEOGRAPHIC SPACE */  
             break;  
4376              }              }
4377            }            }
4378          break;          break;
# Line 4414  for (;;) Line 4388  for (;;)
4388            GETCHARINC(c, eptr);            GETCHARINC(c, eptr);
4389            switch(c)            switch(c)
4390              {              {
4391                VSPACE_CASES: RRETURN(MATCH_NOMATCH);
4392              default: break;              default: break;
             case 0x0a:      /* LF */  
             case 0x0b:      /* VT */  
             case 0x0c:      /* FF */  
             case 0x0d:      /* CR */  
             case 0x85:      /* NEL */  
             case 0x2028:    /* LINE SEPARATOR */  
             case 0x2029:    /* PARAGRAPH SEPARATOR */  
             RRETURN(MATCH_NOMATCH);  
4393              }              }
4394            }            }
4395          break;          break;
# Line 4438  for (;;) Line 4405  for (;;)
4405            GETCHARINC(c, eptr);            GETCHARINC(c, eptr);
4406            switch(c)            switch(c)
4407              {              {
4408                VSPACE_CASES: break;
4409              default: RRETURN(MATCH_NOMATCH);              default: RRETURN(MATCH_NOMATCH);
             case 0x0a:      /* LF */  
             case 0x0b:      /* VT */  
             case 0x0c:      /* FF */  
             case 0x0d:      /* CR */  
             case 0x85:      /* NEL */  
             case 0x2028:    /* LINE SEPARATOR */  
             case 0x2029:    /* PARAGRAPH SEPARATOR */  
             break;  
4410              }              }
4411            }            }
4412          break;          break;
# Line 4468  for (;;) Line 4428  for (;;)
4428          case OP_DIGIT:          case OP_DIGIT:
4429          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
4430            {            {
4431              pcre_uchar cc;
4432    
4433            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
4434              {              {
4435              SCHECK_PARTIAL();              SCHECK_PARTIAL();
4436              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4437              }              }
4438            if (*eptr >= 128 || (md->ctypes[*eptr] & ctype_digit) == 0)            cc = RAWUCHAR(eptr);
4439              if (cc >= 128 || (md->ctypes[cc] & ctype_digit) == 0)
4440              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4441            eptr++;            eptr++;
4442            /* No need to skip more bytes - we know it's a 1-byte character */            /* No need to skip more bytes - we know it's a 1-byte character */
# Line 4483  for (;;) Line 4446  for (;;)
4446          case OP_NOT_WHITESPACE:          case OP_NOT_WHITESPACE:
4447          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
4448            {            {
4449              pcre_uchar cc;
4450    
4451            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
4452              {              {
4453              SCHECK_PARTIAL();              SCHECK_PARTIAL();
4454              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4455              }              }
4456            if (*eptr < 128 && (md->ctypes[*eptr] & ctype_space) != 0)            cc = RAWUCHAR(eptr);
4457              if (cc < 128 && (md->ctypes[cc] & ctype_space) != 0)
4458              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4459            eptr++;            eptr++;
4460            ACROSSCHAR(eptr < md->end_subject, *eptr, eptr++);            ACROSSCHAR(eptr < md->end_subject, *eptr, eptr++);
# Line 4498  for (;;) Line 4464  for (;;)
4464          case OP_WHITESPACE:          case OP_WHITESPACE:
4465          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
4466            {            {
4467              pcre_uchar cc;
4468    
4469            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
4470              {              {
4471              SCHECK_PARTIAL();              SCHECK_PARTIAL();
4472              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4473              }              }
4474            if (*eptr >= 128 || (md->ctypes[*eptr] & ctype_space) == 0)            cc = RAWUCHAR(eptr);
4475              if (cc >= 128 || (md->ctypes[cc] & ctype_space) == 0)
4476              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4477            eptr++;            eptr++;
4478            /* No need to skip more bytes - we know it's a 1-byte character */            /* No need to skip more bytes - we know it's a 1-byte character */
# Line 4513  for (;;) Line 4482  for (;;)
4482          case OP_NOT_WORDCHAR:          case OP_NOT_WORDCHAR:
4483          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
4484            {            {
4485              pcre_uchar cc;
4486    
4487            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
4488              {              {
4489              SCHECK_PARTIAL();              SCHECK_PARTIAL();
4490              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4491              }              }
4492            if (*eptr < 128 && (md->ctypes[*eptr] & ctype_word) != 0)            cc = RAWUCHAR(eptr);
4493              if (cc < 128 && (md->ctypes[cc] & ctype_word) != 0)
4494              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4495            eptr++;            eptr++;
4496            ACROSSCHAR(eptr < md->end_subject, *eptr, eptr++);            ACROSSCHAR(eptr < md->end_subject, *eptr, eptr++);
# Line 4528  for (;;) Line 4500  for (;;)
4500          case OP_WORDCHAR:          case OP_WORDCHAR:
4501          for (i = 1; i <= min; i++)          for (i = 1; i <= min; i++)
4502            {            {
4503              pcre_uchar cc;
4504    
4505            if (eptr >= md->end_subject)            if (eptr >= md->end_subject)
4506              {              {
4507              SCHECK_PARTIAL();              SCHECK_PARTIAL();
4508              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4509              }              }
4510            if (*eptr >= 128 || (md->ctypes[*eptr] & ctype_word) == 0)            cc = RAWUCHAR(eptr);
4511              if (cc >= 128 || (md->ctypes[cc] & ctype_word) == 0)
4512              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4513            eptr++;            eptr++;
4514            /* No need to skip more bytes - we know it's a 1-byte character */            /* No need to skip more bytes - we know it's a 1-byte character */
# Line 4604  for (;;) Line 4579  for (;;)
4579              {              {
4580              default: RRETURN(MATCH_NOMATCH);              default: RRETURN(MATCH_NOMATCH);
4581    
4582              case 0x000d:              case CHAR_CR:
4583              if (eptr < md->end_subject && *eptr == 0x0a) eptr++;              if (eptr < md->end_subject && *eptr == CHAR_LF) eptr++;
4584              break;              break;
4585    
4586              case 0x000a:              case CHAR_LF:
4587              break;              break;
4588    
4589              case 0x000b:              case CHAR_VT:
4590              case 0x000c:              case CHAR_FF:
4591              case 0x0085:              case CHAR_NEL:
4592  #ifdef COMPILE_PCRE16  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
4593              case 0x2028:              case 0x2028:
4594              case 0x2029:              case 0x2029:
4595  #endif  #endif
# Line 4635  for (;;) Line 4610  for (;;)
4610            switch(*eptr++)            switch(*eptr++)
4611              {              {
4612              default: break;              default: break;
4613              case 0x09:      /* HT */              HSPACE_BYTE_CASES:
4614              case 0x20:      /* SPACE */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
4615              case 0xa0:      /* NBSP */              HSPACE_MULTIBYTE_CASES:
 #ifdef COMPILE_PCRE16  
             case 0x1680:    /* OGHAM SPACE MARK */  
             case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
             case 0x2000:    /* EN QUAD */  
             case 0x2001:    /* EM QUAD */  
             case 0x2002:    /* EN SPACE */  
             case 0x2003:    /* EM SPACE */  
             case 0x2004:    /* THREE-PER-EM SPACE */  
             case 0x2005:    /* FOUR-PER-EM SPACE */  
             case 0x2006:    /* SIX-PER-EM SPACE */  
             case 0x2007:    /* FIGURE SPACE */  
             case 0x2008:    /* PUNCTUATION SPACE */  
             case 0x2009:    /* THIN SPACE */  
             case 0x200A:    /* HAIR SPACE */  
             case 0x202f:    /* NARROW NO-BREAK SPACE */  
             case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
             case 0x3000:    /* IDEOGRAPHIC SPACE */  
4616  #endif  #endif
4617              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4618              }              }
# Line 4672  for (;;) Line 4630  for (;;)
4630            switch(*eptr++)            switch(*eptr++)
4631              {              {
4632              default: RRETURN(MATCH_NOMATCH);              default: RRETURN(MATCH_NOMATCH);
4633              case 0x09:      /* HT */              HSPACE_BYTE_CASES:
4634              case 0x20:      /* SPACE */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
4635              case 0xa0:      /* NBSP */              HSPACE_MULTIBYTE_CASES:
 #ifdef COMPILE_PCRE16  
             case 0x1680:    /* OGHAM SPACE MARK */  
             case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
             case 0x2000:    /* EN QUAD */  
             case 0x2001:    /* EM QUAD */  
             case 0x2002:    /* EN SPACE */  
             case 0x2003:    /* EM SPACE */  
             case 0x2004:    /* THREE-PER-EM SPACE */  
             case 0x2005:    /* FOUR-PER-EM SPACE */  
             case 0x2006:    /* SIX-PER-EM SPACE */  
             case 0x2007:    /* FIGURE SPACE */  
             case 0x2008:    /* PUNCTUATION SPACE */  
             case 0x2009:    /* THIN SPACE */  
             case 0x200A:    /* HAIR SPACE */  
             case 0x202f:    /* NARROW NO-BREAK SPACE */  
             case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
             case 0x3000:    /* IDEOGRAPHIC SPACE */  
4636  #endif  #endif
4637              break;              break;
4638              }              }
# Line 4708  for (;;) Line 4649  for (;;)
4649              }              }
4650            switch(*eptr++)            switch(*eptr++)
4651              {              {
4652              default: break;              VSPACE_BYTE_CASES:
4653              case 0x0a:      /* LF */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
4654              case 0x0b:      /* VT */              VSPACE_MULTIBYTE_CASES:
             case 0x0c:      /* FF */  
             case 0x0d:      /* CR */  
             case 0x85:      /* NEL */  
 #ifdef COMPILE_PCRE16  
             case 0x2028:    /* LINE SEPARATOR */  
             case 0x2029:    /* PARAGRAPH SEPARATOR */  
4655  #endif  #endif
4656              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4657                default: break;
4658              }              }
4659            }            }
4660          break;          break;
# Line 4734  for (;;) Line 4670  for (;;)
4670            switch(*eptr++)            switch(*eptr++)
4671              {              {
4672              default: RRETURN(MATCH_NOMATCH);              default: RRETURN(MATCH_NOMATCH);
4673              case 0x0a:      /* LF */              VSPACE_BYTE_CASES:
4674              case 0x0b:      /* VT */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
4675              case 0x0c:      /* FF */              VSPACE_MULTIBYTE_CASES:
             case 0x0d:      /* CR */  
             case 0x85:      /* NEL */  
 #ifdef COMPILE_PCRE16  
             case 0x2028:    /* LINE SEPARATOR */  
             case 0x2029:    /* PARAGRAPH SEPARATOR */  
4676  #endif  #endif
4677              break;              break;
4678              }              }
# Line 5019  for (;;) Line 4950  for (;;)
4950              }              }
4951            /* Control never gets here */            /* Control never gets here */
4952    
4953            /* This should never occur */            case PT_CLIST:
4954              for (fi = min;; fi++)
4955                {
4956                const pcre_uint32 *cp;
4957                RMATCH(eptr, ecode, offset_top, md, eptrb, RM62);
4958                if (rrc != MATCH_NOMATCH) RRETURN(rrc);
4959                if (fi >= max) RRETURN(MATCH_NOMATCH);
4960                if (eptr >= md->end_subject)
4961                  {
4962                  SCHECK_PARTIAL();
4963                  RRETURN(MATCH_NOMATCH);
4964                  }
4965                GETCHARINCTEST(c, eptr);
4966                cp = PRIV(ucd_caseless_sets) + UCD_CASESET(c);
4967                for (;;)
4968                  {
4969                  if (c < *cp)
4970                    { if (prop_fail_result) break; else { RRETURN(MATCH_NOMATCH); } }
4971                  if (c == *cp++)
4972                    { if (prop_fail_result) { RRETURN(MATCH_NOMATCH); } else break; }
4973                  }
4974                }
4975              /* Control never gets here */
4976    
4977              /* This should never occur */
4978            default:            default:
4979            RRETURN(PCRE_ERROR_INTERNAL);            RRETURN(PCRE_ERROR_INTERNAL);
4980            }            }
# Line 5042  for (;;) Line 4996  for (;;)
4996              RRETURN(MATCH_NOMATCH);              RRETURN(MATCH_NOMATCH);
4997              }              }
4998            else            else
4999              {              {
5000              int lgb, rgb;              int lgb, rgb;
5001              GETCHARINCTEST(c, eptr);              GETCHARINCTEST(c, eptr);
5002              lgb = UCD_GRAPHBREAK(c);              lgb = UCD_GRAPHBREAK(c);
5003              while (eptr < md->end_subject)              while (eptr < md->end_subject)
5004                {                {
5005                int len = 1;                int len = 1;
5006                if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }                if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }
5007                rgb = UCD_GRAPHBREAK(c);                rgb = UCD_GRAPHBREAK(c);
5008                if (PRIV(ucp_gbtable)[lgb * ucp_gbCount + rgb] == 0) break;                if ((PRIV(ucp_gbtable)[lgb] & (1 << rgb)) == 0) break;
5009                lgb = rgb;                lgb = rgb;
5010                eptr += len;                eptr += len;
5011                }                }
5012              }              }
5013            CHECK_PARTIAL();            CHECK_PARTIAL();
5014            }            }
# Line 5100  for (;;) Line 5054  for (;;)
5054              switch(c)              switch(c)
5055                {                {
5056                default: RRETURN(MATCH_NOMATCH);                default: RRETURN(MATCH_NOMATCH);
5057                case 0x000d:                case CHAR_CR:
5058                if (eptr < md->end_subject && *eptr == 0x0a) eptr++;                if (eptr < md->end_subject && RAWUCHAR(eptr) == CHAR_LF) eptr++;
5059                break;                break;
5060                case 0x000a:  
5061                  case CHAR_LF:
5062                break;                break;
5063    
5064                case 0x000b:                case CHAR_VT:
5065                case 0x000c:                case CHAR_FF:
5066                case 0x0085:                case CHAR_NEL:
5067    #ifndef EBCDIC
5068                case 0x2028:                case 0x2028:
5069                case 0x2029:                case 0x2029:
5070    #endif  /* Not EBCDIC */
5071                if (md->bsr_anycrlf) RRETURN(MATCH_NOMATCH);                if (md->bsr_anycrlf) RRETURN(MATCH_NOMATCH);
5072                break;                break;
5073                }                }
# Line 5119  for (;;) Line 5076  for (;;)
5076              case OP_NOT_HSPACE:              case OP_NOT_HSPACE:
5077              switch(c)              switch(c)
5078                {                {
5079                  HSPACE_CASES: RRETURN(MATCH_NOMATCH);
5080                default: break;                default: break;
               case 0x09:      /* HT */  
               case 0x20:      /* SPACE */  
               case 0xa0:      /* NBSP */  
               case 0x1680:    /* OGHAM SPACE MARK */  
               case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
               case 0x2000:    /* EN QUAD */  
               case 0x2001:    /* EM QUAD */  
               case 0x2002:    /* EN SPACE */  
               case 0x2003:    /* EM SPACE */  
               case 0x2004:    /* THREE-PER-EM SPACE */  
               case 0x2005:    /* FOUR-PER-EM SPACE */  
               case 0x2006:    /* SIX-PER-EM SPACE */  
               case 0x2007:    /* FIGURE SPACE */  
               case 0x2008:    /* PUNCTUATION SPACE */  
               case 0x2009:    /* THIN SPACE */  
               case 0x200A:    /* HAIR SPACE */  
               case 0x202f:    /* NARROW NO-BREAK SPACE */  
               case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
               case 0x3000:    /* IDEOGRAPHIC SPACE */  
               RRETURN(MATCH_NOMATCH);  
5081                }                }
5082              break;              break;
5083    
5084              case OP_HSPACE:              case OP_HSPACE:
5085              switch(c)              switch(c)
5086                {                {
5087                  HSPACE_CASES: break;
5088                default: RRETURN(MATCH_NOMATCH);                default: RRETURN(MATCH_NOMATCH);
               case 0x09:      /* HT */  
               case 0x20:      /* SPACE */  
               case 0xa0:      /* NBSP */  
               case 0x1680:    /* OGHAM SPACE MARK */  
               case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
               case 0x2000:    /* EN QUAD */  
               case 0x2001:    /* EM QUAD */  
               case 0x2002:    /* EN SPACE */  
               case 0x2003:    /* EM SPACE */  
               case 0x2004:    /* THREE-PER-EM SPACE */  
               case 0x2005:    /* FOUR-PER-EM SPACE */  
               case 0x2006:    /* SIX-PER-EM SPACE */  
               case 0x2007:    /* FIGURE SPACE */  
               case 0x2008:    /* PUNCTUATION SPACE */  
               case 0x2009:    /* THIN SPACE */  
               case 0x200A:    /* HAIR SPACE */  
               case 0x202f:    /* NARROW NO-BREAK SPACE */  
               case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
               case 0x3000:    /* IDEOGRAPHIC SPACE */  
               break;  
5089                }                }
5090              break;              break;
5091    
5092              case OP_NOT_VSPACE:              case OP_NOT_VSPACE:
5093              switch(c)              switch(c)
5094                {                {
5095                  VSPACE_CASES: RRETURN(MATCH_NOMATCH);
5096                default: break;                default: break;
               case 0x0a:      /* LF */  
               case 0x0b:      /* VT */  
               case 0x0c:      /* FF */  
               case 0x0d:      /* CR */  
               case 0x85:      /* NEL */  
               case 0x2028:    /* LINE SEPARATOR */  
               case 0x2029:    /* PARAGRAPH SEPARATOR */  
               RRETURN(MATCH_NOMATCH);  
5097                }                }
5098              break;              break;
5099    
5100              case OP_VSPACE:              case OP_VSPACE:
5101              switch(c)              switch(c)
5102                {                {
5103                  VSPACE_CASES: break;
5104                default: RRETURN(MATCH_NOMATCH);                default: RRETURN(MATCH_NOMATCH);
               case 0x0a:      /* LF */  
               case 0x0b:      /* VT */  
               case 0x0c:      /* FF */  
               case 0x0d:      /* CR */  
               case 0x85:      /* NEL */  
               case 0x2028:    /* LINE SEPARATOR */  
               case 0x2029:    /* PARAGRAPH SEPARATOR */  
               break;  
5105                }                }
5106              break;              break;
5107    
# Line 5274  for (;;) Line 5179  for (;;)
5179              switch(c)              switch(c)
5180                {                {
5181                default: RRETURN(MATCH_NOMATCH);                default: RRETURN(MATCH_NOMATCH);
5182                case 0x000d:                case CHAR_CR:
5183                if (eptr < md->end_subject && *eptr == 0x0a) eptr++;                if (eptr < md->end_subject && *eptr == CHAR_LF) eptr++;
5184                break;                break;
5185    
5186                case 0x000a:                case CHAR_LF:
5187                break;                break;
5188    
5189                case 0x000b:                case CHAR_VT:
5190                case 0x000c:                case CHAR_FF:
5191                case 0x0085:                case CHAR_NEL:
5192  #ifdef COMPILE_PCRE16  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5193                case 0x2028:                case 0x2028:
5194                case 0x2029:                case 0x2029:
5195  #endif  #endif
# Line 5297  for (;;) Line 5202  for (;;)
5202              switch(c)              switch(c)
5203                {                {
5204                default: break;                default: break;
5205                case 0x09:      /* HT */                HSPACE_BYTE_CASES:
5206                case 0x20:      /* SPACE */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5207                case 0xa0:      /* NBSP */                HSPACE_MULTIBYTE_CASES:
 #ifdef COMPILE_PCRE16  
               case 0x1680:    /* OGHAM SPACE MARK */  
               case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
               case 0x2000:    /* EN QUAD */  
               case 0x2001:    /* EM QUAD */  
               case 0x2002:    /* EN SPACE */  
               case 0x2003:    /* EM SPACE */  
               case 0x2004:    /* THREE-PER-EM SPACE */  
               case 0x2005:    /* FOUR-PER-EM SPACE */  
               case 0x2006:    /* SIX-PER-EM SPACE */  
               case 0x2007:    /* FIGURE SPACE */  
               case 0x2008:    /* PUNCTUATION SPACE */  
               case 0x2009:    /* THIN SPACE */  
               case 0x200A:    /* HAIR SPACE */  
               case 0x202f:    /* NARROW NO-BREAK SPACE */  
               case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
               case 0x3000:    /* IDEOGRAPHIC SPACE */  
5208  #endif  #endif
5209                RRETURN(MATCH_NOMATCH);                RRETURN(MATCH_NOMATCH);
5210                }                }
# Line 5326  for (;;) Line 5214  for (;;)
5214              switch(c)              switch(c)
5215                {                {
5216                default: RRETURN(MATCH_NOMATCH);                default: RRETURN(MATCH_NOMATCH);
5217                case 0x09:      /* HT */                HSPACE_BYTE_CASES:
5218                case 0x20:      /* SPACE */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5219                case 0xa0:      /* NBSP */                HSPACE_MULTIBYTE_CASES:
 #ifdef COMPILE_PCRE16  
               case 0x1680:    /* OGHAM SPACE MARK */  
               case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
               case 0x2000:    /* EN QUAD */  
               case 0x2001:    /* EM QUAD */  
               case 0x2002:    /* EN SPACE */  
               case 0x2003:    /* EM SPACE */  
               case 0x2004:    /* THREE-PER-EM SPACE */  
               case 0x2005:    /* FOUR-PER-EM SPACE */  
               case 0x2006:    /* SIX-PER-EM SPACE */  
               case 0x2007:    /* FIGURE SPACE */  
               case 0x2008:    /* PUNCTUATION SPACE */  
               case 0x2009:    /* THIN SPACE */  
               case 0x200A:    /* HAIR SPACE */  
               case 0x202f:    /* NARROW NO-BREAK SPACE */  
               case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
               case 0x3000:    /* IDEOGRAPHIC SPACE */  
5220  #endif  #endif
5221                break;                break;
5222                }                }
# Line 5355  for (;;) Line 5226  for (;;)
5226              switch(c)              switch(c)
5227                {                {
5228                default: break;                default: break;
5229                case 0x0a:      /* LF */                VSPACE_BYTE_CASES:
5230                case 0x0b:      /* VT */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5231                case 0x0c:      /* FF */                VSPACE_MULTIBYTE_CASES:
               case 0x0d:      /* CR */  
               case 0x85:      /* NEL */  
 #ifdef COMPILE_PCRE16  
               case 0x2028:    /* LINE SEPARATOR */  
               case 0x2029:    /* PARAGRAPH SEPARATOR */  
5232  #endif  #endif
5233                RRETURN(MATCH_NOMATCH);                RRETURN(MATCH_NOMATCH);
5234                }                }
# Line 5372  for (;;) Line 5238  for (;;)
5238              switch(c)              switch(c)
5239                {                {
5240                default: RRETURN(MATCH_NOMATCH);                default: RRETURN(MATCH_NOMATCH);
5241                case 0x0a:      /* LF */                VSPACE_BYTE_CASES:
5242                case 0x0b:      /* VT */  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5243                case 0x0c:      /* FF */                VSPACE_MULTIBYTE_CASES:
               case 0x0d:      /* CR */  
               case 0x85:      /* NEL */  
 #ifdef COMPILE_PCRE16  
               case 0x2028:    /* LINE SEPARATOR */  
               case 0x2029:    /* PARAGRAPH SEPARATOR */  
5244  #endif  #endif
5245                break;                break;
5246                }                }
# Line 5582  for (;;) Line 5443  for (;;)
5443              eptr+= len;              eptr+= len;
5444              }              }
5445            break;            break;
5446    
5447              case PT_CLIST:
5448              for (i = min; i < max; i++)
5449                {
5450                const pcre_uint32 *cp;
5451                int len = 1;
5452                if (eptr >= md->end_subject)
5453                  {
5454                  SCHECK_PARTIAL();
5455                  break;
5456                  }
5457                GETCHARLENTEST(c, eptr, len);
5458                cp = PRIV(ucd_caseless_sets) + UCD_CASESET(c);
5459                for (;;)
5460                  {
5461                  if (c < *cp)
5462                    { if (prop_fail_result) break; else goto GOT_MAX; }
5463                  if (c == *cp++)
5464                    { if (prop_fail_result) goto GOT_MAX; else break; }
5465                  }
5466                eptr += len;
5467                }
5468              GOT_MAX:
5469              break;
5470    
5471            default:            default:
5472            RRETURN(PCRE_ERROR_INTERNAL);            RRETURN(PCRE_ERROR_INTERNAL);
# Line 5612  for (;;) Line 5497  for (;;)
5497              break;              break;
5498              }              }
5499            else            else
5500              {              {
5501              int lgb, rgb;              int lgb, rgb;
5502              GETCHARINCTEST(c, eptr);              GETCHARINCTEST(c, eptr);
5503              lgb = UCD_GRAPHBREAK(c);              lgb = UCD_GRAPHBREAK(c);
5504              while (eptr < md->end_subject)              while (eptr < md->end_subject)
5505                {                {
5506                int len = 1;                int len = 1;
5507                if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }                if (!utf) c = *eptr; else { GETCHARLEN(c, eptr, len); }
5508                rgb = UCD_GRAPHBREAK(c);                rgb = UCD_GRAPHBREAK(c);
5509                if (PRIV(ucp_gbtable)[lgb * ucp_gbCount + rgb] == 0) break;                if ((PRIV(ucp_gbtable)[lgb] & (1 << rgb)) == 0) break;
5510                lgb = rgb;                lgb = rgb;
5511                eptr += len;                eptr += len;
5512                }                }
5513              }              }
5514            CHECK_PARTIAL();            CHECK_PARTIAL();
5515            }            }
# Line 5674  for (;;) Line 5559  for (;;)
5559                    eptr + 1 >= md->end_subject &&                    eptr + 1 >= md->end_subject &&
5560                    NLBLOCK->nltype == NLTYPE_FIXED &&                    NLBLOCK->nltype == NLTYPE_FIXED &&
5561                    NLBLOCK->nllen == 2 &&                    NLBLOCK->nllen == 2 &&
5562                    *eptr == NLBLOCK->nl[0])                    RAWUCHAR(eptr) == NLBLOCK->nl[0])
5563                  {                  {
5564                  md->hitend = TRUE;                  md->hitend = TRUE;
5565                  if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);                  if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
# Line 5700  for (;;) Line 5585  for (;;)
5585                    eptr + 1 >= md->end_subject &&                    eptr + 1 >= md->end_subject &&
5586                    NLBLOCK->nltype == NLTYPE_FIXED &&                    NLBLOCK->nltype == NLTYPE_FIXED &&
5587                    NLBLOCK->nllen == 2 &&                    NLBLOCK->nllen == 2 &&
5588                    *eptr == NLBLOCK->nl[0])                    RAWUCHAR(eptr) == NLBLOCK->nl[0])
5589                  {                  {
5590                  md->hitend = TRUE;                  md->hitend = TRUE;
5591                  if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);                  if (md->partial > 1) RRETURN(PCRE_ERROR_PARTIAL);
# Line 5754  for (;;) Line 5639  for (;;)
5639                break;                break;
5640                }                }
5641              GETCHARLEN(c, eptr, len);              GETCHARLEN(c, eptr, len);
5642              if (c == 0x000d)              if (c == CHAR_CR)
5643                {                {
5644                if (++eptr >= md->end_subject) break;                if (++eptr >= md->end_subject) break;
5645                if (*eptr == 0x000a) eptr++;                if (RAWUCHAR(eptr) == CHAR_LF) eptr++;
5646                }                }
5647              else              else
5648                {                {
5649                if (c != 0x000a &&                if (c != CHAR_LF &&
5650                    (md->bsr_anycrlf ||                    (md->bsr_anycrlf ||
5651                     (c != 0x000b && c != 0x000c &&                     (c != CHAR_VT && c != CHAR_FF && c != CHAR_NEL
5652                      c != 0x0085 && c != 0x2028 && c != 0x2029)))  #ifndef EBCDIC
5653                        && c != 0x2028 && c != 0x2029
5654    #endif  /* Not EBCDIC */
5655                        )))
5656                  break;                  break;
5657                eptr += len;                eptr += len;
5658                }                }
# Line 5785  for (;;) Line 5673  for (;;)
5673              GETCHARLEN(c, eptr, len);              GETCHARLEN(c, eptr, len);
5674              switch(c)              switch(c)
5675                {                {
5676                  HSPACE_CASES: gotspace = TRUE; break;
5677                default: gotspace = FALSE; break;                default: gotspace = FALSE; break;
               case 0x09:      /* HT */  
               case 0x20:      /* SPACE */  
               case 0xa0:      /* NBSP */  
               case 0x1680:    /* OGHAM SPACE MARK */  
               case 0x180e:    /* MONGOLIAN VOWEL SEPARATOR */  
               case 0x2000:    /* EN QUAD */  
               case 0x2001:    /* EM QUAD */  
               case 0x2002:    /* EN SPACE */  
               case 0x2003:    /* EM SPACE */  
               case 0x2004:    /* THREE-PER-EM SPACE */  
               case 0x2005:    /* FOUR-PER-EM SPACE */  
               case 0x2006:    /* SIX-PER-EM SPACE */  
               case 0x2007:    /* FIGURE SPACE */  
               case 0x2008:    /* PUNCTUATION SPACE */  
               case 0x2009:    /* THIN SPACE */  
               case 0x200A:    /* HAIR SPACE */  
               case 0x202f:    /* NARROW NO-BREAK SPACE */  
               case 0x205f:    /* MEDIUM MATHEMATICAL SPACE */  
               case 0x3000:    /* IDEOGRAPHIC SPACE */  
               gotspace = TRUE;  
               break;  
5678                }                }
5679              if (gotspace == (ctype == OP_NOT_HSPACE)) break;              if (gotspace == (ctype == OP_NOT_HSPACE)) break;
5680              eptr += len;              eptr += len;
# Line 5827  for (;;) Line 5695  for (;;)
5695              GETCHARLEN(c, eptr, len);              GETCHARLEN(c, eptr, len);
5696              switch(c)              switch(c)
5697                {                {
5698                  VSPACE_CASES: gotspace = TRUE; break;
5699                default: gotspace = FALSE; break;                default: gotspace = FALSE; break;
               case 0x0a:      /* LF */  
               case 0x0b:      /* VT */  
               case 0x0c:      /* FF */  
               case 0x0d:      /* CR */  
               case 0x85:      /* NEL */  
               case 0x2028:    /* LINE SEPARATOR */  
               case 0x2029:    /* PARAGRAPH SEPARATOR */  
               gotspace = TRUE;  
               break;  
5700                }                }
5701              if (gotspace == (ctype == OP_NOT_VSPACE)) break;              if (gotspace == (ctype == OP_NOT_VSPACE)) break;
5702              eptr += len;              eptr += len;
# Line 5950  for (;;) Line 5810  for (;;)
5810            if (rrc != MATCH_NOMATCH) RRETURN(rrc);            if (rrc != MATCH_NOMATCH) RRETURN(rrc);
5811            if (eptr-- == pp) break;        /* Stop if tried at original pos */            if (eptr-- == pp) break;        /* Stop if tried at original pos */
5812            BACKCHAR(eptr);            BACKCHAR(eptr);
5813            if (ctype == OP_ANYNL && eptr > pp  && *eptr == '\n' &&            if (ctype == OP_ANYNL && eptr > pp  && RAWUCHAR(eptr) == CHAR_NL &&
5814                eptr[-1] == '\r') eptr--;                RAWUCHAR(eptr - 1) == CHAR_CR) eptr--;
5815            }            }
5816          }          }
5817        else        else
# Line 6002  for (;;) Line 5862  for (;;)
5862                break;                break;
5863                }                }
5864              c = *eptr;              c = *eptr;
5865              if (c == 0x000d)              if (c == CHAR_CR)
5866                {                {
5867                if (++eptr >= md->end_subject) break;                if (++eptr >= md->end_subject) break;
5868                if (*eptr == 0x000a) eptr++;                if (*eptr == CHAR_LF) eptr++;
5869                }                }
5870              else              else
5871                {                {
5872                if (c != 0x000a && (md->bsr_anycrlf ||                if (c != CHAR_LF && (md->bsr_anycrlf ||
5873                  (c != 0x000b && c != 0x000c && c != 0x0085                   (c != CHAR_VT && c != CHAR_FF && c != CHAR_NEL
5874  #ifdef COMPILE_PCRE16  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5875                  && c != 0x2028 && c != 0x2029                   && c != 0x2028 && c != 0x2029
5876  #endif  #endif
5877                  ))) break;                   ))) break;
5878                eptr++;                eptr++;
5879                }                }
5880              }              }
# Line 6028  for (;;) Line 5888  for (;;)
5888                SCHECK_PARTIAL();                SCHECK_PARTIAL();
5889                break;                break;
5890                }                }
5891              c = *eptr;              switch(*eptr)
5892              if (c == 0x09 || c == 0x20 || c == 0xa0                {
5893  #ifdef COMPILE_PCRE16                default: eptr++; break;
5894                || c == 0x1680 || c == 0x180e || (c >= 0x2000 && c <= 0x200A)                HSPACE_BYTE_CASES:
5895                || c == 0x202f || c == 0x205f || c == 0x3000  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5896                  HSPACE_MULTIBYTE_CASES:
5897  #endif  #endif
5898                ) break;                goto ENDLOOP00;
5899              eptr++;                }
5900              }              }
5901              ENDLOOP00:
5902            break;            break;
5903    
5904            case OP_HSPACE:            case OP_HSPACE:
# Line 6047  for (;;) Line 5909  for (;;)
5909                SCHECK_PARTIAL();                SCHECK_PARTIAL();
5910                break;                break;
5911                }                }
5912              c = *eptr;              switch(*eptr)
5913              if (c != 0x09 && c != 0x20 && c != 0xa0                {
5914  #ifdef COMPILE_PCRE16                default: goto ENDLOOP01;
5915                && c != 0x1680 && c != 0x180e && (c < 0x2000 || c > 0x200A)                HSPACE_BYTE_CASES:
5916                && c != 0x202f && c != 0x205f && c != 0x3000  #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5917                  HSPACE_MULTIBYTE_CASES:
5918  #endif  #endif
5919                ) break;                eptr++; break;
5920              eptr++;                }
5921              }              }
5922              ENDLOOP01:
5923            break;            break;
5924    
5925            case OP_NOT_VSPACE:            case OP_NOT_VSPACE:
# Line 6066  for (;;) Line 5930  for (;;)
5930                SCHECK_PARTIAL();                SCHECK_PARTIAL();
5931                break;                break;
5932                }                }
5933              c = *eptr;              switch(*eptr)
5934              if (c == 0x0a || c == 0x0b || c == 0x0c || c == 0x0d || c == 0x85                {
5935  #ifdef COMPILE_PCRE16                default: eptr++; break;
5936                || c == 0x2028 || c == 0x2029                VSPACE_BYTE_CASES:
5937    #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5938                  VSPACE_MULTIBYTE_CASES:
5939  #endif  #endif
5940                ) break;                goto ENDLOOP02;
5941              eptr++;                }
5942              }              }
5943              ENDLOOP02:
5944            break;            break;
5945    
5946            case OP_VSPACE:            case OP_VSPACE:
# Line 6084  for (;;) Line 5951  for (;;)
5951                SCHECK_PARTIAL();                SCHECK_PARTIAL();
5952                break;                break;
5953                }                }
5954              c = *eptr;              switch(*eptr)
5955              if (c != 0x0a && c != 0x0b && c != 0x0c && c != 0x0d && c != 0x85                {
5956  #ifdef COMPILE_PCRE16                default: goto ENDLOOP03;
5957                && c != 0x2028 && c != 0x2029                VSPACE_BYTE_CASES:
5958    #if defined COMPILE_PCRE16 || defined COMPILE_PCRE32
5959                  VSPACE_MULTIBYTE_CASES:
5960  #endif  #endif
5961                ) break;                eptr++; break;
5962              eptr++;                }
5963              }              }
5964              ENDLOOP03:
5965            break;            break;
5966    
5967            case OP_NOT_DIGIT:            case OP_NOT_DIGIT:
# Line 6188  for (;;) Line 6058  for (;;)
6058            RMATCH(eptr, ecode, offset_top, md, eptrb, RM47);            RMATCH(eptr, ecode, offset_top, md, eptrb, RM47);
6059            if (rrc != MATCH_NOMATCH) RRETURN(rrc);            if (rrc != MATCH_NOMATCH) RRETURN(rrc);
6060            eptr--;            eptr--;
6061            if (ctype == OP_ANYNL && eptr > pp  && *eptr == '\n' &&            if (ctype == OP_ANYNL && eptr > pp  && *eptr == CHAR_LF &&
6062                eptr[-1] == '\r') eptr--;                eptr[-1] == CHAR_CR) eptr--;
6063            }            }
6064          }          }
6065    
# Line 6358  Returns:          > 0 => success; value Line 6228  Returns:          > 0 => success; value
6228                   < -1 => some kind of unexpected problem                   < -1 => some kind of unexpected problem
6229  */  */
6230    
6231  #ifdef COMPILE_PCRE8  #if defined COMPILE_PCRE8
6232  PCRE_EXP_DEFN int PCRE_CALL_CONVENTION  PCRE_EXP_DEFN int PCRE_CALL_CONVENTION
6233  pcre_exec(const pcre *argument_re, const pcre_extra *extra_data,  pcre_exec(const pcre *argument_re, const pcre_extra *extra_data,
6234    PCRE_SPTR subject, int length, int start_offset, int options, int *offsets,    PCRE_SPTR subject, int length, int start_offset, int options, int *offsets,
6235    int offsetcount)    int offsetcount)
6236  #else  #elif defined COMPILE_PCRE16
6237  PCRE_EXP_DEFN int PCRE_CALL_CONVENTION  PCRE_EXP_DEFN int PCRE_CALL_CONVENTION
6238  pcre16_exec(const pcre16 *argument_re, const pcre16_extra *extra_data,  pcre16_exec(const pcre16 *argument_re, const pcre16_extra *extra_data,
6239    PCRE_SPTR16 subject, int length, int start_offset, int options, int *offsets,    PCRE_SPTR16 subject, int length, int start_offset, int options, int *offsets,
6240    int offsetcount)    int offsetcount)
6241    #elif defined COMPILE_PCRE32
6242    PCRE_EXP_DEFN int PCRE_CALL_CONVENTION
6243    pcre32_exec(const pcre32 *argument_re, const pcre32_extra *extra_data,
6244      PCRE_SPTR32 subject, int length, int start_offset, int options, int *offsets,
6245      int offsetcount)
6246  #endif  #endif
6247  {  {
6248  int rc, ocount, arg_offset_max;  int rc, ocount, arg_offset_max;
# Line 6458  if (utf && (options & PCRE_NO_UTF8_CHECK Line 6333  if (utf && (options & PCRE_NO_UTF8_CHECK
6333        offsets[0] = erroroffset;        offsets[0] = erroroffset;
6334        offsets[1] = errorcode;        offsets[1] = errorcode;
6335        }        }
6336  #ifdef COMPILE_PCRE16  #if defined COMPILE_PCRE8
     return (errorcode <= PCRE_UTF16_ERR1 && md->partial > 1)?  
       PCRE_ERROR_SHORTUTF16 : PCRE_ERROR_BADUTF16;  
 #else  
6337      return (errorcode <= PCRE_UTF8_ERR5 && md->partial > 1)?      return (errorcode <= PCRE_UTF8_ERR5 && md->partial > 1)?
6338        PCRE_ERROR_SHORTUTF8 : PCRE_ERROR_BADUTF8;        PCRE_ERROR_SHORTUTF8 : PCRE_ERROR_BADUTF8;
6339    #elif defined COMPILE_PCRE16
6340        return (errorcode <= PCRE_UTF16_ERR1 && md->partial > 1)?
6341          PCRE_ERROR_SHORTUTF16 : PCRE_ERROR_BADUTF16;
6342    #elif defined COMPILE_PCRE32
6343        return PCRE_ERROR_BADUTF32;
6344  #endif  #endif
6345      }      }
6346    #if defined COMPILE_PCRE8 || defined COMPILE_PCRE16
6347    /* Check that a start_offset points to the start of a UTF character. */    /* Check that a start_offset points to the start of a UTF character. */
6348    if (start_offset > 0 && start_offset < length &&    if (start_offset > 0 && start_offset < length &&
6349        NOT_FIRSTCHAR(((PCRE_PUCHAR)subject)[start_offset]))        NOT_FIRSTCHAR(((PCRE_PUCHAR)subject)[start_offset]))
6350      return PCRE_ERROR_BADUTF8_OFFSET;      return PCRE_ERROR_BADUTF8_OFFSET;
6351    #endif
6352    }    }
6353  #endif  #endif
6354    
# Line 6778  for(;;) Line 6656  for(;;)
6656    
6657      if (has_first_char)      if (has_first_char)
6658        {        {
6659          pcre_uchar smc;
6660    
6661        if (first_char != first_char2)        if (first_char != first_char2)
6662          while (start_match < end_subject &&          while (start_match < end_subject &&
6663              *start_match != first_char && *start_match != first_char2)            (smc = RAWUCHARTEST(start_match)) != first_char && smc != first_char2)
6664            start_match++;            start_match++;
6665        else        else
6666          while (start_match < end_subject && *start_match != first_char)          while (start_match < end_subject && RAWUCHARTEST(start_match) != first_char)
6667            start_match++;            start_match++;
6668        }        }
6669    
# Line 6815  for(;;) Line 6695  for(;;)
6695          if (start_match[-1] == CHAR_CR &&          if (start_match[-1] == CHAR_CR &&
6696               (md->nltype == NLTYPE_ANY || md->nltype == NLTYPE_ANYCRLF) &&               (md->nltype == NLTYPE_ANY || md->nltype == NLTYPE_ANYCRLF) &&
6697               start_match < end_subject &&               start_match < end_subject &&
6698               *start_match == CHAR_NL)               RAWUCHARTEST(start_match) == CHAR_NL)
6699            start_match++;            start_match++;
6700          }          }
6701        }        }
# Line 6826  for(;;) Line 6706  for(;;)
6706        {        {
6707        while (start_match < end_subject)        while (start_match < end_subject)
6708          {          {
6709          register unsigned int c = *start_match;          register pcre_uint32 c = RAWUCHARTEST(start_match);
6710  #ifndef COMPILE_PCRE8  #ifndef COMPILE_PCRE8
6711          if (c > 255) c = 255;          if (c > 255) c = 255;
6712  #endif  #endif
# Line 6894  for(;;) Line 6774  for(;;)
6774            {            {
6775            while (p < end_subject)            while (p < end_subject)
6776              {              {
6777              register int pp = *p++;              register pcre_uint32 pp = RAWUCHARINCTEST(p);
6778              if (pp == req_char || pp == req_char2) { p--; break; }              if (pp == req_char || pp == req_char2) { p--; break; }
6779              }              }
6780            }            }
# Line 6902  for(;;) Line 6782  for(;;)
6782            {            {
6783            while (p < end_subject)            while (p < end_subject)
6784              {              {
6785              if (*p++ == req_char) { p--; break; }              if (RAWUCHARINCTEST(p) == req_char) { p--; break; }
6786              }              }
6787            }            }
6788    

Legend:
Removed from v.1011  
changed lines
  Added in v.1135

  ViewVC Help
Powered by ViewVC 1.1.5