Regex - Unicode özellikleri başvurusu ve Örnekleri

2 Cevap php

Ben RegexBuddy tarafından sunulan Regex Unicode özellikleri ile kaybolmuş hissediyorum, ben Number özellikleri ve Matematik sembol mülkün herhangi bir ayırt edemez, sadece + maç gibi görünüyor ama değil -, {[( 2)]}, /, ^ mesela.

RegexBuddy Unicode Properties

Düzenli ifadeler Unicode özellikleri örnekler ile herhangi bir belge / başvuru var mı?

2 Cevap

Unicode özellikleri listesi bulunabilir http://www.unicode.org/Public/UNIDATA/PropList.txt.

Her karakter için özellikler http://www.unicode.org/Public/UNIDATA/UnicodeData.txt (1.2 MB) bulunabilir.

Senin durumunda,

  • + (ARTI İŞARETİ), Sm olduğunu
  • - (TİRE-EKSİ) olan Pd,
  • * (ASTERISK), Po olduğunu
  • / (SOLIDUS) Po, aynı zamanda, ve
  • ^ (CIRCUMFLEX ACCENT) olan Sk.

Sen [-+*/^] ile eşleşen daha iyiyiz.

Unicode Character Properties

Sizin örnekte orada listelenen ettik olanlar aslında hepsi aynı Unicode karakter özelliği, General Category malıdır. Bazı regex sistemleri, tek başına bu özellik erişimi sağlamak; diğerleri Block özelliği (çok kullanışlı değil) veya Script mülkiyet (much daha yararlı) erişimi içerir.

A more complete explanation of the \p{Property Name} and \p{Property Name = Property Value} syntax in Perl regexes is given in the following text from page 209 of