Regular expression: Difference between revisions
From Planfix
No edit summary |
No edit summary |
||
Line 9: | Line 9: | ||
{| class="wikitable" style="text-align: center;" | {| class="wikitable" style="text-align: center;" | ||
|- | |- | ||
! | ! Metacharacter !! Meaning | ||
|- | |- | ||
| <nowiki> ^ </nowiki> || | | <nowiki> ^ </nowiki> || beginning of input | ||
|- | |- | ||
| <nowiki> $ </nowiki> || | | <nowiki> $ </nowiki> || end of input | ||
|- | |- | ||
| <nowiki> \d </nowiki> || | | <nowiki> \d </nowiki> || digit | ||
|- | |- | ||
| <nowiki> \D </nowiki> || | | <nowiki> \D </nowiki> || non-digit character | ||
|- | |- | ||
| <nowiki> \s </nowiki> || | | <nowiki> \s </nowiki> || space character | ||
|- | |- | ||
| <nowiki> \S </nowiki> || | | <nowiki> \S </nowiki> || non-space character | ||
|- | |- | ||
| <nowiki> \w </nowiki> || | | <nowiki> \w </nowiki> || alphanumeric character or underscore | ||
|- | |- | ||
| <nowiki> \W </nowiki> || | | <nowiki> \W </nowiki> || any character except alphanumerics and underscores | ||
|- | |- | ||
| <nowiki> . </nowiki> || | | <nowiki> . </nowiki> || any character | ||
|- | |- | ||
| <nowiki> \t </nowiki> || символ табуляции | | <nowiki> \t </nowiki> || символ табуляции |
Revision as of 06:19, 19 April 2021
Regular expressions in rules for processing emails allow you to isolate a desired fragment of text when extracting data from an email.
Important
- The use of regular expressions typically requires programming skills. If you don't know any programming languages, you should ask for help.
Formatting regular expressions
Planfix uses the regular expression format used in Java. The syntax of regular expressions uses the symbols <([{\^-=$!|]})?*+.>, which can be combined with letters to create metacharacters. The most frequently used metacharacters are listed in this table:
Metacharacter | Meaning |
---|---|
^ | beginning of input |
$ | end of input |
\d | digit |
\D | non-digit character |
\s | space character |
\S | non-space character |
\w | alphanumeric character or underscore |
\W | any character except alphanumerics and underscores |
. | any character |
\t | символ табуляции |
\n | символ новой строки |
\r | символ возврата каретки |
[абв] | любой из перечисленных (а,б, или в) |
[^абв] | любой, кроме перечисленных (не а,б, в) |
[a-zA-Z] | слияние диапазонов (латинские символы от a до z без учета регистра) |
[a-d[m-p]] | объединение символов (от a до d и от m до p) |
[a-z&&[def]] | пересечение символов (символы d,e,f) |
[a-z&&[^bc]] | вычитание символов (символы a, d-z) |
? | один или отсутствует |
* | ноль или более раз |
+ | один или более раз |
{n} | n раз |
{n,} | n раз и более |
{n,m} | не менее n раз и не более m раз |
Полезная информация
- В результат обработки текста при помощи регулярного выражения попадает первая capturing группа. Соответственно, то, что нужно, чтобы было в результате надо взять в скобки, а остальные группы сделать non-capturing (?:)
- Больше о работе регулярных выражений можно прочитать в этой статье.