Регулярные выражения: различия между версиями
Материал из Planfix
DM (обсуждение | вклад) Нет описания правки |
DM (обсуждение | вклад) Нет описания правки |
||
Строка 38: | Строка 38: | ||
|- | |- | ||
| <nowiki> \r </nowiki> || символ возврата каретки | | <nowiki> \r </nowiki> || символ возврата каретки | ||
|- | |||
| <nowiki> [абв] </nowiki> || любой из перечисленных (а,б, или в) | |||
|- | |||
| <nowiki> [^абв] </nowiki> || любой, кроме перечисленных (не а,б, в) | |||
|- | |||
| <nowiki> [a-zA-Z] </nowiki> || слияние диапазонов (латинские символы от a до z без учета регистра ) | |||
|- | |||
| <nowiki> [a-d[m-p]] </nowiki> || объединение символов (от a до d и от m до p) | |||
|- | |||
| <nowiki> [a-z&&[def]] </nowiki> || пересечение символов (символы d,e,f) | |||
|- | |||
| <nowiki> [a-z&&[^bc]] </nowiki> || вычитание символов (символы a, d-z) | |||
|- | |- | ||
|} | |} |
Версия от 12:52, 14 марта 2020
Регулярные выражения в правилах обработки почты позволяют выделять нужный фрагмент текста в процессе извлечения данных из письма.
Формат регулярных выражений
Используется формат регулярных выражений принятый в Java. Синтаксис регулярных выражений основан на использовании символов <([{\^-=$!|]})?*+.>, которые можно комбинировать с буквенными символами. Наиболее частоупотребляемые метасимволы перечислены в таблице:
Метасимвол | Назначение |
---|---|
^ | начало строки |
$ | конец строки |
\d | цифровой символ |
\D | нецифровой символ |
\s | символ пробела |
\S | непробельный символ |
\w | буквенно-цифровой символ или знак подчёркивания |
\W | любой символ, кроме буквенного, цифрового или знака подчёркивания |
. | любой символ |
\t | символ табуляции |
\n | символ новой строки |
\r | символ возврата каретки |
[абв] | любой из перечисленных (а,б, или в) |
[^абв] | любой, кроме перечисленных (не а,б, в) |
[a-zA-Z] | слияние диапазонов (латинские символы от a до z без учета регистра ) |
[a-d[m-p]] | объединение символов (от a до d и от m до p) |
[a-z&&[def]] | пересечение символов (символы d,e,f) |
[a-z&&[^bc]] | вычитание символов (символы a, d-z) |
Полезная информация
- В результат обработки текста при помощи регулярного выражения попадает первая capturing группа. Соответственно, то, что нужно, чтобы было в результате надо взять в скобки, а остальные группы сделать non-capturing (?:)