Регулярные выражения: различия между версиями
Материал из Planfix
DM (обсуждение | вклад) Нет описания правки |
DM (обсуждение | вклад) Нет описания правки |
||
Строка 17: | Строка 17: | ||
|- | |- | ||
| <nowiki> ^ </nowiki> || начало строки | | <nowiki> ^ </nowiki> || начало строки | ||
|- | |||
| <nowiki> $ </nowiki> || конец строки | |||
|- | |||
| <nowiki> \d </nowiki> || цифровой символ | |||
|- | |||
| <nowiki> \D </nowiki> || нецифровой символ | |||
|- | |||
| <nowiki> \s </nowiki> || символ пробела | |||
|- | |||
| <nowiki> \S </nowiki> || непробельный символ | |||
|- | |||
| <nowiki> \w </nowiki> || буквенно-цифровой символ или знак подчёркивания | |||
|- | |||
| <nowiki> \W </nowiki> || любой символ, кроме буквенного, цифрового или знака подчёркивания | |||
|- | |||
| <nowiki> . </nowiki> || любой символ | |||
|- | |||
| <nowiki> \t </nowiki> || символ табуляции | |||
|- | |||
| <nowiki> \n </nowiki> || символ новой строки | |||
|- | |||
| <nowiki> \r </nowiki> || символ возврата каретки | |||
|- | |- | ||
|} | |} |
Версия от 12:48, 14 марта 2020
Регулярные выражения в правилах обработки почты позволяют выделять нужный фрагмент текста в процессе извлечения данных из письма.
Формат регулярных выражений
Используется формат регулярных выражений принятый в Java. Синтаксис регулярных выражений основан на использовании символов <([{\^-=$!|]})?*+.>, которые можно комбинировать с буквенными символами. В зависимости от роли их можно разделить на несколько групп:
Метасимвол | Назначение |
---|---|
^ | начало строки |
$ | конец строки |
\d | цифровой символ |
\D | нецифровой символ |
\s | символ пробела |
\S | непробельный символ |
\w | буквенно-цифровой символ или знак подчёркивания |
\W | любой символ, кроме буквенного, цифрового или знака подчёркивания |
. | любой символ |
\t | символ табуляции |
\n | символ новой строки |
\r | символ возврата каретки |
Полезная информация
- В результат обработки текста при помощи регулярного выражения попадает первая capturing группа. Соответственно, то, что нужно, чтобы было в результате надо взять в скобки, а остальные группы сделать non-capturing (?:)