Сверхжадные или ревнивые квантификаторы в регулярных выражениях
Мы с Вами уже рассматривали обычные квантификаторы повторений, а также разобрали ленивые квантификаторы. И пришло время рассмотреть ещё одну группу - это сверхжадные или ревнивые квантификаторы повторений.
Особенность сверхжадных квантификаторов в том, что они ведут себя как жадные, то есть захватывают, как можно большую часть строки, но ещё и не отдают её обратно. То есть они не дают на проверку схваченную часть другим частям регулярного выражения.
Для лучшего понимания давайте разберём пример:
<?php
preg_match('/".*"/i', 'a "b" c "d"', $matches);
print_r($matches);
?>
Не для кого не будет сюрпризом, что соответствие будет обнаружено и эта строка: "b" c "d". Это обычный жадный квантификатор, который взял как можно большую часть строки, а затем отдал обратно. Собственно, благодаря этому "откату", соответствие и было обнаружено.
Теперь же поставим свержадный квантификатор (.*+ - добавили знак "+"):
<?php
preg_match('/".*+"/i', 'a "b" c "d"', $matches);
print_r($matches);
?>
Соответствия вообще не будет, поскольку сверхжадный квантификатор после того, как добрался до последней кавычки (признак "жадности"), не откатился назад (признак "сверхжадности").
Скажу честно, в своей практике я не нашёл ни одного варианта использования данного типа квантификатора. Все примеры, которые я видел в Интернете были наподобие: "из Москвы в Ленинград через Владивосток". Они все легко обошлись бы без свержадных квантификаторов. Однако, единственная польза от них, которую я мог бы предположить - это отличная производительность. Давайте я приведу пример, где это может быть использовано. Допустим, у нас есть строка: "aaa". Мы хотим сделать так, чтобы регулярное выражение срабатывало, если есть на конце "b". Разумеется, строка "aaa" никогда не будет соответствовать такому требованию:
<?php
echo preg_match('/a+b/i', 'aaa');
echo preg_match('/a++b/i', 'aaa');
?>
В первом случае мы использовали обычный жадный квантификатор, во втором случае сверхжадный. Результатом обоих регулярных выражений стал 0. Однако! Второе регулярное выражение (там, где сверхжадный) сработал значительно быстрее. Таким образом, сверхжадные квантификаторы можно использовать для быстрого отсева заведомо неподходящих строк.
-
- Михаил Русаков
Комментарии (0):
Для добавления комментариев надо войти в систему.
Если Вы ещё не зарегистрированы на сайте, то сначала зарегистрируйтесь.