Квантификаторы — это специальные символы в регулярных выражениях, которые указывают, сколько раз предшествующий элемент может повторяться. Они играют ключевую роль в обработке текста, позволяя гибко задавать шаблоны поиска.
В регулярных выражениях существует несколько базовых квантификаторов:
Жадные квантификаторы (*, +, ?) пытаются захватить максимально возможное количество символов, в то время как их ленивые версии (с добавлением ? после квантификатора) ищут минимальное совпадение.
Рассмотрим практическое применение квантификаторов:
\d+ найдет последовательность из одной или более цифр.https?:// совпадет как с "http://", так и с "https://".\w{5} соответствует ровно 5 буквенно-цифровым символам.Пример жадного поведения: ".*" в строке "текст" и "еще текст" захватит все от первой до последней кавычки. Ленивый вариант ".*?" остановится на первой закрывающей кавычке.
Сочетание разных квантификаторов позволяет создавать сложные шаблоны:
\d{3}-\d{2}-\d{4} — формат американского SSN (Social Security Number).[A-Z][a-z]+ — поиск слов, начинающихся с заглавной буквы.\b\w{3,5}\b — слова длиной от 3 до 5 символов.При работе с квантификаторами важно учитывать их производительность — избыточное использование жадных квантификаторов может привести к значительным замедлениям при обработке больших текстов.