Wyrażenia regularne to potężne narzędzie do przeszukiwania, dopasowywania i manipulowania tekstem. W Pythonie moduł re
dostarcza zestaw funkcji, które umożliwiają pracę z wyrażeniami regularnymi. W tym artykule przedstawimy, jak można ich używać do rozwiązywania typowych problemów związanych z przetwarzaniem tekstów.
Wprowadzenie do modułu re
Moduł re
w Pythonie umożliwia korzystanie z wyrażeń regularnych dla stringów. Pozwala na wyszukiwanie wzorców, ich zamianę, a także ekstrakcję danych z tekstu.
Kompletny przykład użycia wyrażeń regularnych
Poniżej znajduje się przykład kodu, który demonstruje podstawowe operacje możliwe do wykonania za pomocą modułu re
, takie jak wyszukiwanie, podział tekstu, zamiana wzorców oraz ekstrakcja danych. Kod jest napisany w języku angielskim, ale komentarze są po polsku, aby ułatwić zrozumienie działania poszczególnych linii.
import re
# Tekst, na którym będą przeprowadzane operacje
text = "Python jest w wersji 3.9. Python 2.7 został wycofany."
# Wyszukiwanie wszystkich wystąpień 'Python'
found_python = re.findall("Python", text)
print("Znalezione wystąpienia 'Python':", found_python)
# Podział tekstu przy każdym wystąpieniu cyfry
split_by_number = re.split("\d", text)
print("Tekst podzielony przy cyfrach:", split_by_number)
# Zamiana 'Python' na 'Pythony'
replaced_python = re.sub("Python", "Pythony", text)
print("Tekst po zamianie 'Python' -> 'Pythony':", replaced_python)
# Wyszukiwanie wersji Pythona za pomocą wyrażenia
# regularnego z grupą
version_match = re.search("Python (\d\.\d)", text)
if version_match:
version = version_match.group(1)
print("Znaleziona wersja Pythona:", version)
W tym kodzie wykorzystujemy różne funkcje z modułu re
:
findall
do znalezienia wszystkich wystąpień słowa “Python” w tekście,split
do podziału tekstu za każdym razem, gdy napotka cyfrę,sub
do zamiany wszystkich wystąpień “Python” na “Pythony”,search
do wyszukania wersji Pythona w tekście przy użyciu grup w wyrażeniach regularnych.
Podsumowanie
Wyrażenia regularne w Pythonie to niezwykle użyteczne narzędzie do pracy z tekstami, które pozwala na skomplikowane operacje przetwarzania i analizy danych tekstowych. Moduł re
oferuje bogaty zestaw funkcji, które umożliwiają efektywne wyszukiwanie, zamianę, podział i ekstrakcję informacji z ciągów znaków. Dzięki przykładowi kodu zaprezentowanemu w tym artykule, możemy zobaczyć, jak stosować te funkcje w praktyce.
Jeżeli chcesz przyśpieszyć swoją naukę tworzenia stron chciałbym polecić mój kurs Python od podstaw w którym nauczysz się tego języka od podstaw do zaawansowanych jego aspektów.