Python to wysokopoziomowy język programowania ogólnego przeznaczenia z naciskiem na czytelność kodu. Obsługuje różne paradygmaty programowania, na przykład programowanie strukturalne, obiektowe i funkcjonalne. Często Python jest opisywany jako “batteries included”, dzięki swojej wszechstronnej bibliotece standardowej.
W tym poradniku poznamy różne sposoby usuwania białych znaków z ciągu znaków w języku Python.
Wymagania wstępne
Aby wykonać kroki przedstawione w tym poradniku, będziesz potrzebować następujących elementów:
-
- Odpowiednio skonfigurowanej maszyny z systemem Linux, na przykład serwera VPS z systemem Ubuntu na platformie CloudSigma.
-
- Odpowiednio skonfigurowanego środowiska programistycznego Python. Sprawdź konfigurację środowiska programistycznego Python na systemie Ubuntu.
-
- Odpowiedniego edytora tekstu, na przykład Brackets, VS Code, Sublime Text, Vim/NeoVim itp.
Krok 1 – Tworzenie skryptu w języku Python
W celach demonstracyjnych utworzymy skrypt w języku Python remove-space.py i umieścimy tam cały nasz kod. Następnie uruchomimy skrypt za pomocą interpretera Pythona.
Najpierw utwórz skrypt w języku Python:
|
1 |
touch remove-space.py |

Otwórz skrypt w edytorze tekstu:
|
1 |
nano remove-space.py |

Następnie utworzymy zmienną typu string s i przypiszemy do niej ciąg znaków:
|
1 |
s = ' the quick BROWN fox \t\n\r\tjumps away ' |

Jeśli dołączymy funkcję print(), możemy zobaczyć, jak interpretowany jest ten ciąg znaków:
|
1 2 |
s = ' the quick BROWN fox \t\n\r\tjumps away ' print(s) |

Tutaj,
-
- Funkcja
print()przyjmuje ciąg znaków jako argument.
- Funkcja
-
- Funkcja
print()potrafi interpretować znaki ukośnika wstecznego (backslash).
- Funkcja
Uruchom skrypt:
|
1 |
python remove-space.py |

Krok 2 – Usuwanie spacji wiodących i końcowych
Za pomocą funkcji strip() możemy usunąć wiodące i końcowe znaki z ciągu znaków.
Poniższy kod demonstruje użycie funkcji strip() na zmiennej s:
|
1 2 |
s = ' the quick BROWN fox \t\n\r\tjumps away ' print(s.strip()) |


Zauważ, że funkcja strip() usuwa wszystkie spacje wiodące i końcowe. Jeśli chcesz usunąć tylko spacje wiodące lub końcowe, użyj odpowiednio lstrip() lub rstrip() :
|
1 2 3 4 5 |
s = ' the quick BROWN fox \t\n\r\tjumps away ' print(s.strip()) print(s.lstrip()) print(s.rstrip()) |


Krok 3 – Usuwanie wszystkich białych znaków
Za pomocą funkcji replace() możemy zastąpić zawartość w ciągu znaków. Korzystając z tej funkcji, możemy zastąpić wszystkie białe znaki pustym ciągiem, tym samym je usuwając.
Zobaczmy działanie replace() w praktyce. Spójrz na poniższy kod:
|
1 2 3 |
s = ' the quick BROWN fox \t\n\r\tjumps away ' print(s.replace(" ", "")) |


Tutaj,
-
- Pierwszy parametr funkcji
replace()określa, jakiego wzorca szukać w podanym ciągu znaków.
- Pierwszy parametr funkcji
-
- Drugi parametr funkcji
replace()określa, jaka będzie zawartość zastępująca.
- Drugi parametr funkcji
Krok 4 – Usuwanie białych znaków za pomocą split() oraz join()
W tej sekcji użyjemy funkcji split() oraz join() .
-
split(): Przyjmuje ciąg znaków i dzieli go na listę. Punkty podziału są określane przez separator.
-
join(): Pobiera listę i łączy ją z powrotem w jeden ciąg znaków. Części są łączone za pomocą pojedynczego białego znaku (” “).
Zobaczmy te funkcje w działaniu. Spójrz na poniższy kod:
|
1 2 3 |
s = ' the quick BROWN fox \t\n\r\tjumps away ' print(" ".join(s.split())) |


Tutaj,
-
- Połączyliśmy użycie
split(),join(), orazprint()w jednej linii.
- Połączyliśmy użycie
-
- Wynik działania funkcji
split()jest przekazywany jako argument do funkcjijoin().
- Wynik działania funkcji
-
- Wynik działania
join()funkcja jest przekazywana jako argument doprint()funkcji.
- Wynik działania
Krok 5 – Usuwanie białych znaków za pomocą translate()
W Pythonie funkcja translate() zastępuje określone znaki znakami zdefiniowanymi w słowniku lub tabeli mapowania.
W tym przykładzie użyjemy słownika string.whitespace, który zawiera wszystkie białe znaki.
Spójrz na poniższy kod:
|
1 2 3 4 5 |
import string s = ' the quick BROWN fox \t\n\r\tjumps away ' print(s.translate({ord(c): None for c in string.whitespace})) |


Krok 6 – Usuwanie białych znaków za pomocą wyrażeń regularnych (Regex)
Wyrażenie regularne (w skrócie “regex”) to potężna funkcja w wielu językach programowania. Każde wyrażenie regularne składa się z serii znaków tworzących wzorzec wyszukiwania. Wyrażenie regularne może być użyte do sprawdzenia, czy ciąg znaków zawiera określony wzorzec.
Python również obsługuje wyrażenia regularne, co znacznie zwiększa jego możliwości manipulacji tekstem. W tej sekcji użyjemy wyrażeń regularnych, aby wyeliminować wszelkie białe znaki znalezione w naszym testowym ciągu znaków.
Spójrz na poniższy kod:
|
1 2 3 4 5 6 7 8 9 10 11 |
import re s = ' the quick BROWN fox \t\n\r\tjumps away ' print('Usuń wszystkie spacje:\n', re.sub(r"\s+", "", s), sep='') # \s dopasowuje wszystkie białe znaki print('Usuń początkowe spacje:\n', re.sub(r"^\s+", "", s), sep='') # ^ dopasowuje początek print('Usuń końcowe spacje:\n', re.sub(r"\s+$", "", s), sep='') # $ dopasowuje koniec print('Usuń początkowe i końcowe spacje:\n', re.sub(r"^\s+|\s+$", "", s), sep='') # | dla warunku LUB |


Tutaj,
-
- Importujemy
re, dedykowany pakiet do pracy z wyrażeniami regularnymi.
- Importujemy
Podsumowanie
W tym poradniku zademonstrowaliśmy różne sposoby radzenia sobie z białymi znakami w ciągu znaków w Pythonie. Przy okazji poznaliśmy również proste użycie różnych funkcji, takich jak split(), join(), replace(), translate(), itp.
Chcesz dowiedzieć się więcej o Pythonie? Sprawdź poniższe poradniki:
Komentarze
Brak komentarzy. Bądź pierwszy.