diff --git a/app/main.py b/app/main.py index 5f3919e..9b51e1c 100644 --- a/app/main.py +++ b/app/main.py @@ -218,6 +218,12 @@ _NOISE_PATTERNS = [ # Trailing year in parens (npr. "(2024)") r"\(\d{4}\)\s*$", + # Trailing 2-4 digit number na koncu (verjetno leto: "23", "2023", "33"): + # POMEMBNO: samo če je ZADNJA stvar v stringu in ne del besede + # NE odstrani '33 točk' ampak DA odstrani 'Naslov 33' + # Pred številko: presledek/oklepaji/ničesar + r"\s+\d{2,4}\s*$", + # Prazni / dummy oklepaji: "( )", "( )", "( - )", "(-)", "(.)" r"\(\s*[-–—._]*\s*\)",