Bolj agresivno čiščenje filename: () prazni + catch-all noise besede
User: 'Topliška pomlad — KAR PADA NAJ SNEG ( - ) — tile oklepaji pa Official video itd. Daj ko se nalaga na Nextcloud mora biti samo izvajalec in naslov komada.' Dodatni NOISE_PATTERNS: 1. Prazni / dummy oklepaji: '( )', '( - )', '(-)', '(.)' itd. 2. Catch-all za oklepaje z noise besedami: video|audio|version|mix|edit|remix|cover|live|hd|hq|4k|8k| remaster|extended|clean|explicit|radio|lyric|official|musik 3. Avtor/producer brackets: '(prod. by X)', '(feat. Y)', '(ft. Z)' Test rezultat: 'Topliška pomlad - KAR PADA NAJ SNEG ( - )(Official 4K Video).mp4' → 'Topliška pomlad - KAR PADA NAJ SNEG - REEL.mp4' 'Sarah Connor - FICKA (Offizielles Musikvideo).mp4' → 'Sarah Connor - FICKA - REEL.mp4' Vsi novi uploadi bodo imeli čista imena. TODO ločeno: rename obstoječih 31 datotek na Nextcloudu (skript pripravljen)
This commit is contained in:
parent
376bb4db09
commit
4e2c690bc5
17
app/main.py
17
app/main.py
@ -217,6 +217,23 @@ _NOISE_PATTERNS = [
|
|||||||
|
|
||||||
# Trailing year in parens (npr. "(2024)")
|
# Trailing year in parens (npr. "(2024)")
|
||||||
r"\(\d{4}\)\s*$",
|
r"\(\d{4}\)\s*$",
|
||||||
|
|
||||||
|
# Prazni / dummy oklepaji: "( )", "( )", "( - )", "(-)", "(.)"
|
||||||
|
r"\(\s*[-–—._]*\s*\)",
|
||||||
|
|
||||||
|
# Catch-all: oklepaji z "video"/"audio"/"version"/"mix"/"edit"/"remix"
|
||||||
|
# (široko match — če oklepaji vsebujejo te besede, so verjetno noise)
|
||||||
|
r"\([^)]*\b(?:video|audio|version|mix|edit|remix|cover|live|hd|hq|4k|8k|remaster(?:ed)?|extended|clean|explicit|radio|lyric[s]?|official|offizielles?|musik)\b[^)]*\)",
|
||||||
|
|
||||||
|
# Catch-all: oglati oklepaji z noise besedami
|
||||||
|
r"\[[^\]]*\b(?:video|audio|version|mix|edit|remix|cover|live|hd|hq|4k|official|musik)\b[^\]]*\]",
|
||||||
|
|
||||||
|
# Avtor/feat. v oklepajih: "(prod. by X)", "(feat. Y)", "(ft. Z)"
|
||||||
|
r"\(\s*(?:prod\.?(?:uced)?\s+by|feat\.?(?:uring)?|ft\.?)\s+[^)]+\)",
|
||||||
|
|
||||||
|
# Trailing številke ki označujejo verzije: "33" na koncu (npr. "Modrijani - X 33")
|
||||||
|
# POZOR: zelo previdno, ker so lahko legit (npr. del naslova)
|
||||||
|
# — Ne dodam splošnega trailing številk pattern-a, ker bi razbil legitime
|
||||||
]
|
]
|
||||||
|
|
||||||
def parse_artist_title(filename_or_title):
|
def parse_artist_title(filename_or_title):
|
||||||
|
|||||||
Loading…
Reference in New Issue
Block a user