Χρήσιμα Linux Audio εργαλεία

tuxx

Supreme Member
3 January 2014
3,319
/dev/null
Από τη στιγμή που έχεις εγκατεστημένη python3, μπορείς να το εγκαταστήσεις από τον "package manager" της python:

Code:
pip3 install sacad
 
Μετά από αρκετή ταλαιπωρία (κυρίως του Μιχάλη :p) έπαιξε και σε μένα, σε ένα από τα SBCs μου.

Χαριτωμένο είναι.. Σε δείγμα 30 φακέλων με ποπ μουσική πέτυχε τα πιο πολλά εξώφυλλα.

Αλλά είναι όντως της υπομονής..
 

tuxx

Supreme Member
3 January 2014
3,319
/dev/null
Εγώ το έβαλα να ψάξει περίπου 1200 εξώφυλλα. Κρίνοντας εκ του αποτελέσματος (τα είδα σχεδόν όλα από MPD client που τραβάει τα εξώφυλλά μου), πρέπει να είχα πρόβλημα με περίπου 50-60, η πλειοψηφία των οποίων ήταν ελληνικά. Διόρθωσα και τα τελευταία και εξώφυλλα τέλος!

Όσον αφορά στο πόση ώρα κάνει για να ολοκληρώσει την εργασία του, αργεί όντως πάρα πολύ και θεωρώ ότι αυτό θα είναι κάποιο bug. Με την πρώτη ευκαιρία θα επικοινωνήσω με τον developer μπας και έχει καμια ιδέα.
 

DomieMic65

Supreme Member
10 July 2006
9,689
Αθήνα
Ένα από τα tasks που δε με είχε απασχολήσει μέχρι στιγμής είναι το αυτόματο κατέβασμα cover arts για τα flac albums μου. Παρότι μέχρι στιγμής αρκούμαι σε MPD clients που κατεβάζουν το cover art στον ίδιο τον client χωρίς να αποδθηκεύουν κάτι στο directory του album, θέλω να έχω και το εξώφυλλο του άλμπουμ με κοινή οναμασία για όλα τα albums ως Folder.jpg, γιατί μπορεί κάποια στιγμή να θελήσω να σερβίρω τα εξώφυλλα τοπικά.

Η λύση στο παραπάνω δόθηκε με ένα νέο σχετικά απ ότι φαίνεται python script:

https://github.com/desbma/sacad

Έτσι με την παρακάτω εντολή:

Code:
sacad_r /path/to/Music 600 Folder.jpg

έλυσα το πρόλημά μου, καθώς το sacad ψάχνει online για εξώφυλλα (βασισμένο στα medatata των αρχείων), και κατεβάζει αρχεία σε κάθε directory 600x600 με την ονομασία Folder.jpg. Αν ένα directory έχει ήδη αρχείο με ονομασία Folder.jpg, το αγνοεί και πάει στο επόμενο.

Αρχικά το δοκίμασα σε καμια 10ρια albums, και αφού είδα ότι τα κατάφερε, αυτή τη στιγμή το έχω βάλει να μου φέρει όλα τα εξώφυλλα που λείπουν από την βιβλιοθήκη μου.


Υ.γ. Να σημειωθεί ότι υπάρχει command line εκτελέσιμο και για windows.

Μιχάλη δλδ δίνουμε την εντολή στο Archphile και κάνει τη δουλειά;
 

tuxx

Supreme Member
3 January 2014
3,319
/dev/null
Δεν είναι εγκατεστημένο σε Archphile και δεν έχω δοκιμάσει να το εγκαταστήσω ακόμα.
 

Κώστας Γκαβάκος

AVClub Enthusiast
16 March 2009
1,287
Αθήνα
Με την ευκαιρία του παραπάνω οδηγού, έκανα κάποια transcodes και έβγαλα και τα αντίστοιχα spectrograms με τη χρήση του spek τα οποία και παραθέτω:












Θέλετε κάτι παραπάνω για να πεισθείτε ότι όταν με το καλό μετατρέψετε τα CD σας σε ψηφιακά αρχεία, θα πρέπει να επιλέξετε FLAC; Είναι πασιφανές ότι έχει κουτσουρευθεί σχεδόν ότιδήποτε πάνω από τα 15Khz. Παράλληλα βλέπουμε ότι πιθανώς η επιλογή του V0 να είναι προτιμότερη από μετατροπή σε 320 CBR.

Χρησιμοποιώ αρκετό καιρό το spek για τον έλεγχο των αρχείων μου και το βρίσκω εξαιρετικό αλλά έχω μια παρατήρηση και συνάμα απορία.
Νομίζω ότι τα 16/44,1 flacs πρέπει να φθάνουν μέχρι τα 22 KHZ.
Στο πρώτο σχεδιάγραμμα που δείχνεις τελειώνουν και μάλιστα σε ευθεία γραμμή ανάμεσα στα 20 και 22 KHZ. Στα δικά μου flacs οι κορυφές του spectogram ή ολόκληρο τερματίζει στα 22 KHZ.
Άν έχω δίκιο τότε το αρχείο αυτό δεν είναι 16/44.1.

Eξαιρετική παρουσίαση και για εμένα άσχετο με to Linux
 

tuxx

Supreme Member
3 January 2014
3,319
/dev/null
Ένα flac 16/44.1 ΜΠΟΡΕΙ να φτάσει μεχρι περίπου τα 22Khz, δε σημαίνει όμως ότι όλα είναι εκει!

Μια που πλέον έχω αναλύσει όλη μου την ψηφιακή βιβλιοθήκη και έχω δει μυριάδες spectrograms, έχω να σου πω ότι έχω βρει αρκετές περιπτώσεις (και μάλιστα αγορασμένων FLACS) που κόβονται λίγο πιο κάτω με ευθεία γραμμή όπως είδες. Γιατιί;;; Γιατί έτσι αποφάσισε ο παραγωγός. Να σημειώσω ότι μιλάμε για ηλεκτρονική μουσικη κυρίως.

Οπότε ναι, από τη μία είναι περίεργο να βλέπεις τέτοιο κουτσούρεμα στις 21000, από την άλλη δεν είναι σπάνιο!

Επίσης μπορείς να ρίξεις μια ματιά και εδώ:

http://avclub.gr/forum/showthread.p...γραμμα?p=1057785785&viewfull=1#post1057785785

Όπως αναφέρω στο link, το παρακάτω spectrogram είναι από MP3 V0:

View attachment 134647



Εν ολίγοις, βάσει του παραπάνω, μπορείς να μου δώσεις ένα CD σου, να στο ριπάρω σε MP3 V0 και να σου δώσω spectrogram το οποίο θα φτάνει μέχρι τους 22000 κύκλους. Εδώ λοιπόν περιπλέκεται ακόμα περισσότερο και χρειάζεται "σπουδή" πάνω στην σωστή ανάγνωση του spectrogram γιατί το μοναδικό έυρημα που μας κάνει να θεωρόυμε το παραπάνω MP3 και όχι FLAC/WAV είναι το έξτρα κούρεμα στους 16000 κύκλους.


Απ' ότι κατάλαβες άβυσσος!


Edit: Θυμήθηκα μόλις από ποιον δίσκο είναι το "κουρεμένο" Flac. Είναι από ελληνικό συγκρότημα με ονομασία 1000mods (πολύ γνωστό πλέον και εκτός ελλάδας στο χώρο του Stoner Rock) και από το δίσκο τους Vultures τον οποίο έχω αγοράσει εδώ και καιρό από το bandcamp.
 
Last edited:

DomieMic65

Supreme Member
10 July 2006
9,689
Αθήνα
Δεν είναι εγκατεστημένο σε Archphile και δεν έχω δοκιμάσει να το εγκαταστήσω ακόμα.
Έγινε... Ευχαριστώ!
Γμτ ο MPDroid client στο κινητό μου κατεβάζει έναν αρκετά μεγάλο αριθμό covers ενώ ο Soundirok σε iOS τπτ!
 

tuxx

Supreme Member
3 January 2014
3,319
/dev/null
Για να σου δείξω ακόμα ένα καλό παράδειγμα, διάλεξα επίτηδες μια παραγωγάρα και ριπάρισμα που έχω κάνει εγώ με τα χεράκια μου από CD της δισκοθήκης μου:


Tsuyoshi Yamamoto Trio - Girl Talk (Three Blind Mice)


Τα spectrograms από αυτή τη δισκάρα λοιπόν είναι όλα όπως το παρακάτω:


01 - The Way We Were.jpg


Όπως θα δεις είναι κουρεμένο ακόμα πιο κάτω.


Εδώ είναι και μια ωραία περίπτωση να δεις το mp3 V0 το οποίο δείχνει με ακραίο τρόπο το κούρεμα στους 16000 που πιο πάνω μας ξεγελάει:

01 - The Way We Were.mp3.jpg



Η σούμα είναι ότι υπάρχουν πολλές παραγωγές με το κούρεμα που παρατήρησες. Επίσης Υπάρχουν πολλά mp3 V0 που μοιάζουν εντελώς με FLAC. Αναφορικά με το τελευταίο, αυτό δεν είναι δεδομένο, μια που όπως έδειξε το παραπάνω spectro του V0 υπάρχουν περιπτώσεις όπου είναι πασιφανές ότι δεν είναι ασυμπίετο.

Ελπίζω να βοήθησα!
 

tuxx

Supreme Member
3 January 2014
3,319
/dev/null
Έγινε... Ευχαριστώ!
Γμτ ο MPDroid client στο κινητό μου κατεβάζει έναν αρκετά μεγάλο αριθμό covers ενώ ο Soundirok σε iOS τπτ!


ο Soundirok τραβάει τοπικά τα εξώφυλλα. Αυτό θέλει έξτρα configuration στο Archphile, όπως και στις πιο πολλές διανομές, αλλά καλύτερα να το συζητήσουμε στο νήμα του Archphile!
 

Κώστας Γκαβάκος

AVClub Enthusiast
16 March 2009
1,287
Αθήνα
Πολύ επεξηγηματικά αυτά που αναφέρεις αλλά μήπως καταλήξουμε κάπου πρακτικά.

1)Αν το spectrogram του spec φθάνει τα 22 KHZ έχουμε ασυμπίεστο flac. Μπορεί να είναι και mp3 VΟ αλλά είναι απίθανο κάποιος που μας δίνει ένα flac αφιλοκερδώς να μας παραπλανήσει.
2) Ο γενικός κανόνας τουλάχιστον στην κλασσική μουσική και σύμφωνα με τα spectogram που κατά τύχει έχω κάνει είναι να φθάνει στα 22KHZ.
3)Μπορεί το αρχείο να είναι ασυμπίεστο και να φθάνει τα 20ΚΗΖ επειδή έτσι αποφάσισε η εταιρία. Αυτό όμως δεν είναι ο κανόνας.
4) Κάθε αρχείο flac κάτω από 20ΚΗΖ είναι συμπιεσμένο.

Αυτά αν συμφωνείς.
 

tuxx

Supreme Member
3 January 2014
3,319
/dev/null
Πολύ επεξηγηματικά αυτά που αναφέρεις αλλά μήπως καταλήξουμε κάπου πρακτικά.

1)Αν το spectrogram του spec φθάνει τα 22 KHZ έχουμε ασυμπίεστο flac. Μπορεί να είναι και mp3 VΟ αλλά είναι απίθανο κάποιος που μας δίνει ένα flac αφιλοκερδώς να μας παραπλανήσει.
2) Ο γενικός κανόνας τουλάχιστον στην κλασσική μουσική και σύμφωνα με τα spectogram που κατά τύχει έχω κάνει είναι να φθάνει στα 22KHZ.
3)Μπορεί το αρχείο να είναι ασυμπίεστο και να φθάνει τα 20ΚΗΖ επειδή έτσι αποφάσισε η εταιρία. Αυτό όμως δεν είναι ο κανόνας.
4) Κάθε αρχείο flac κάτω από 20ΚΗΖ είναι συμπιεσμένο.

Αυτά αν συμφωνείς.

1. Ναι, αν φτάνει μέχρι τα 22KHz είναι πιθανότατα ασυμπίεστο. Όσον αφορά στο ότι είναι απίθανο κάποιος που μας δίνει αφιλοκερδώς αρχεία μουσικής να μας παραπλανήσει, ισχύει το ακριβώς αντίθετο από αυτό που λες! Η πιθανότητα είναι τεράστια και οι λόγοι για να γίνει αυτό είναι διάφοροι, αλλά ας μην το ανοίξουμε αυτό το θέμα. To σίγουρο είναι ότι εκεί έξω κυκλοφορούν άπειρα transcodes προσφερόμενα αφιλοκερδώς ως flacs.

2. Ο γενικός κανόνας είναι να υπάρχει πληροφορία μέχρι τους 22, αλλά δες και το παρακάτω (3).

3. Μπορεί το αρχείο να είναι ασυμπίεστο και το cut-off frequency να στα 21, 20 ή και ακόμα παρακάτω. Αυτό εξαρτάται από την παραγωγή. Παρόλα αυτά, όσο πιο πίσω πας χρονικά σε ηχογραφήσεις (και σε "ψηφιοποιήσεις" παλαιών ηχογραφήσεων κυρίως), η πιθανότητα να βρεις τέτοιες περιπτώσεις είναι μεγάλη. Δες πχ εδώ και άλλα παραδείγματα από τη βιβλιοθήκη μου:

- Brothers in arms (Dire Straits)

09_-_Brothers_In_Arms.jpg



- Freefall (Camel)

01_-_Freefall.jpg



- Brown Sugar (Rolling Stones)

01_-_Brown_Sugar.jpg



4. Συνήθως ναι, αλλά αν ψάξεις πχ στο hydrogen που είναι σοβαρότατο forum γύρω από τα θέματα αυτά, θα διαβάσεις για περιπτώσεις που το cut off frequency ήταν ακόμα παρακάτω.


Σχόλια:

- Αξίζει να κάνεις μια έρευνα και σε περιπτώσεις δίσκων από το HD Tracks κλπ που πωλούνταν ως Hi Res ενώ επρόκειτο για απλά upsamples από 16/44.1

- Όταν λέμε ότι ένα ασυμπίεστο φτάνει μέχρι τους 22, αυτό δε σημαίνει ότι θα υπάρχει φουλ πληροφορία μέχρι τους 22. Αν πχ δεις το spectro από ένα κομμάτι με ένα πιάνο μόνο, το μεγαλύτερο εύρος θα είναι μέχρι 8-10 χιλιάδες. Βέβαια από κει και πάνω δε θα είναι κατάμαυρο, αλλά θα έχει "χιονάκια¨


Να σημειωθεί ότι στο νήμα αυτό, έχουν δοθεί όλα τα εργαλεία για να μπορέσει να τσεκάρει κάποιος ένα flac ripped album (τσεκάρισμα με accuraterip, spectros, αναλυση δυναμικού εύρους κλπ). Τώρα τελευταία προσπαθώ να καταλήξω στην καλύτερη μέθοδο για τσεκάρισμα μέσω accuraterip και παρότι έχω βρει 3 τρόπους να γίνει με linux εργαλεία (στο νήμα αυτό έχει παρουσιαστεί ένας), έχω καταλήξει να τρέχω ένα command line εργαλείο από CUETools με wine, γιατί με τρον τρόπο αυτό εκτός από τσεκάρισμα με την database του accuraterip, γίνεται και ένα επιπλέον με τη database του cuetools. H εντολή είναι:

Code:
wine /path/to/cuetools/ArCueDotNet.exe *.cue > cuetools.log

Έτσι τρέχοντας το παραπάνω χρησιμοποιώντας το .cue από το rip που έχω κάνει στο Mirage των Camel, εξάγεται το παρακάτω:
Code:
[CUETools log; Date: 9/17/2017 2:48:17 AM; Version: 2.1.5]
Pregap length 00:00:32.
[CTDB TOCID: BjcI1xro3sPRjyeP5MI7FV1pdrQ-] found.
Track | CTDB Status
  1   | (42/42) Accurately ripped
  2   | (42/42) Accurately ripped
  3   | (42/42) Accurately ripped
  4   | (42/42) Accurately ripped
  5   | (41/42) Accurately ripped, or (1/42) differs in 5038 samples @08:06:61-08:06:68
[AccurateRip ID: 0006ad27-00203825-2e08ec05] found.
Track   [  CRC   |   V2   ] Status
 01     [93952e1f|af4a7014] (19+34/75) Accurately ripped
 02     [02c4fa21|210d45d3] (19+34/75) Accurately ripped
 03     [1e796dd6|5a61705c] (19+34/75) Accurately ripped
 04     [a446749c|57e45b61] (19+34/73) Accurately ripped
 05     [f5564dc1|111c781c] (18+34/74) Accurately ripped
Offsetted by -22:
 01     [4f482155] (05/75) Accurately ripped
 02     [abfdf637] (05/75) Accurately ripped
 03     [b4773138] (05/75) Accurately ripped
 04     [77eb64dc] (05/73) Accurately ripped
 05     [5b7c3d4f] (06/74) Accurately ripped

Track Peak [ CRC32  ] [W/O NULL] [  LOG   ]
 --   99.9 [BA8B735F] [1E25822F]           
 01   99.9 [5297989F] [1A987C1C]   CRC32   
 02   93.7 [BBFB8188] [2BC1E1D2]   CRC32   
 03   93.7 [79846BE8] [854BB375]   CRC32   
 04   93.7 [1ED7BC55] [885DC1F6]   CRC32   
 05   93.7 [7BB539EE] [6519999D]   CRC32


Bέβαια, η ύπαρξη σωστού cue αρχείου, δεν εγγυάται ότι και τα αρχεία δεν είναι transcoded.
 
Last edited:

tuxx

Supreme Member
3 January 2014
3,319
/dev/null
Δε μου επιτρέπεται να κάνω edit το παραπάνω, αλλά ο τελευταίος μου ισχυρισμός περί cue και transcoded αρχεία δεν στέκει!
 

DomieMic65

Supreme Member
10 July 2006
9,689
Αθήνα
Μου έχει τύχει εμένα σε άλμπουμ από HDTracks (88.2KHz) να υπάρχει μια πολύ περίεργη παραμόρφωση ειδικά στις νότες του πιάνου... τους έστειλα ότι είναι προβληματικό το άλμπουμ και μου επίτρεψαν να κατεβάσω όποιο άλλο άλμπουμ θέλω δωρεάν!
Αν θέλετε σας στέλνω κάποιο δείγμα για δοκιμή!
 

tuxx

Supreme Member
3 January 2014
3,319
/dev/null
Στο ποστ αυτό θα αναφερθώ στο πως μπορούμε να συμπιέσουμε DSD αρχεία. Όταν αναφέρομαι στον όρο συμπίεση το εννοώμε την ίδαι ακριβώς λοπγική της διαδικασίας που κάνουμε συμπιέζοντας ένα WAV σε FLAC, μόνο που εδώ τη δουλειά μας θα την κάνουμε με το wavpack.

Έστω ότι έχουμε ένα folder με DSF αρχεία. Το μόνο που χρειάζεται να κάνουμε έιναι:

Code:
wavpack *.dsf

Αν δούμε μέρος του man του wavpack

-
d
delete source file if successful (use with caution!)

-f
fast mode (fast, but some compromise in compression ratio)

-h
high quality (better compression ratio, but slower encode and decode than default mode)

-hh
very high quality (best compression, but slowest and NOT recommended for use on portable
playback devices)

--import-id3
import applicable tag items from ID3v2.3 tag present in DSF files into APEv2 tag (if there
are > 1 MB cover images present add --allow-huge-tags to include them, and -r if you do not
want large images appearing twice in the WavPack file, although this will remove the entire
ID3 tag wrapper)

διαπιστώνουμε ότι μπορούμε να παίξουμε επιπλέον με το compression:


Code:
wavpack -hh *.dsf


To αποτέλεσμα και των 2 παραπάνω εντολών είναι δίπλα σε κάθε dsf να βρούμε και ένα .wv αρχείο.


Στο blog μου, έκανα δοκιμή ξεκινώντας από ένα SACD ISO 3.5GB.

Το πρώτο πράγμα που έκανα ήταν να εξάγω τα δικάναλα DSF με το επίσημο εργαλείο:


Code:
sacd_extract -2 -s -C -i blabla.iso


To συνολικο μέγεθος των δικάναλων αρχείων ήταν 2.6GB. Καθόλου άσχημη μείωση...


Στη συνέχεια, με χρήση του wavpack, χρησιμοποιώντας την απλή συμπίεση τα τελικά αρχεία είχαν μέγεθος 1.6GB ενώ με το high quality compressiom 1.2GB.

Αν αναλογιστούμε ότι ξεκίνησα από τα 3.5GB, νομίζω ότι η αποστολή ήταν επιτυχής :D


Για την ιστορία η μετατροπή από dsf σε wv είναι πλήρως αναστρέψιμη και με χρήση της παρακάτω εντολής έχουμε το αντίθετο αποτέλεσμα:

Code:
wvunpack *.wv


Είναι πολύ εύκολο να πάρουμε πχ τα sha256sums των αρχικών dsf και παίρνοντας τα άλλη μία μετά την αποσυμπίεση των wv να διαπιστώσουμε ότι έχουμε στα χέρια μας ακριβώς τα ίδια αρχεία.


Συνοψίζοντας έχουμε μια λύση που μειώνει πολύ τον όγκο δεδομένων:

- Μη απωλεστικά
- Πληρως αναστρέψιμα
- Με πολύ καλή απόδοση συμπίεσης
- Με υποστήριξη tagging
- Με πλήρως ανοιχτό κώδικα (γιατί δε θέλουμε κανένα από τα φορμά που χρησιμοποιούμε να είναι proprietary και αυτός είναι ένας από τους βασικούς λόγους που κάθε υγειώς σκεπτόμενος νους επιθυμεί "καρκινώματα" τύπου MQA να εξαφανιστούν)


Ως μόνο μειονέκτημα θα εντόπιζα το γεγονός ότι η real time αποσυμπίεση απαιτεί έξτρα χρήση CPU σε σχέση με την αναπαραγωγή DSF. Η χρήση CPU βέβαια αυτή είναι πταίσμα μπροστά στη CPU που απαιτεί ένα DST compressed SACD ISO για να αναπαραχθεί είτε απο foobar είτε από το fork του MPD κλπ..


Υ.γ. Όλα τα παραπάνω μπορούν να γίνουν σε διάφορα OS, καθώς το wavpack παίζει σε όλα τα γνωστά.