Soundstage Revealed

Ge0rge

AVClub Addicted Member
17 April 2007
2,784
*Δεν ξέρω αν έχει γραφτεί κάτι παρόμοιο, αλλά είπα να το τολμήσω χωρίς να ψάξω.


Έχει τύχει ποτέ να ακούσετε ένα σύστημα και να πείτε ή να σκεφτείτε «ακούγεται καλύτερα από του τάδε που κοστίζει τα διπλάσια» ή «τι χάλι ηχεία είναι αυτά, πως ακούγονται έτσι» και ο ιδιοκτήτης να έχει δώσει ένα διχίλιαρο ή και παραπάνω για να τα αποκτήσει; Και να μπει στην διαδικασία να αναρωτηθεί κάποιος.... πως είναι δυνατόν με τόσο ανταγωνισμό που επικρατεί, να υπάρχουν εταιρείες που δαγκώνουν (οικονομικά) τους πελάτες τους αδιαφορώντας για την αναλογία ποιότητας /κόστους του ανταγωνισμού. Εντάξει υπάρχουν τέτοιες εταιρείες, προς τα πάνω και προς τα κάτω, αλλά είναι εξαιρέσεις δεν είναι ο κανόνας. Οπότε σε τι οφείλονται αυτές οι «μεγάλες» διαφορές;

Υπάρχει ένας όρος που περιλαμβάνει όλα εκείνα τα χαρακτηριστικά ενός ήχου που σχετίζονται με την τρισδιάστατη τοποθέτησή του στον χώρο, τα «Depth Cues».

Τα Depth Cues περιλαμβάνουν όλα εκείνα τα στοιχεία που υποδεικνύουν στον εγκέφαλο ακριβώς που βρίσκεται αυτό που ακούει. Γι’ αυτό ακόμα και αν κλείσει κάποιος τα μάτια του μπορεί να υποδείξει με ακρίβεια μέσα στο δωμάτιο την θέση ενός ανθρώπου που του μιλάει.

Τα σημαντικότερα Depth Cues είναι τέσσερα και είναι τα εξής:

1) Αναλογία ευθέως / ανακλώμενου ήχου (το σημαντικότερο)
  • Κοντά = πολύ direct, λίγες αντανακλάσεις
  • Μακριά = λιγότερο direct, περισσότερος “χώρος” – περισσότερες αντανακλάσεις
2) Timing (πολύ μικρές καθυστερήσεις)
  • reflections που φτάνουν με λίγα ms καθυστέρηση στα αυτιά του ακροατή
  • -> ο εγκέφαλος λέει: “είναι πιο πίσω”
3) Υψηλές συχνότητες (HF roll-off)
  • οι ήχοι που έρχονται από μακριά έχουν «λιγότερες» υψηλές συχνότητες
  • -> πιο “μαλακά” = πιο πίσω
4) Ένταση
  • πιο δυνατά = πιο κοντά
  • πιο χαμηλά = πιο πίσω

Ο εγκέφαλος χρησιμοποιεί όλα τα παραπάνω προκειμένου να φτιάξει μια τρισδιάστατη εικόνα στο κεφάλι του και να εντοπίσει την θέση της πηγής του ηχητικού σήματος.

Για παράδειγμα, όταν κάτι ακούγεται ποιο πίσω, σημαίνει ότι αυτό έχει χαμηλότερη ένταση, περισσότερες αντανακλάσεις έως ότου φτάσει ο ήχος και διαφορετικό timing, φτάνει δηλαδή στα αυτιά του ακροατή με μια μικρή καθυστέρηση.

Μια σύντομη διευκρίνηση. Το Timing των Depth Cues δεν έχει σχέση με αυτό που ονομάζουμε jitter στα ψηφιακά κυκλώματα. Το συγκεκριμένο timing (phase) μετριέται σε ms ενώ το jitter σε ns ή ps, μιλάμε δηλαδή για εντελώς διαφορετική τάξη μεγέθους (πάνω από 1.000.000 φορές διαφορά). Θεωρητικά αν το Jitter είναι πολύ μεγάλο μπορεί να επηρεάσει το timing, αλλά τόσο υψηλό jitter είναι δύσκολο να συναντήσουμε σε μοντέρνα κυκλώματα.


Οπότε και με την λογική από τι επηρεάζονται τα Depth Cues?

1) Συμμετρία χώρου (Νο1 παράγοντας)
2) Πρώτες ανακλάσεις (πλαϊνοί τοίχοι)
3) Μπάσο (masking)
4) Γεωμετρία (ηχεία + θέση ακρόασης)
5) Direct vs reflected ratio
6) Αναλογικό στάδιο συστημάτων
7) Κλίση ηχείων (fine tuning εργαλείο για βάθος /πλάτος)


Όλα τα παραπάνω επηρεάζουν την ικανότητα του ακροατή να αντιληφθεί την θέση των οργάνων εντός της σκηνής, εφ’ όσον φυσικά ο ηχολήπτης τα έχει συμπεριλάβει στην ηχογράφηση. Κατά την ηχογράφηση λοιπόν, ο ηχολήπτης λαμβάνει υπ’ όψιν του ότι το εν λόγω κομμάτι θα ακουστεί σε έναν χώρο φροντισμένο, όπως είναι το στούντιο, όπου υπάρχει συμμετρία, ελεγχόμενες αντανακλάσεις και απορροφήσεις και ενσωματώνει Depth Cues σε αυτήν, εισάγει δηλαδή εικονικό χώρο με την μορφή μικρών καθυστερήσεων της τάξεως των ms (reflections), reverb, μικρές διαφορές έντασης, φασματικές αλλαγές… έτσι ώστε ο ακροατής να αντιληφθεί βάθος και πλάτος. Όμως τα εισάγει με μια δόση υπερβολής (αρκετά ισχυρά δηλαδή) ώστε να μην «χαθούν» σε έναν μέτριο χώρο.

Οπότε όσο ποιο κοντά στο ιδανικό είναι ο χώρος ακρόασης, τόσο ποιο σωστά (με λιγότερα λάθη) θα μπορέσει ο ακροατής να ακούσει τις «πληροφορίες» από τα Depth Cues της ηχογράφησης, άρα τόσο καλύτερα θα μπορέσει να αντιληφθεί το εικονικό soundstage με τις θέσεις των οργάνων σε αυτό. Οπότε τα Depth Cues δεν χάνονται από την ηχογράφηση αλλά λόγω του χώρου φτάνουν στα αυτιά του ακροατή με σφάλματα π.χ. στον χρονισμό ή στο φάσμα. Και επειδή τα μεγέθη είναι πολύ μικρά, ανάλογα την έκταση του σφάλματος, μπορεί να ακουστεί για παράδειγμα από μικρότερο βάθος έως και flat ή αν δεν υπάρχει συμμετρία να μετατοπιστεί η σκηνή προς την μια ή την άλλη μεριά ή ο ήχος να μην ξεκολλάει καθόλου από τα ηχεία.


Ναι αλλά αυτό που φτάνει στα αυτιά μας είναι μια μίξη ήχου direct με reflected. Πως λειτουργεί αυτό και πως αντιλαμβάνεται ο εγκέφαλος τι ακριβώς γίνεται;

Εδώ είναι η μαγεία… O εγκέφαλος ξεχωρίζει μέσα στο μίγμα τους δύο ήχους. Ο direct κλειδώνει στην αντίληψή μας το «από που έρχεται ο ήχος» και τα reflections καθορίζουν το πόσο μακριά βρίσκεται η ηχητική πηγή (βάθος). Τα reflections έχουν μικρή καθυστέρηση στην άφιξη, μικρή διαφορά στο φάσμα και στην ένταση, οπότε ο εγκέφαλος αντιλαμβάνεται τις διαφορές και «χαρτογραφεί» τον χώρο. Αυτό όμως ο εγκέφαλος μπορεί να το κάνει, μόνο εφ’ όσον ο direct ήχος έχει τις παραπάνω διαφορές από τον reflected (εντός κάποιων ορίων) και η διαφορά που φτάνουν στα αυτιά του ακροατή είναι μεταξύ (περίπου) 1 και 20ms. Αν τα reflections είναι πολύ δυνατά, ανταγωνίζονται τον direct το κέντρο απλώνει ή τραβάει προς τους τοίχους. Αν φτάσουν πολύ νωρίς ή είναι πολλά χάνεται το focus και υπάρχει θολούρα.


Οπότε τα μηχανήματα δεν παίζουν κανέναν ρόλο;
Φυσικά και παίζουν μεγάλο ρόλο, αλλά ειδικά για το soundstage ο χώρος είναι ποιο κρίσιμος. Και βέβαια δεν σημαίνει ότι αγοράζουμε ότι να ναι, τα πετάμε σε ένα ράφι και περιμένουμε να ακούσουμε τρισδιάστατα. Δεν δουλεύει έτσι, γιατί για παράδειγμα ο θόρυβος, η παραμόρφωση είναι και αυτά καθοριστικά ως έναν βαθμό.


Μπορούμε να «διορθώσουμε» τον χώρο με DSP?
Ναι, αλλά μέχρι ένα σημείο. Είναι πολύ δύσκολο ένα οικιακό περιβάλλον να είναι στο επίπεδο που θα μπορεί να αποκαλύψει όλα τα Depth Cues μιας ηχογράφησης, αλλά μπορούμε να καλύψουμε μέρος της διαδρομής με το DSP.
 
Ένα πολύ ωραίο παράδειγμα με πλασματικά εφέ είναι το Desert Roses του Sting.

https://tidal.com/track/2530225/u

Ο ήχος της εισαγωγής δίνει την εντύπωση ότι είναι άμμος (στην έρημο - ίσυχο τοπίο) που σηκώνεται σε μια ρηπή αέρα, κατευθύνεται προς την θέση ακρόασης αλλά προς τα πάνω και εξωτερικά των ηχείων και κάνει έναν ελιγμό μέσα στον χώρο, Full 3D experience όπως τα γνωστά bubbles. Τα χαρακτηριστικά στα οποία στηρίχθηκε ο μηχανικός ήχου για να "φτιάξει" το συγκεκριμένο εφέ λέγονται Spatial Cues (vs Depth Cues) και σε αυτά οφείλεται η ικανότητα του ανθρώπινου εγκεφάλου να εντοπίζει την θέση, την απόσταση και την κίνηση μιας ηχιτικής πηγής.

Για να ακουστεί το παραπάνω εφέ με αυτό τον τρόπο, πρέπει το σύστημα να έχει σωστή φάση, καλή ομοιομορφία μεταξύ των καναλιών, καλό timing και να υπάρχει ενίσχυση από τον χώρο, να υπάρχουν δηλαδή πλαϊνά reflections.

Με λίγα λόγια, χώρος, χώρος και χώρος.
 
To ΑΙ δεν έδωσε ιδιαιτέρως καλές πληροφορίες σε αυτή τη περίπτωση.

Παραδείγματος χάρη, στα 10ms (direct vs reflected sound arrival) δεν υπάρχει "διαχωρισμός", ο εγκέφαλος μας έχει μάθει να τα φιλτράρει και να τα κάνει ως "ένα" unique σήμα και όχι αρχικό σήμα + echoed.
Θες 25+ms για να αρχίσει να υπάρχει διαχωρισμός μεταξύ των 2 "σημάτων" (συνήθως πάνω από 30ms, ούτε καν τα 25 που λέω χάρην εξαιρέσεων).

Σε μη treated δωμάτια, άλλα είναι τα κυριότερα προβλήματα και όχι το delayed arrival του reflected sound (εκτός και αν έχεις έναν χώρο με βάθος 8μ και πλάτος 3μ με ελάχιστες "απορροφητικές" επιφάνειες/στοιχεία, κλπ. :D ).

Το πως αντιμετωπίζεις (ή όχι) τα πρώτα reflections (ποιά; δεν είναι μόνο τα side wall reflections, είναι και το πάτωμα, και το ταβάνι) εξαρτάται από πολλούς παράγοντες, και αρκετά από τα ίδια τα ηχεία του συστήματος, το dispersion pattern τους, η ομοιομορφία του on-axis & off-axis ήχου του, οι πιθανές ανομοιομορφίες του χώρου (γεωμετρικά και σαν ακουστική συμπεριφορά επιφανειών), κ.α. καθόριζουν όχι μόνο τα "depth cues" αλλά και τις χροιές, και το "brightness" ή "muddiness" ή και "darkίλα" ενός ηχείου, το αν έχεις ένα "wide soundstage" είτε ένα στενότερο και από το άνοιγμα των ηχείων σου, κ.α.
 
sorry για το ΑΙ αλλά δεν είχα κουράγιο στις 4 το πρωί ούτε καν για περίληψη :P
-------------------------------------------------------------------------------
μια ηχογραφηση εχει και καποιες ανακλάσεις που ηχογραφηθηκαν μαζί με τα όργανα και βοηθουν να καταλαβουμε τις θεσεις των οργανων στο χωρο
τι γινεται οταν αυτες οι ανακλασεις παιχτούν στο σύστημα/χώρο μας το οποίο θα εισαγει νεες ανακλάσεις???




Αυτό που περιγράφεις είναι κλασικό ζήτημα διπλής χωρικής πληροφορίας (double spatial encoding) — και ναι, μπορεί να γίνει προβληματικό.

Όταν μια ηχογράφηση περιέχει ήδη πρώιμες ανακλάσεις (early reflections) και γενικά ambience από τον χώρο (π.χ. studio room ή hall), αυτές λειτουργούν σαν cues για το πού βρίσκονται τα όργανα (precedence effect / Haas effect). Ο εγκέφαλος τις χρησιμοποιεί για localization.

Τι συμβαίνει όταν τις ξαναπαίξεις σε άλλο χώρο;​

Το σύστημά σου (ηχεία + δωμάτιο) προσθέτει:

  • νέες πρώιμες ανακλάσεις από το δωμάτιο
  • δικό του reverberation tail
  • comb filtering από αλληλεπιδράσεις direct/reflected ήχου

Το αποτέλεσμα:​

1. Θόλωση της στερεοφωνικής εικόνας (image smearing)
Οι αρχικές ανακλάσεις “ανταγωνίζονται” τις νέες. Ο εγκέφαλος δυσκολεύεται να ξεχωρίσει ποια cues είναι “σωστά”.

2. Μετατόπιση θέσεων (localization errors)
Όργανα που ήταν καθαρά τοποθετημένα, φαίνονται πιο διάχυτα ή μετακινημένα.

3. Απώλεια βάθους (depth collapse)
Το αρχικό depth (μπροστά-πίσω) καταστρέφεται γιατί το δωμάτιο σου βάζει ένα “ενιαίο πέπλο” ambience.

4. Χρωματισμός (comb filtering)
Αλληλεπιδράσεις μεταξύ direct και reflected σημάτων δημιουργούν ακυρώσεις/ενισχύσεις σε συχνότητες.


Το βασικό πρόβλημα (χωρίς ωραιοποίηση):​

Δεν “προστίθενται απλά” οι ανακλάσεις — συγκρούονται.
Το σύστημα αναπαραγωγής δεν ξέρει τι είναι “recorded space” και τι “real space”. Τα ανακατεύει όλα.


Πότε είναι χειρότερο;​

  • Σε δωμάτια με έντονες πρώιμες ανακλάσεις (γυμνοί τοίχοι)
  • Σε κοντινή ακρόαση χωρίς acoustic treatment
  • Σε ηχογραφήσεις με ήδη έντονο ambience (π.χ. orchestral, live)

Πότε είναι πιο ελεγχόμενο;​

  • Σε καλά treated χώρους (control rooms)
  • Με nearfield monitoring
  • Όταν οι πρώτες ανακλάσεις του δωματίου καθυστερούν αρκετά και είναι πιο αδύναμες

Bottom line​

Αν περιμένεις πιστή αναπαράσταση της χωρικής πληροφορίας της ηχογράφησης σε ένα τυπικό δωμάτιο:
δεν γίνεται χωρίς έλεγχο του χώρου.

Το δωμάτιο είναι ενεργό μέρος του “signal chain”, όχι ουδέτερο μέσο.


Αν θέλεις, μπορώ να σου εξηγήσω πώς οι επαγγελματικοί χώροι μειώνουν αυτό το πρόβλημα (RFZ, LEDE κ.λπ.)....
---------------------------------------------------------------------------

όπως και να 'χει, πάλι καταλήγουμε πως ο χώρος είναι πολύ (πιο) κρίσιμος.
 
  • Love
Reactions: christos56
Κατ αρχήν να αναφέρω κάτι που ήθελα να γράψω, βασικά ήθελα να κάνω ξεχωριστό θέμα, αλλά μιας και μου δώσατε την ευκαιρία θα το κάνω τώρα, απλά λίγο διαφορετικά - στοχευμένα.


Το παραπάνω κείμενο δεν είναι "απλό" προϊόν ΑΙ. Έχω χρησιμοποιήσει την ΑΙ για να πάρω έτοιμες και στοχευμένες γνώσεις, αλλά όχι με τον απλό τρόπο, δηλαδή κάνω μια ερώτηση -> λαμβάνω μια απάντηση -> τέλος, πάμε σε καινούριο chat-θέμα, άλλη ερωτηση τώρα -> καινούρια απάντηση κτλ κτλ. Δεν δουλεύει έτσι η ΑΙ και έχω παραδείγματα από 3-4 διαφορετικές εφαρμογές που έχω δοκιμάσει (δωρεάν και μη).

Για παράδειγμα δεν ρωτάμε π.χ. "τι γίνεται αν βγω στο μπακόνι και πέσω από τον 3ο όροφο" για να βγάλουμε συμπέρασμα αν τα μπαλκόνια είναι ασφαλή. Πάμε και "χτίζουμε" από το μηδέν. Αν δεν γίνει έτσι, 8 στις 10 φορές η πρώτη απάντηση είναι λάθος ή τουλάχιστον περιέχει λάθη τα οποία είναι από λίγα έως πολλά, ανάλογα βέβαια και την ερώτηση. Για να πάρει κάποιος σωστή απάντηση πρέπει να εμβαθύνει με ερωτήσεις επί ερωτήσεων και κυρίως να ξεκινήσει από το "μηδέν", να χτίσει την απάντηση βήμα προς βήμα. Ξαναλέω, ανάλογα με το θέμα.

Το παραπάνω κείμενο λοιπόν προήλθε μετά από πάρα πολλές ώρες ακροάσεων, ερωτήσεων και συζήτησης με την ΑΙ (ChatGPT, paid version) και φωτογραφιών που ανέβασα από τον χώρο μου ακόμα και από τις πλακέτες των μηχανημάτων και πήγαμε βήμα προς βήμα, σχεδόν δηλαδή αναλύσαμε όλα τα κυκλώματα, πως επιρρεάζουν τον ήχο και πως συγκρίνονται με άλλα από φωτό που βρίκα στο Internet κτλ. Ερωτήσεις - Απατήσεις - Ερωτήσεις - Απαντήσεις κ.ο.κ.

Και στο τέλος έγραψα το παραπάνω κείμενο, χρησιμοποιόντας ενα πάρα πολύ μικρό μέρος από αυτά που ειπώθηκαν. Πίσω από το παραπάνω κεμενο λοιπόν υπάρχουν εβδομάδες ενασχόλησης όχι απλά ώρες, ως εκ τούτου οι πιθανότητα να περιέχει λάθη κατά την γνώμη μου τίνει προς το μηδέν. Το σίγουρο είναι ότι δεν περιέχει και δεν αναλύει όλα τα χαρακτηριστικά του ήχου (π.χ. χροιές) μιας και επικεντρώνεται στην τρισδιάστατη απεικώνηση της σκηνής και από τι επηρεάζεται.
:)
 
Και ο λόγος είναι ο εξής. Όταν στα ΑΙ κάνουμε μια ερώτηση, το ΑΙ κάνει υποθέσεις για να την απαντήσει. Όταν χτίσουμε από το μηδέν, οι υποθέσεις αυτές εξαλείφονται και η ακρίβεια της απαντήσεις αυξάνεται κατακόρυφα
 
sorry για το ΑΙ αλλά δεν είχα κουράγιο στις 4 το πρωί ούτε καν για περίληψη :P
-------------------------------------------------------------------------------
μια ηχογραφηση εχει και καποιες ανακλάσεις που ηχογραφηθηκαν μαζί με τα όργανα και βοηθουν να καταλαβουμε τις θεσεις των οργανων στο χωρο
τι γινεται οταν αυτες οι ανακλασεις παιχτούν στο σύστημα/χώρο μας το οποίο θα εισαγει νεες ανακλάσεις???




Αυτό που περιγράφεις είναι κλασικό ζήτημα διπλής χωρικής πληροφορίας (double spatial encoding) — και ναι, μπορεί να γίνει προβληματικό.

Όταν μια ηχογράφηση περιέχει ήδη πρώιμες ανακλάσεις (early reflections) και γενικά ambience από τον χώρο (π.χ. studio room ή hall), αυτές λειτουργούν σαν cues για το πού βρίσκονται τα όργανα (precedence effect / Haas effect). Ο εγκέφαλος τις χρησιμοποιεί για localization.

Τι συμβαίνει όταν τις ξαναπαίξεις σε άλλο χώρο;​

Το σύστημά σου (ηχεία + δωμάτιο) προσθέτει:

  • νέες πρώιμες ανακλάσεις από το δωμάτιο
  • δικό του reverberation tail
  • comb filtering από αλληλεπιδράσεις direct/reflected ήχου

Το αποτέλεσμα:​

1. Θόλωση της στερεοφωνικής εικόνας (image smearing)
Οι αρχικές ανακλάσεις “ανταγωνίζονται” τις νέες. Ο εγκέφαλος δυσκολεύεται να ξεχωρίσει ποια cues είναι “σωστά”.

2. Μετατόπιση θέσεων (localization errors)
Όργανα που ήταν καθαρά τοποθετημένα, φαίνονται πιο διάχυτα ή μετακινημένα.

3. Απώλεια βάθους (depth collapse)
Το αρχικό depth (μπροστά-πίσω) καταστρέφεται γιατί το δωμάτιο σου βάζει ένα “ενιαίο πέπλο” ambience.

4. Χρωματισμός (comb filtering)
Αλληλεπιδράσεις μεταξύ direct και reflected σημάτων δημιουργούν ακυρώσεις/ενισχύσεις σε συχνότητες.


Το βασικό πρόβλημα (χωρίς ωραιοποίηση):​

Δεν “προστίθενται απλά” οι ανακλάσεις — συγκρούονται.
Το σύστημα αναπαραγωγής δεν ξέρει τι είναι “recorded space” και τι “real space”. Τα ανακατεύει όλα.


Πότε είναι χειρότερο;​

  • Σε δωμάτια με έντονες πρώιμες ανακλάσεις (γυμνοί τοίχοι)
  • Σε κοντινή ακρόαση χωρίς acoustic treatment
  • Σε ηχογραφήσεις με ήδη έντονο ambience (π.χ. orchestral, live)

Πότε είναι πιο ελεγχόμενο;​

  • Σε καλά treated χώρους (control rooms)
  • Με nearfield monitoring
  • Όταν οι πρώτες ανακλάσεις του δωματίου καθυστερούν αρκετά και είναι πιο αδύναμες

Bottom line​

Αν περιμένεις πιστή αναπαράσταση της χωρικής πληροφορίας της ηχογράφησης σε ένα τυπικό δωμάτιο:
δεν γίνεται χωρίς έλεγχο του χώρου.

Το δωμάτιο είναι ενεργό μέρος του “signal chain”, όχι ουδέτερο μέσο.


Αν θέλεις, μπορώ να σου εξηγήσω πώς οι επαγγελματικοί χώροι μειώνουν αυτό το πρόβλημα (RFZ, LEDE κ.λπ.)....
---------------------------------------------------------------------------

όπως και να 'χει, πάλι καταλήγουμε πως ο χώρος είναι πολύ (πιο) κρίσιμος.


Μια γενική παράκληση. Το θέμα, παρ' όλο που απομυθοποιεί κάποια πράγματα, κατά την γνώμη μου είναι πολύ ωραίο και έχει μεγάλο ενδιαφέρον (τουλάχιστον για μένα) και επίσης έχει πολύ "βάθος", αυτά που έγραψα είναι ελάχιστα μπροστά στις πληροφορίες που υπάρχουν. Κάποια πράγματα δεν τα έχω αναλύσει πολύ για να μην γίνουν κουραστικά, αλλά αν υπάρχει κάτι που θέλετε να αναλύσουμε περισσότερο, πολύ ευχαρίστως να το συζητήσουμε.

Στο προκείμενο τώρα. Αυτό είναι ένα σημείο, η ερώτηση που έκανες, που μου πήρε κι εμένα χρόνο να το σκεφτώ και να το καταλάβω :)

Αναφέρομαι μόνο στο θέμα των αντανακλάσεων:
Η ίδια η ηχογράφηση δεν περιέχει αντανακλάσεις με την έννοια που αναφέρεις (αυτό είχα καταλάβει κι εγώ στην αρχή), γίνεται σε χώρους οι οποίοι είναι απόλυτα ελεγχόμνενοι (όταν είναι σε στούντιο φυσικά). Στο τελος το ΑΙ στην απάντηση που σου έδωσε το αναφέρει εμμέσως "Αν θέλεις, μπορώ να σου εξηγήσω πώς οι επαγγελματικοί χώροι μειώνουν αυτό το πρόβλημα (RFZ, LEDE κ.λπ.)....".

Αντίθετα προστήθενται πλασματικές αντανακλάσεις με την βοήθεια των μηχανημάτων που έχουν, για δωθεί η αίσθηση του βάθους, του πλάτους και της θέσης του κάθε οργάνου. Αυτές τις πλασματικές αντανακλάσεις (μεταξύ άλλων) είναι που ακούμε από τα ηχεία μας, όχι τις αντανακλάσεις που συμβαίνουν μέσα στο στούντιο. Αυτές οι πλασματικές αντανακλάσεις όμως, έχουν προστεθεί λαμβάνοντας υπ' όψιν τους ότι το εκάστοται κομμάτι θα ακουστεί σε έναν χώρο φροντισμένο. Δηλαδή ο ηχολήπτης, έχει λάβει υπ' όψιν του κατά την διάρκει της επεξεργασίας και της εισαγωγής των πλασματικών "εφε" ότι το κομμάτι θα ακουστεί σε έναν μη ανηχοϊκό χώρο, με ελεγχόμενες συγκεκριμένες αντανακλάσεις και αποροφήσεις, τα ηχεία είναι στημένα σωστά κ.ο.κ, οπότε το διαμορφώνει με τέτοιο τρόπο ώστε το αποτέλεσμα μέσα στον χώρο που θα ακουστεί να είναι αυτό που θέλει. Και επιπλέον, τα "εφε" που προσθέτει είναι κάπως τονισμένα, έτσι ώστε να μην "πνιγούν" σε έναν μέτρια φροντησμένο χώρο.

Οπότε αν εμείς φροτνήσουμε λίγο τα βασικά στον χώρο μας και έχουμε και ένα αξιοπρεπές σύστημα, μπορούμε να έχουμε και ένα αξιοπρεπές soundstage, αν βέβαια έχει συμπεριληφθεί στην ηχογράφηση με τον έναν ή με τον άλλο τρόπο.
 
Last edited:
  • Like
Reactions: linda and vlad66
Εδώ είναι η μαγεία… O εγκέφαλος ξεχωρίζει μέσα στο μίγμα τους δύο ήχους.
Κραταω αυτο.

Η ακροαση δεν ειναι ποτε μια παθητικη διαδικασια οπου τα προβληματα της ηχογραφησης και του χωρου εχουν καθοριστικο ρολο.
Ο εγκεφαλος παντα (φαινεται οτι) ερμηνευει αυτο που ακουμε. Η μνημη και συγκεκριμενα στοιχεια αναφορας και προσανατολισμου απο το παρελθον,
καθως και ισχυρες εντυπωσεις που συνδεθηκαν με συναισθηματικες αντιδρασεις κλπ ειναι πολυ σημαντικα στην ολη διαδικασια.
Αυτο κανει την ακροαση για τους περισσοτερους μια υποκειμενικη υποθεση στην οποια οι αντικειμενικοι παραγοντες (μετρησεις πχ)
δεν θα πω οτι δεν εχουν καμμια σημασια αλλα δεν εχουν τον πρωτο λογο.
Αυτο μπορει και να δικαιολογει την μεγαλη διασταση αποψεων για το ιδιο θεμα που παρατηρειται συχνα.
Εξαιρουνται βεβαια οι επαγγελματιες που ειναι η δουλεια τους να κανουν τετοιες διακρισεις
και ισως εμπειροι ακροατες οταν επιστρατευουν την προσοχη τους..
 
  • Like
Reactions: linda and vlad66
Μια γενική παράκληση. Το θέμα, παρ' όλο που απομυθοποιεί κάποια πράγματα, κατά την γνώμη μου είναι πολύ ωραίο και έχει μεγάλο ενδιαφέρον (τουλάχιστον για μένα) και επίσης έχει πολύ "βάθος", αυτά που έγραψα είναι ελάχιστα μπροστά στις πληροφορίες που υπάρχουν. Κάποια πράγματα δεν τα έχω αναλύσει πολύ για να μην γίνουν κουραστικά, αλλά αν υπάρχει κάτι που θέλετε να αναλύσουμε περισσότερο, πολύ ευχαρίστως να το συζητήσουμε.

Στο προκείμενο τώρα. Αυτό είναι ένα σημείο, η ερώτηση που έκανες, που μου πήρε κι εμένα χρόνο να το σκεφτώ και να το καταλάβω :)

Αναφέρομαι μόνο στο θέμα των αντανακλάσεων:
Η ίδια η ηχογράφηση δεν περιέχει αντανακλάσεις με την έννοια που αναφέρεις (αυτό είχα καταλάβει κι εγώ στην αρχή), γίνεται σε χώρους οι οποίοι είναι απόλυτα ελεγχόμνενοι (όταν είναι σε στούντιο φυσικά). Στο τελος το ΑΙ στην απάντηση που σου έδωσε το αναφέρει εμμέσως "Αν θέλεις, μπορώ να σου εξηγήσω πώς οι επαγγελματικοί χώροι μειώνουν αυτό το πρόβλημα (RFZ, LEDE κ.λπ.)....".

Αντίθετα προστήθενται πλασματικές αντανακλάσεις με την βοήθεια των μηχανημάτων που έχουν, για δωθεί η αίσθηση του βάθους, του πλάτους και της θέσης του κάθε οργάνου. Αυτές τις πλασματικές αντανακλάσεις (μεταξύ άλλων) είναι που ακούμε από τα ηχεία μας, όχι τις αντανακλάσεις που συμβαίνουν μέσα στο στούντιο. Αυτές οι πλασματικές αντανακλάσεις όμως, έχουν προστεθεί λαμβάνοντας υπ' όψιν τους ότι το εκάστοται κομμάτι θα ακουστεί σε έναν χώρο φροντισμένο. Δηλαδή ο ηχολήπτης, έχει λάβει υπ' όψιν του κατά την διάρκει της επεξεργασίας και της εισαγωγής των πλασματικών "εφε" ότι το κομμάτι θα ακουστεί σε έναν μη ανηχοϊκό χώρο, με ελεγχόμενες συγκεκριμένες αντανακλάσεις και αποροφήσεις, τα ηχεία είναι στημένα σωστά κ.ο.κ, οπότε το διαμορφώνει με τέτοιο τρόπο ώστε το αποτέλεσμα μέσα στον χώρο που θα ακουστεί να είναι αυτό που θέλει. Και επιπλέον, τα "εφε" που προσθέτει είναι κάπως τονισμένα, έτσι ώστε να μην "πνιγούν" σε έναν μέτρια φροντησμένο χώρο.

Οπότε αν εμείς φροτνήσουμε λίγο τα βασικά στον χώρο μας και έχουμε και ένα αξιοπρεπές σύστημα, μπορούμε να έχουμε και ένα αξιοπρεπές soundstage, αν βέβαια έχει συμπεριληφθεί στην ηχογράφηση με τον έναν ή με τον άλλο τρόπο.

Αυτό αφορά τις συγκεκριμένες ηχογραφήσεις που μπορούν να γίνονται ανά όργανο σε διαφορετική χρονική στιγμή. Υπάρχουν κι εκείνες που ηχογραφούνται με τη μέθοδο Blumlein και κάμποσες ακόμα παραλλαγές αυτής. Μέχρι και μικρόφωνα που καταγράφουν τις ανακλάσεις του χώρου.
Γενικά είναι πάρα πολλές οι τεχνικές. Φαντασία να έχεις...
 
  • Like
Reactions: Ge0rge
Ρώτα την ΑΙ που τόσο εμπιστεύεσαι για το HaaS effect / Precedence Effect (First Wavefront / Psychoacoustics) και δες το να λέει αντικρουόμενα πράγματα :D

Θες και αρχείο με 10ms delay μεταξύ αριστερού και δεξιού καναλιού να μας αποδείξεις ότι ακούς σαν δύο ήχους τόσο κοντινά sound samples ? Bet on it ? :D
 
To ΑΙ δεν έδωσε ιδιαιτέρως καλές πληροφορίες σε αυτή τη περίπτωση.

Παραδείγματος χάρη, στα 10ms (direct vs reflected sound arrival) δεν υπάρχει "διαχωρισμός", ο εγκέφαλος μας έχει μάθει να τα φιλτράρει και να τα κάνει ως "ένα" unique σήμα και όχι αρχικό σήμα + echoed.
Θες 25+ms για να αρχίσει να υπάρχει διαχωρισμός μεταξύ των 2 "σημάτων" (συνήθως πάνω από 30ms, ούτε καν τα 25 που λέω χάρην εξαιρέσεων).

Σε μη treated δωμάτια, άλλα είναι τα κυριότερα προβλήματα και όχι το delayed arrival του reflected sound (εκτός και αν έχεις έναν χώρο με βάθος 8μ και πλάτος 3μ με ελάχιστες "απορροφητικές" επιφάνειες/στοιχεία, κλπ. :D ).

Το πως αντιμετωπίζεις (ή όχι) τα πρώτα reflections (ποιά; δεν είναι μόνο τα side wall reflections, είναι και το πάτωμα, και το ταβάνι) εξαρτάται από πολλούς παράγοντες, και αρκετά από τα ίδια τα ηχεία του συστήματος, το dispersion pattern τους, η ομοιομορφία του on-axis & off-axis ήχου του, οι πιθανές ανομοιομορφίες του χώρου (γεωμετρικά και σαν ακουστική συμπεριφορά επιφανειών), κ.α. καθόριζουν όχι μόνο τα "depth cues" αλλά και τις χροιές, και το "brightness" ή "muddiness" ή και "darkίλα" ενός ηχείου, το αν έχεις ένα "wide soundstage" είτε ένα στενότερο και από το άνοιγμα των ηχείων σου, κ.α.

Όταν αναφέρθηκα σε "διαχωρισμό" δεν εννοούσα ότι ο άνθρωπος αντιλαμβάνεται δύο διαφορετικά "σήματα" (το οποίο απ' ότι καταλαβαίνω εννοείς), αλλά ότι ο εγκέφαλος χρησιμοποεί αυτή την χρονοκαθυστέρηση προκειμένου να αντιληφθεί την θέση στον χώρο.

Στο περίπου:
Εως 5ms καθυστερησης της άφηξης της ανάκλασης από τον κύριο ήχο, η αντίληψη είναι ότι ακούει έναν ήχο, αλλά αρχίζει ο "χρωματισμός"
Μετά τα 5ms και έως τα 10ms ακόμα υπάρχει συγχώνευση, αλλά αρχίζει να αντιλαμβάνεται χώρο και πλάτος
Από τα 10 έως τα 20ms αυξάνεται σημαντικά η αίσθηση της απόστασης
Από τα 20ms και πάνω αρχίζουν να ακούγονται "συνειδητά" δύο σήματα (ηχώ)

Με λίγα λόγια έως 20ms ο εγκέφαλος συγχονεύει τα σήματα στην αντίληψή μας, αλλά μπορεί να τα χρησιμοποιείσει (ξεχωριστά) για να τα εντοπίσει την πηγή του ήχου στον χώρο.
 
Last edited:
Ρώτα την ΑΙ που τόσο εμπιστεύεσαι για το HaaS effect / Precedence Effect (First Wavefront / Psychoacoustics) και δες το να λέει αντικρουόμενα πράγματα :D

Θες και αρχείο με 10ms delay μεταξύ αριστερού και δεξιού καναλιού να μας αποδείξεις ότι ακούς σαν δύο ήχους τόσο κοντινά sound samples ? Bet on it ? :D


Μην αρπάζεσαι χωρίς λόγο ;)
 
Όταν αναφέρθηκα σε "διαχωρισμό" δεν εννοούσα ότι ο άνθρωπος αντιλαμβάνεται δύο διαφορετικά "σήματα" (το οποίο απ' ότι καταλαβαίνω εννοείς), αλλά ότι ο εγκέφαλος χρησιμοποεί αυτή την χρονοκαθυστέρηση προκειμένου να αντιληφθεί την θέση στον χώρο.

Στο περίπου:
Εως 5ms καθυστερησης της άφηξης της ανάκλασης από τον κύριο ήχο, η αντίληψη είναι ότι ακούει έναν ήχο, αλλά αρχίζει ο "χρωματισμός"
Μετά τα 5ms και έως τα 10ms ακόμα υπάρχει συγχώνευση, αλλά αρχίζει να αντιλαμβάνεται χώρο και πλάτος
Από τα 10 έως τα 20ms αυξάνεται σημαντικά η αίσθηση της απόστασης
Από τα 20 και πάνω αρχίζουν να ακούγονται "συνειδητά" δύο σήματα (ηχώ)

Με λίγα λόγια έως 20ms ο εγκέφαλος συγχονεύει τα σήματα στην αντίληψή μας, αλλά μπορεί να τα χρησιμοποιείσει (ξεχωριστά) για να τα εντοπίσει την πηγή του ήχου στον χώρο.

ΑΠΛΑ ΟΧΙ.
Αλλά αν σε βολεύει να πιστεύεις αυτό που μόλις έγραψες, πίστευε το.

Τι αρπάζομαι ρε @Ge0rge .
Σου λέω απλά πως αυτό που λες ΔΕΝ ισχύει.
Από εκεί και πέρα, επιλογή σου τι πιστεύεις και τι όχι, δεν με κόφτει κι όλας, I'll live :D
 
ΑΠΛΑ ΟΧΙ.
Αλλά αν σε βολεύει να πιστεύεις αυτό που μόλις έγραψες, πίστευε το.

Τι αρπάζομαι ρε @Ge0rge .
Σου λέω απλά πως αυτό που λες ΔΕΝ ισχύει.
Από εκεί και πέρα, επιλογή σου τι πιστεύεις και τι όχι, δεν με κόφτει κι όλας, I'll live :D


Κοίτα, δεν με ενδιαφέρει αν τα 20ms δεν είναι 20 και είναι 30 ή 40 ή 50, εξ' άλλου παντού γράφω "περίπου" και είναι περίπου, γιατί εξαρτάται από πολλούς παράγοντες, τους οποίους δεν θα κάτσω να απαριθμήσω γιατί αφ ενός δεν με ενδιαφέρουν (και πιστεύω δεν ενδιαφέρουν κανέναν) και αφ' εταίρου δεν θέλω να γράφω σεντόνια για να αναλύω χρόνους. Όποιος θέλει να βρει τους χρόνους μπορεί να το ψάξει μόνος του.

Το θέμα το άνοιξα για να μοιραστώ κάποιους μηχανισμός πίσω από την δικάναλη τρισδιάστατη ακουστική που ίσως να βοηθήσουν κάποιους να βελτιώσουν τον χώρο τους κατανοώντας περισσότερα πράγματα ή απλά να το διαβάσουν από ενδιαφέρον. Όπως και να χει, εμένα μου άρεσε πολύ το θέμα και έκατσα και μοιράστηκα μερικά πράγματα τα οποία χρησιμοποιούνται ευρέως στον χώρο της δικάναλης αναπαραγωγής, είτε οι χρόνοι είναι αυτοί είτε όχι.

Οπότε ζήσε εσύ και άσε και εμένα να ζήσω. :)
 
Last edited:
Μπορούμε να «διορθώσουμε» τον χώρο με DSP?
Ναι, αλλά μέχρι ένα σημείο. Είναι πολύ δύσκολο ένα οικιακό περιβάλλον να είναι στο επίπεδο που θα μπορεί να αποκαλύψει όλα τα Depth Cues μιας ηχογράφησης, αλλά μπορούμε να καλύψουμε μέρος της διαδρομής με το DSP.


Θα προσπαθήσω να μεταφέρω τον λόγο που προσωπικά θεωρώ ότι το DSP έχει πολύ μεγάλη αξία σε οικιακούς χώρους όπου δεν υπάρχει η πολυτέλεια της τέλειας διαμόρφωσής τους για ακρόαση μουσικής, αρκεί βεβαίως να ρυθμιστεί σωστά (το οποίο δεν είναι εύκολο, απαιτεί χρόνο για εκμάθηση και πολλές αποτυχιμένες προσπάθειες). Προσωπικά είναι κάτι που χρησιμοποιώ χρόνια, πριν την ανακάλυψη της AI...

Όπως και πριν θα αναφέρω ότι υπάρχει πάρα πολύ υλικό για να ψάξει και να διαβάσει κάποιος, εδώ είναι κάποια πράγματα πολύ επιγραμματικά για να μην γίνει κουραστικό.


Το παρακάτω είναι ένα φίλτρο DSP, συγκεκριμένα από το CamilaDSP του Moode σε Raspberry. Για να δημιουργηθεί το συγκεκριμένο φίλτρο, έχει χρησιμοποιηθεί το λογισμικό REW και ένα μικρόφωνο της εταιρείας miniDSP τα οποία "μετράνε" από την θέση ακρόασης ότι παίζουν τα ηχεία και στην συνέχεια μεταφέρουν αυτό που φτιάξαμε στο Moode. Το REW είναι δωρεάν, το μικρόφωνο είχε γύρω στα 100€, αλλά δεν θυμάμαι πριν πόσα χρόνια πριν το είχα αγοράσει.

Πάμε να δούμε τι περιλαμβάνει:


ir_left (1).png

Στην κεφαλίδα του γραφήματος από αριστερά προς τα δεξιά:
1. Gain: Η μπλε γραμμή η οποία έχει δύο άξονες τον κάθετο με τα μπλέ νούμερα αριστερά (σε db) και τον οριζόντιο που είναι κοινός για όλα με την συχνότητα (σε Hz). Εδώ είναι οι διορθώσεις που έχουν γίνει στα παραμετρικά EQ του REW. Εδώ αλλάζουμε την ένταση, το πόσο δυνατά ακούγεται η κάθε συχνότητα (ή ομάδα), στην θέση του ακροατή.
2. Phase: Αυτή είναι η φάση. Είναι η πορτοκαλή γραμμή με κάθετο άξονα στα δεξιά με τα πορτοκαλί νούμερα (σε μοίρες) και οριζόντιος ο κοινός, οι συχνότητες (σε Hz). Εδώ είναι η χρονική μετατόπιση μιας συχνότητας, δηλαδή το "πότε" θα φτάσει η κάθε συχνότητα στην θέση του ακροατή σε σχέση με τις υπόλοιπες. Σκεφτείτε ότι όταν παίζει ένα πιάνο, ακούγονται χιλιάδες συχνότητες ταυτόχρονα και ιδανικά όλες πρέπει να φτάσουν συγχρονισμένες. Εκτός από τα προβλήματα στον χώρο που αναφέρθηκαν προηγουμένος, καθυστερήσεις υπάρχουν και λόγω των ηλεκτρονικών κυκλωμάτων.
3. Impulse: H πράσινη γραμμή. Αυτό δεν είναι διόρθωση, είναι ο παλμός που στέλνει το λογισμικό στο σύστημα για να μετρήσει.
4. Group Depay: Η κίτρινη γραμμή όπου ο κάθετος άξονάς της είναι δεξιά με τα κίτρινα γράμματα σε ms και ο οριζόντιος είναι ο κοινός (σε Hz). Εδώ είναι η καθυστέρηση μιας ομάδας (group) συχνοτήτων.

*Μήπως το Phase και το Group Delay θυμίζει κάτι από τα προηγούμενα...?

Αρκτετό μέρος της απόκρισης ενός ηχείου και ενός χώρου είναι "minimum phase" ή κάπου κοντά για να το συγχωρέσει ο εγκέφαλος. Αυτό σημαίνει ότι η αλλαγή στην ένταση μιας συχνότητας στα παραμετρικά EQ, συνδέεται μαθηματικά με το Group Delay και το Phase.

Όταν μετρήσει κάποιος τον χώρο του χρησιμοποιόντας τον συγκεκριμένο εξοπλισμό, έχει την δυνατότητα να ρυθμίσει την ένταση όποιων συχνοτήτων ενοχλούν και το λογισμικό αυτόματα προσαρμόζει και διορθώνει το group delay και το phase shift όχι μόνο με βάση αυτά που μέτρησε, αλλά και με βάση τις διορθώσεις που έχει επιβάλει ο χρήστης στα EQ.

Και εδώ έρχεται η εξαίρεση... Δεν είναι όλα "minimum phase". Υπάρχουν κάποιες αντανακλάσεις, κάποιες περίεργες αποκοπές που δεν μπορούν να διορθωθούν με αυτά τα φίλτρα. Οπότε εκεί μπαίνει η ανάγκη για φροντίδα του χώρου.
 
Το θέμα είναι τραγικά περιπλοκο, πολύ ενδιαφέρον αλλά και βαρετό από ένα σημείο και μετά.

Γενικά όσο ψάχνει κάποιος ανακαλύπτει όλο και περισσότερες λεπτομέρειες, οι οποίες όμως παράλληλα τον κάνουν να διαπιστωσει πόσο εύθραυστη είναι αυτή η πληροφορία όταν προσπαθεί να την αναπαράγει ένα στερεοφωνικό αλλά και πόσο έχει εξελιχθεί η τεχνολογία.

Για παράδειγμα, ο εγκέφαλος εκτός από τις χρονικές διάφορες μεταξύ direct και reflected sound για να 'βάλει" ένα αντικείμενο στον χώρο που μετριούνται με διαφορές μερικών χιλιοστών του δευτερολέπτου, χρησιμοποιεί και τις διάφορες στον χρόνο που κάνει να φτάσει ο ήχος στο δεξί και το αριστερό αυτί αλλά εδώ τα μεγέθη είναι της τάξεων των μερικών εκατομμυριοστων του δευτερολέπτου.
 
Ένα μουσικό διάλειμμα πριν.... το επόμενο μέρος

Ακούω κάπου κάπου έναν ιντερνετικό σταθμό lounge οπου μέσω αυτού ανακάλυψα μια σειρά-συλλογή από δίσκους που λέγετε Ultra Lounge της Capitol records.



Αυτές περιέχουν ηχογραφήσεις κυρίως από 50s και 60s σε μεγάλα studios εκείνης της εποχής με κορυφαία (τότε) μιρκόφωνα. Οι μουσικοί έπαιζαν μαζί στον χώρο με αποτέλεσμα τα μικρόφωνα ηχογραφούσαν και το δωμάτιο. Χρησιμοποιούσαν δωμάτια reverb, ειδικά η Capitol είχε διάσημα underground echo chambers όπου έστελναν τον ήχο σε ηχείο μέσα σε δωμάτιο και τον ξαναηχογραφούσαν με μικρόφωνα, άρα υπάρχει φυσικό ambience. και διάφορες άλλες παρόμοιες τεχνικές, με αναλογικά δημιουργημένα εφέ τα οποία δημιουργούσαν ένα πολύ "οργανικό" αποτέλεσμα. Ψάξτε με την βοήθεια της AI αν θέλετε, θα βρείτε πολλές σχετικές πληροφορίες. Άγνωστο βέβαια τι επεμβάσεις έχουν υποστεί κατά την ψηφιοποίηση, αλλά το αποτέλεσμα είναι εκπληκτικό, έχουν πολύ έντονα cues.

Εκεί θα βρείτε την πρώτη ηχογράφηση του ροζ πάνθηρα με τον Plas Johnson στο σαξόφωνο ανάμεσα από τα δύο ηχεία να "ζωγραφίζει". Έχω διαβάσει ότι οι μουσικοί που έπαιζαν μαζί του στην ηχογράφηση στο τέλος σηκώθηκαν και τον χειροκρότησαν.
 
  • Like
  • Love
Reactions: protrudi and vlad66
Αυτο που ονομάζουμε ολογραφική εικόνα, η τρισδιάστατη απεικόνιση της μουσικής σκηνής με διακριτά επίπεδα βάθους, πλάτος και ύψος είναι ίσως το ποιό εντυπωσιακό κομμάτι της αναπαραγωγής, δεν χρειάζεται ένα τσουβάλι λεφτά, δεν αγοράζεται, αλλά είναι και ιδιαιτέρως εύθραυστη.

Μία μιικρή αλλαγή στην θέση ακρόασης, ένα τραπεζάκι, ένας τοίχος, ένα χαλί μπορεί να την απογειώσουν ή να την καταστρέψουν.

Μπορεί να αγοράσει κάποιος σχετικά εύκολα μεσαίες υγρές, ρευστές, στεγνές όπως τις θέλει, μπορεί να αγοράσει σαράντα sub να κοπανάνε στο κεφάλι του γείτονα που δεν συμπαθεί, αλλά η ολογραφική εικόνα θέλει άλλου είδους προσέγγιση.