- 17 April 2007
- 2,721
*Δεν ξέρω αν έχει γραφτεί κάτι παρόμοιο, αλλά είπα να το τολμήσω χωρίς να ψάξω.
Έχει τύχει ποτέ να ακούσετε ένα σύστημα και να πείτε ή να σκεφτείτε «ακούγεται καλύτερα από του τάδε που κοστίζει τα διπλάσια» ή «τι χάλι ηχεία είναι αυτά, πως ακούγονται έτσι» και ο ιδιοκτήτης να έχει δώσει ένα διχίλιαρο ή και παραπάνω για να τα αποκτήσει; Και να μπει στην διαδικασία να αναρωτηθεί κάποιος.... πως είναι δυνατόν με τόσο ανταγωνισμό που επικρατεί, να υπάρχουν εταιρείες που δαγκώνουν (οικονομικά) τους πελάτες τους αδιαφορώντας για την αναλογία ποιότητας /κόστους του ανταγωνισμού. Εντάξει υπάρχουν τέτοιες εταιρείες, προς τα πάνω και προς τα κάτω, αλλά είναι εξαιρέσεις δεν είναι ο κανόνας. Οπότε σε τι οφείλονται αυτές οι «μεγάλες» διαφορές;
Υπάρχει ένας όρος που περιλαμβάνει όλα εκείνα τα χαρακτηριστικά ενός ήχου που σχετίζονται με την τρισδιάστατη τοποθέτησή του στον χώρο, τα «Depth Cues».
Τα Depth Cues περιλαμβάνουν όλα εκείνα τα στοιχεία που υποδεικνύουν στον εγκέφαλο ακριβώς που βρίσκεται αυτό που ακούει. Γι’ αυτό ακόμα και αν κλείσει κάποιος τα μάτια του μπορεί να υποδείξει με ακρίβεια μέσα στο δωμάτιο την θέση ενός ανθρώπου που του μιλάει.
Τα σημαντικότερα Depth Cues είναι τέσσερα και είναι τα εξής:
1) Αναλογία ευθέως / ανακλώμενου ήχου (το σημαντικότερο)
Ο εγκέφαλος χρησιμοποιεί όλα τα παραπάνω προκειμένου να φτιάξει μια τρισδιάστατη εικόνα στο κεφάλι του και να εντοπίσει την θέση της πηγής του ηχητικού σήματος.
Για παράδειγμα, όταν κάτι ακούγεται ποιο πίσω, σημαίνει ότι αυτό έχει χαμηλότερη ένταση, περισσότερες αντανακλάσεις έως ότου φτάσει ο ήχος και διαφορετικό timing, φτάνει δηλαδή στα αυτιά του ακροατή με μια μικρή καθυστέρηση.
Μια σύντομη διευκρίνηση. Το Timing των Depth Cues δεν έχει σχέση με αυτό που ονομάζουμε jitter στα ψηφιακά κυκλώματα. Το συγκεκριμένο timing (phase) μετριέται σε ms ενώ το jitter σε ns ή ps, μιλάμε δηλαδή για εντελώς διαφορετική τάξη μεγέθους (πάνω από 1.000.000 φορές διαφορά). Θεωρητικά αν το Jitter είναι πολύ μεγάλο μπορεί να επηρεάσει το timing, αλλά τόσο υψηλό jitter είναι δύσκολο να συναντήσουμε σε μοντέρνα κυκλώματα.
Οπότε και με την λογική από τι επηρεάζονται τα Depth Cues?
1) Συμμετρία χώρου (Νο1 παράγοντας)
2) Πρώτες ανακλάσεις (πλαϊνοί τοίχοι)
3) Μπάσο (masking)
4) Γεωμετρία (ηχεία + θέση ακρόασης)
5) Direct vs reflected ratio
6) Αναλογικό στάδιο συστημάτων
7) Κλίση ηχείων (fine tuning εργαλείο για βάθος /πλάτος)
Όλα τα παραπάνω επηρεάζουν την ικανότητα του ακροατή να αντιληφθεί την θέση των οργάνων εντός της σκηνής, εφ’ όσον φυσικά ο ηχολήπτης τα έχει συμπεριλάβει στην ηχογράφηση. Κατά την ηχογράφηση λοιπόν, ο ηχολήπτης λαμβάνει υπ’ όψιν του ότι το εν λόγω κομμάτι θα ακουστεί σε έναν χώρο φροντισμένο, όπως είναι το στούντιο, όπου υπάρχει συμμετρία, ελεγχόμενες αντανακλάσεις και απορροφήσεις και ενσωματώνει Depth Cues σε αυτήν, εισάγει δηλαδή εικονικό χώρο με την μορφή μικρών καθυστερήσεων της τάξεως των ms (reflections), reverb, μικρές διαφορές έντασης, φασματικές αλλαγές… έτσι ώστε ο ακροατής να αντιληφθεί βάθος και πλάτος. Όμως τα εισάγει με μια δόση υπερβολής (αρκετά ισχυρά δηλαδή) ώστε να μην «χαθούν» σε έναν μέτριο χώρο.
Οπότε όσο ποιο κοντά στο ιδανικό είναι ο χώρος ακρόασης, τόσο ποιο σωστά (με λιγότερα λάθη) θα μπορέσει ο ακροατής να ακούσει τις «πληροφορίες» από τα Depth Cues της ηχογράφησης, άρα τόσο καλύτερα θα μπορέσει να αντιληφθεί το εικονικό soundstage με τις θέσεις των οργάνων σε αυτό. Οπότε τα Depth Cues δεν χάνονται από την ηχογράφηση αλλά λόγω του χώρου φτάνουν στα αυτιά του ακροατή με σφάλματα π.χ. στον χρονισμό ή στο φάσμα. Και επειδή τα μεγέθη είναι πολύ μικρά, ανάλογα την έκταση του σφάλματος, μπορεί να ακουστεί για παράδειγμα από μικρότερο βάθος έως και flat ή αν δεν υπάρχει συμμετρία να μετατοπιστεί η σκηνή προς την μια ή την άλλη μεριά ή ο ήχος να μην ξεκολλάει καθόλου από τα ηχεία.
Ναι αλλά αυτό που φτάνει στα αυτιά μας είναι μια μίξη ήχου direct με reflected. Πως λειτουργεί αυτό και πως αντιλαμβάνεται ο εγκέφαλος τι ακριβώς γίνεται;
Εδώ είναι η μαγεία… O εγκέφαλος ξεχωρίζει μέσα στο μίγμα τους δύο ήχους. Ο direct κλειδώνει στην αντίληψή μας το «από που έρχεται ο ήχος» και τα reflections καθορίζουν το πόσο μακριά βρίσκεται η ηχητική πηγή (βάθος). Τα reflections έχουν μικρή καθυστέρηση στην άφιξη, μικρή διαφορά στο φάσμα και στην ένταση, οπότε ο εγκέφαλος αντιλαμβάνεται τις διαφορές και «χαρτογραφεί» τον χώρο. Αυτό όμως ο εγκέφαλος μπορεί να το κάνει, μόνο εφ’ όσον ο direct ήχος έχει τις παραπάνω διαφορές από τον reflected (εντός κάποιων ορίων) και η διαφορά που φτάνουν στα αυτιά του ακροατή είναι μεταξύ (περίπου) 1 και 20ms. Αν τα reflections είναι πολύ δυνατά, ανταγωνίζονται τον direct το κέντρο απλώνει ή τραβάει προς τους τοίχους. Αν φτάσουν πολύ νωρίς ή είναι πολλά χάνεται το focus και υπάρχει θολούρα.
Οπότε τα μηχανήματα δεν παίζουν κανέναν ρόλο;
Φυσικά και παίζουν μεγάλο ρόλο, αλλά ειδικά για το soundstage ο χώρος είναι ποιο κρίσιμος. Και βέβαια δεν σημαίνει ότι αγοράζουμε ότι να ναι, τα πετάμε σε ένα ράφι και περιμένουμε να ακούσουμε τρισδιάστατα. Δεν δουλεύει έτσι, γιατί για παράδειγμα ο θόρυβος, η παραμόρφωση είναι και αυτά καθοριστικά ως έναν βαθμό.
Μπορούμε να «διορθώσουμε» τον χώρο με DSP?
Ναι, αλλά μέχρι ένα σημείο. Είναι πολύ δύσκολο ένα οικιακό περιβάλλον να είναι στο επίπεδο που θα μπορεί να αποκαλύψει όλα τα Depth Cues μιας ηχογράφησης, αλλά μπορούμε να καλύψουμε μέρος της διαδρομής με το DSP.
Έχει τύχει ποτέ να ακούσετε ένα σύστημα και να πείτε ή να σκεφτείτε «ακούγεται καλύτερα από του τάδε που κοστίζει τα διπλάσια» ή «τι χάλι ηχεία είναι αυτά, πως ακούγονται έτσι» και ο ιδιοκτήτης να έχει δώσει ένα διχίλιαρο ή και παραπάνω για να τα αποκτήσει; Και να μπει στην διαδικασία να αναρωτηθεί κάποιος.... πως είναι δυνατόν με τόσο ανταγωνισμό που επικρατεί, να υπάρχουν εταιρείες που δαγκώνουν (οικονομικά) τους πελάτες τους αδιαφορώντας για την αναλογία ποιότητας /κόστους του ανταγωνισμού. Εντάξει υπάρχουν τέτοιες εταιρείες, προς τα πάνω και προς τα κάτω, αλλά είναι εξαιρέσεις δεν είναι ο κανόνας. Οπότε σε τι οφείλονται αυτές οι «μεγάλες» διαφορές;
Υπάρχει ένας όρος που περιλαμβάνει όλα εκείνα τα χαρακτηριστικά ενός ήχου που σχετίζονται με την τρισδιάστατη τοποθέτησή του στον χώρο, τα «Depth Cues».
Τα Depth Cues περιλαμβάνουν όλα εκείνα τα στοιχεία που υποδεικνύουν στον εγκέφαλο ακριβώς που βρίσκεται αυτό που ακούει. Γι’ αυτό ακόμα και αν κλείσει κάποιος τα μάτια του μπορεί να υποδείξει με ακρίβεια μέσα στο δωμάτιο την θέση ενός ανθρώπου που του μιλάει.
Τα σημαντικότερα Depth Cues είναι τέσσερα και είναι τα εξής:
1) Αναλογία ευθέως / ανακλώμενου ήχου (το σημαντικότερο)
- Κοντά = πολύ direct, λίγες αντανακλάσεις
- Μακριά = λιγότερο direct, περισσότερος “χώρος” – περισσότερες αντανακλάσεις
- reflections που φτάνουν με λίγα ms καθυστέρηση στα αυτιά του ακροατή
- -> ο εγκέφαλος λέει: “είναι πιο πίσω”
- οι ήχοι που έρχονται από μακριά έχουν «λιγότερες» υψηλές συχνότητες
- -> πιο “μαλακά” = πιο πίσω
- πιο δυνατά = πιο κοντά
- πιο χαμηλά = πιο πίσω
Ο εγκέφαλος χρησιμοποιεί όλα τα παραπάνω προκειμένου να φτιάξει μια τρισδιάστατη εικόνα στο κεφάλι του και να εντοπίσει την θέση της πηγής του ηχητικού σήματος.
Για παράδειγμα, όταν κάτι ακούγεται ποιο πίσω, σημαίνει ότι αυτό έχει χαμηλότερη ένταση, περισσότερες αντανακλάσεις έως ότου φτάσει ο ήχος και διαφορετικό timing, φτάνει δηλαδή στα αυτιά του ακροατή με μια μικρή καθυστέρηση.
Μια σύντομη διευκρίνηση. Το Timing των Depth Cues δεν έχει σχέση με αυτό που ονομάζουμε jitter στα ψηφιακά κυκλώματα. Το συγκεκριμένο timing (phase) μετριέται σε ms ενώ το jitter σε ns ή ps, μιλάμε δηλαδή για εντελώς διαφορετική τάξη μεγέθους (πάνω από 1.000.000 φορές διαφορά). Θεωρητικά αν το Jitter είναι πολύ μεγάλο μπορεί να επηρεάσει το timing, αλλά τόσο υψηλό jitter είναι δύσκολο να συναντήσουμε σε μοντέρνα κυκλώματα.
Οπότε και με την λογική από τι επηρεάζονται τα Depth Cues?
1) Συμμετρία χώρου (Νο1 παράγοντας)
2) Πρώτες ανακλάσεις (πλαϊνοί τοίχοι)
3) Μπάσο (masking)
4) Γεωμετρία (ηχεία + θέση ακρόασης)
5) Direct vs reflected ratio
6) Αναλογικό στάδιο συστημάτων
7) Κλίση ηχείων (fine tuning εργαλείο για βάθος /πλάτος)
Όλα τα παραπάνω επηρεάζουν την ικανότητα του ακροατή να αντιληφθεί την θέση των οργάνων εντός της σκηνής, εφ’ όσον φυσικά ο ηχολήπτης τα έχει συμπεριλάβει στην ηχογράφηση. Κατά την ηχογράφηση λοιπόν, ο ηχολήπτης λαμβάνει υπ’ όψιν του ότι το εν λόγω κομμάτι θα ακουστεί σε έναν χώρο φροντισμένο, όπως είναι το στούντιο, όπου υπάρχει συμμετρία, ελεγχόμενες αντανακλάσεις και απορροφήσεις και ενσωματώνει Depth Cues σε αυτήν, εισάγει δηλαδή εικονικό χώρο με την μορφή μικρών καθυστερήσεων της τάξεως των ms (reflections), reverb, μικρές διαφορές έντασης, φασματικές αλλαγές… έτσι ώστε ο ακροατής να αντιληφθεί βάθος και πλάτος. Όμως τα εισάγει με μια δόση υπερβολής (αρκετά ισχυρά δηλαδή) ώστε να μην «χαθούν» σε έναν μέτριο χώρο.
Οπότε όσο ποιο κοντά στο ιδανικό είναι ο χώρος ακρόασης, τόσο ποιο σωστά (με λιγότερα λάθη) θα μπορέσει ο ακροατής να ακούσει τις «πληροφορίες» από τα Depth Cues της ηχογράφησης, άρα τόσο καλύτερα θα μπορέσει να αντιληφθεί το εικονικό soundstage με τις θέσεις των οργάνων σε αυτό. Οπότε τα Depth Cues δεν χάνονται από την ηχογράφηση αλλά λόγω του χώρου φτάνουν στα αυτιά του ακροατή με σφάλματα π.χ. στον χρονισμό ή στο φάσμα. Και επειδή τα μεγέθη είναι πολύ μικρά, ανάλογα την έκταση του σφάλματος, μπορεί να ακουστεί για παράδειγμα από μικρότερο βάθος έως και flat ή αν δεν υπάρχει συμμετρία να μετατοπιστεί η σκηνή προς την μια ή την άλλη μεριά ή ο ήχος να μην ξεκολλάει καθόλου από τα ηχεία.
Ναι αλλά αυτό που φτάνει στα αυτιά μας είναι μια μίξη ήχου direct με reflected. Πως λειτουργεί αυτό και πως αντιλαμβάνεται ο εγκέφαλος τι ακριβώς γίνεται;
Εδώ είναι η μαγεία… O εγκέφαλος ξεχωρίζει μέσα στο μίγμα τους δύο ήχους. Ο direct κλειδώνει στην αντίληψή μας το «από που έρχεται ο ήχος» και τα reflections καθορίζουν το πόσο μακριά βρίσκεται η ηχητική πηγή (βάθος). Τα reflections έχουν μικρή καθυστέρηση στην άφιξη, μικρή διαφορά στο φάσμα και στην ένταση, οπότε ο εγκέφαλος αντιλαμβάνεται τις διαφορές και «χαρτογραφεί» τον χώρο. Αυτό όμως ο εγκέφαλος μπορεί να το κάνει, μόνο εφ’ όσον ο direct ήχος έχει τις παραπάνω διαφορές από τον reflected (εντός κάποιων ορίων) και η διαφορά που φτάνουν στα αυτιά του ακροατή είναι μεταξύ (περίπου) 1 και 20ms. Αν τα reflections είναι πολύ δυνατά, ανταγωνίζονται τον direct το κέντρο απλώνει ή τραβάει προς τους τοίχους. Αν φτάσουν πολύ νωρίς ή είναι πολλά χάνεται το focus και υπάρχει θολούρα.
Οπότε τα μηχανήματα δεν παίζουν κανέναν ρόλο;
Φυσικά και παίζουν μεγάλο ρόλο, αλλά ειδικά για το soundstage ο χώρος είναι ποιο κρίσιμος. Και βέβαια δεν σημαίνει ότι αγοράζουμε ότι να ναι, τα πετάμε σε ένα ράφι και περιμένουμε να ακούσουμε τρισδιάστατα. Δεν δουλεύει έτσι, γιατί για παράδειγμα ο θόρυβος, η παραμόρφωση είναι και αυτά καθοριστικά ως έναν βαθμό.
Μπορούμε να «διορθώσουμε» τον χώρο με DSP?
Ναι, αλλά μέχρι ένα σημείο. Είναι πολύ δύσκολο ένα οικιακό περιβάλλον να είναι στο επίπεδο που θα μπορεί να αποκαλύψει όλα τα Depth Cues μιας ηχογράφησης, αλλά μπορούμε να καλύψουμε μέρος της διαδρομής με το DSP.