Μετατροπή ήχου σε ροή αριθμών. Σύνθεση και αναγνώριση λόγου. Σύγχρονες λύσεις. Ηχητικός εξοπλισμός υπολογιστή. Μετατροπή ήχου σε ροή αριθμών Δυναμικό εύρος συμπιεσμένο ή τυπικό

Το δεύτερο μέρος της σειράς είναι αφιερωμένο σε λειτουργίες για τη βελτιστοποίηση του δυναμικού εύρους των εικόνων. Σε αυτό θα σας πούμε γιατί χρειάζονται τέτοιες λύσεις, εξετάστε διάφορες επιλογές για την εφαρμογή τους, καθώς και τα πλεονεκτήματα και τα μειονεκτήματά τους.

Αγκαλιάστε την απεραντοσύνη

Στην ιδανική περίπτωση, μια κάμερα θα πρέπει να καταγράφει μια εικόνα του γύρω κόσμου όπως την αντιλαμβάνεται ένα άτομο. Ωστόσο, λόγω του γεγονότος ότι οι μηχανισμοί «όρασης» μιας κάμερας και του ανθρώπινου ματιού είναι σημαντικά διαφορετικοί, υπάρχουν ορισμένοι περιορισμοί που δεν επιτρέπουν την εκπλήρωση αυτής της προϋπόθεσης.

Ένα από τα προβλήματα που αντιμετώπιζαν παλαιότερα οι χρήστες φωτογραφικών μηχανών φιλμ και αντιμετωπίζουν τώρα οι κάτοχοι ψηφιακών φωτογραφικών μηχανών είναι η αδυναμία λήψης επαρκών σκηνών με μεγάλες διαφορές στο φωτισμό χωρίς τη χρήση ειδικών συσκευών ή/και ειδικών τεχνικών λήψης. Οι ιδιαιτερότητες του ανθρώπινου οπτικού συστήματος καθιστούν δυνατή την αντίληψη των λεπτομερειών των σκηνών υψηλής αντίθεσης εξίσου καλά τόσο σε έντονα φωτισμένο όσο και σε σκοτεινές περιοχές. Δυστυχώς, ο αισθητήρας της κάμερας δεν είναι πάντα σε θέση να τραβήξει μια εικόνα με τον τρόπο που τη βλέπουμε.

Όσο μεγαλύτερη είναι η διαφορά στη φωτεινότητα στη φωτογραφημένη σκηνή, τόσο μεγαλύτερη είναι η πιθανότητα απώλειας λεπτομέρειας στα τονισμένα σημεία και/ή τις σκιές. Ως αποτέλεσμα, αντί για έναν μπλε ουρανό με πλούσια σύννεφα, η εικόνα αποδεικνύεται μόνο ένα υπόλευκο σημείο και τα αντικείμενα που βρίσκονται στις σκιές μετατρέπονται σε αδιάκριτες σκοτεινές σιλουέτες ή συγχωνεύονται εντελώς με το περιβάλλον.

Στην κλασική φωτογραφία, η έννοια του φωτογραφικό γεωγραφικό πλάτος(Δείτε την πλαϊνή γραμμή για λεπτομέρειες). Θεωρητικά, το φωτογραφικό πλάτος των ψηφιακών φωτογραφικών μηχανών καθορίζεται από το βάθος bit του μετατροπέα αναλογικού σε ψηφιακό (ADC). Για παράδειγμα, όταν χρησιμοποιείτε ένα ADC 8-bit, λαμβάνοντας υπόψη το σφάλμα κβαντισμού, η θεωρητικά επιτεύξιμη τιμή του φωτογραφικού πλάτους θα είναι 7 EV, για ένα ADC 12-bit - 11 EV κ.λπ. Ωστόσο, στις πραγματικές συσκευές το δυναμικό εύρος των εικόνων αποδεικνύεται ότι είναι στοτο ίδιο θεωρητικό μέγιστο λόγω της επίδρασης διαφόρων τύπων θορύβου και άλλων παραγόντων.

Μια μεγάλη διαφορά στα επίπεδα φωτεινότητας αντιπροσωπεύει ένα σοβαρό
πρόβλημα κατά τη λήψη φωτογραφιών. Σε αυτή την περίπτωση, οι δυνατότητες της κάμερας
αποδείχθηκε ανεπαρκής για την επαρκή μετάδοση των περισσότερων
φωτεινές περιοχές της σκηνής, και ως αποτέλεσμα, αντί για μια περιοχή με μπλε
ουρανός (σημειωμένος με ένα εγκεφαλικό επεισόδιο) αποδεικνύεται ότι είναι ένα λευκό "μπάλωμα"

Η μέγιστη τιμή φωτεινότητας που μπορεί να καταγράψει ένας φωτοευαίσθητος αισθητήρας καθορίζεται από το επίπεδο κορεσμού των κυψελών του. Η ελάχιστη τιμή εξαρτάται από διάφορους παράγοντες, συμπεριλαμβανομένης της ποσότητας θερμικού θορύβου της μήτρας, του θορύβου μεταφοράς φορτίου και του σφάλματος ADC.

Αξίζει επίσης να σημειωθεί ότι το φωτογραφικό πλάτος της ίδιας ψηφιακής φωτογραφικής μηχανής μπορεί να διαφέρει ανάλογα με την τιμή ευαισθησίας που ορίζεται στις ρυθμίσεις. Το μέγιστο δυναμικό εύρος μπορεί να επιτευχθεί με τη ρύθμιση της λεγόμενης βασικής ευαισθησίας (που αντιστοιχεί στην ελάχιστη δυνατή αριθμητική τιμή). Καθώς η τιμή αυτής της παραμέτρου αυξάνεται, το δυναμικό εύρος μειώνεται λόγω του αυξανόμενου επιπέδου θορύβου.

Το φωτογραφικό εύρος των σύγχρονων μοντέλων ψηφιακών φωτογραφικών μηχανών εξοπλισμένων με αισθητήρες μεγάλο μέγεθοςκαι ADC 14 ή 16 bit, κυμαίνεται από 9 έως 11 EV, το οποίο είναι σημαντικά υψηλότερο σε σύγκριση με παρόμοια χαρακτηριστικά έγχρωμων αρνητικών φιλμ 35 mm (μέσος όρος 4 έως 5 EV). Έτσι, ακόμη και οι σχετικά φθηνές ψηφιακές φωτογραφικές μηχανές έχουν ένα φωτογραφικό πλάτος αρκετό για να μεταφέρουν επαρκώς τις περισσότερες τυπικές ερασιτεχνικές σκηνές λήψης.

Ωστόσο, υπάρχει ένα άλλου είδους πρόβλημα. Συνδέεται με τους περιορισμούς που επιβάλλονται από τα υπάρχοντα πρότυπα για την εγγραφή ψηφιακών εικόνων. Χρησιμοποιώντας τη μορφή JPEG με 8 bit ανά έγχρωμο κανάλι (που έχει γίνει πλέον το de facto πρότυπο για την εγγραφή ψηφιακών εικόνων στη βιομηχανία υπολογιστών και την ψηφιακή τεχνολογία), είναι ακόμη και θεωρητικά αδύνατο να αποθηκεύσετε μια εικόνα με φωτογραφικό πλάτος μεγαλύτερο από 8 EV.

Ας υποθέσουμε ότι το ADC της κάμερας σάς επιτρέπει να λαμβάνετε μια εικόνα με βάθος bit 12 ή 14 bit, που περιέχει ευδιάκριτες λεπτομέρειες τόσο στα φωτεινά σημεία όσο και στις σκιές. Ωστόσο, εάν το φωτογραφικό πλάτος αυτής της εικόνας υπερβαίνει τα 8 EV, τότε κατά τη διαδικασία μετατροπής σε τυπική μορφή 8-bit χωρίς πρόσθετες ενέργειες (δηλαδή, απλώς με την απόρριψη "επιπλέον" bit), μέρος των πληροφοριών που καταγράφονται από το ο φωτοευαίσθητος αισθητήρας θα χαθεί.

Δυναμικό εύροςκαι φωτογραφικό πλάτος

Για να το θέσω απλά, το δυναμικό εύρος ορίζεται ως ο λόγος της μέγιστης τιμής φωτεινότητας μιας εικόνας προς την ελάχιστη τιμή της. Στην κλασική φωτογραφία χρησιμοποιείται παραδοσιακά ο όρος φωτογραφικό γεωγραφικό πλάτος, που ουσιαστικά σημαίνει το ίδιο πράγμα.

Το εύρος δυναμικού εύρους μπορεί να εκφραστεί ως λόγος (για παράδειγμα, 1000:1, 2500:1, κ.λπ.), αλλά τις περισσότερες φορές αυτό γίνεται σε λογαριθμική κλίμακα. Σε αυτή την περίπτωση, υπολογίζεται η τιμή του δεκαδικού λογάριθμου του λόγου της μέγιστης φωτεινότητας προς την ελάχιστη τιμή του και μετά τον αριθμό το κεφαλαίο γράμμα D (από την αγγλική πυκνότητα; - πυκνότητα), ή λιγότερο συχνά; - η συντομογραφία OD (από το αγγλικό optical density? - optical density) τοποθετείται. Για παράδειγμα, εάν ο λόγος της μέγιστης τιμής φωτεινότητας προς την ελάχιστη τιμή μιας συσκευής είναι 1000:1, τότε το δυναμικό εύρος θα είναι ίσο με 3,0 D:

Για τη μέτρηση του φωτογραφικού γεωγραφικού πλάτους, χρησιμοποιούνται παραδοσιακά οι λεγόμενες μονάδες έκθεσης, με συντομογραφία EV (τιμές έκθεσης· οι επαγγελματίες συχνά τις αποκαλούν "stop" ή "steps"). Σε αυτές τις μονάδες συνήθως ορίζεται η τιμή αντιστάθμισης έκθεσης στις ρυθμίσεις της κάμερας. Η αύξηση της τιμής του φωτογραφικού γεωγραφικού πλάτους κατά 1 EV ισοδυναμεί με διπλασιασμό της διαφοράς μεταξύ του μέγιστου και του ελάχιστου επιπέδου φωτεινότητας. Έτσι, η κλίμακα EV είναι επίσης λογαριθμική, αλλά στην περίπτωση αυτή χρησιμοποιείται ο λογάριθμος βάσης 2. Για παράδειγμα, εάν μια συσκευή μπορεί να τραβήξει εικόνες με μέγιστο προς ελάχιστο λόγο φωτεινότητας 256:1, τότε Το φωτογραφικό πλάτος θα είναι 8 EV:

Η συμπίεση είναι ένας λογικός συμβιβασμός

Πλέον αποτελεσματικός τρόποςΓια να διατηρηθεί η πλήρης έκταση των πληροφοριών εικόνας που καταγράφονται από τον φωτοευαίσθητο αισθητήρα της κάμερας, είναι δυνατή η εγγραφή εικόνων σε μορφή RAW. Ωστόσο, δεν έχουν όλες οι κάμερες μια τέτοια λειτουργία και δεν είναι κάθε ερασιτέχνης φωτογράφος έτοιμος να ασχοληθεί με την επίπονη δουλειά της επιλογής μεμονωμένες ρυθμίσειςγια κάθε φωτογραφία που τραβήχτηκε.

Για να μειωθεί η πιθανότητα απώλειας λεπτομερειών εικόνων υψηλής αντίθεσης που μετατρέπονται μέσα στην κάμερα σε JPEG 8-bit, έχουν εισαχθεί συσκευές πολλών κατασκευαστών (όχι μόνο συμπαγείς, αλλά και SLR). ειδικές λειτουργίες, επιτρέποντάς σας να συμπιέσετε το δυναμικό εύρος των αποθηκευμένων εικόνων χωρίς την παρέμβαση του χρήστη. Μειώνοντας τη συνολική αντίθεση και χάνοντας ένα μικρό μέρος των πληροφοριών στην αρχική εικόνα, τέτοιες λύσεις καθιστούν δυνατή τη διατήρηση των λεπτομερειών σε τονισμένα σημεία και σκιές που καταγράφονται από τον φωτοευαίσθητο αισθητήρα της συσκευής σε μορφή JPEG 8 bit, ακόμη και αν το δυναμικό εύρος του Η αρχική εικόνα αποδείχθηκε ότι ήταν μεγαλύτερη από 8 EV.

Ένας από τους πρωτοπόρους στην ανάπτυξη αυτού του τομέα ήταν η εταιρεία HP. Κυκλοφόρησε το 2003, η ψηφιακή φωτογραφική μηχανή HP Photosmart 945 διέθετε την πρώτη στον κόσμο τεχνολογία HP Adaptive Lightling, η οποία αντισταθμίζει αυτόματα τα χαμηλά επίπεδα φωτισμού στις σκοτεινές περιοχές των φωτογραφιών και έτσι διατηρεί τη λεπτομέρεια της σκιάς χωρίς τον κίνδυνο υπερβολικής έκθεσης (πράγμα πολύ σημαντικό κατά τη λήψη υψηλής σκηνές αντίθεσης). Ο αλγόριθμος HP Adaptive Lightling βασίζεται στις αρχές που ορίζονται από τον Άγγλο επιστήμονα Edwin Land στη θεωρία RETINEX της ανθρώπινης οπτικής αντίληψης.

Μενού HP Adaptive Lighting

Πώς λειτουργεί ο προσαρμοστικός φωτισμός; Αφού ληφθεί μια εικόνα 12-bit της εικόνας, εξάγεται μια βοηθητική μονόχρωμη εικόνα από αυτήν, η οποία είναι στην πραγματικότητα ένας χάρτης ακτινοβολίας. Κατά την επεξεργασία μιας εικόνας, αυτή η κάρτα χρησιμοποιείται ως μάσκα, επιτρέποντάς σας να προσαρμόσετε τον βαθμό επιρροής ενός μάλλον πολύπλοκου ψηφιακού φίλτρου στην εικόνα. Έτσι, σε περιοχές που αντιστοιχούν στα πιο σκοτεινά σημεία του χάρτη, η επίδραση στην εικόνα της μελλοντικής εικόνας είναι ελάχιστη και το αντίστροφο. Αυτή η προσέγγιση επιτρέπει την αποκάλυψη της λεπτομέρειας της σκιάς φωτίζοντας επιλεκτικά αυτές τις περιοχές και, κατά συνέπεια, μειώνοντας τη συνολική αντίθεση της εικόνας που προκύπτει.

Θα πρέπει να σημειωθεί ότι όταν είναι ενεργοποιημένο το Adaptive Lighting, η επεξεργασία της εικόνας που τραβήχτηκε γίνεται με τον τρόπο που περιγράφεται παραπάνω πριν η τελική εικόνα εγγραφεί σε ένα αρχείο. Όλες οι περιγραφόμενες λειτουργίες εκτελούνται αυτόματα και ο χρήστης μπορεί να επιλέξει μόνο έναν από τους δύο τρόπους λειτουργίας Adaptive Lighting (χαμηλή ή υψηλή έκθεση) στο μενού της κάμερας ή να απενεργοποιήσει αυτήν τη λειτουργία.

Σε γενικές γραμμές, πολλές συγκεκριμένες λειτουργίες των σύγχρονων ψηφιακών φωτογραφικών μηχανών (συμπεριλαμβανομένων των συστημάτων αναγνώρισης προσώπου που συζητήθηκαν στο προηγούμενο άρθρο) είναι ένα είδος υποπροϊόντος ή προϊόν μετατροπής της ερευνητικής εργασίας που διεξήχθη αρχικά για στρατιωτικούς πελάτες. Όταν πρόκειται για λειτουργίες βελτιστοποίησης δυναμικού εύρους εικόνας, ένας από τους πιο γνωστούς παρόχους τέτοιων λύσεων είναι η Apical. Οι αλγόριθμοι που δημιουργούνται από τους υπαλλήλους της, ειδικότερα, αποτελούν τη βάση της λειτουργίας της λειτουργίας SAT (Shadow Adjustment Technology), η οποία εφαρμόζεται σε μια σειρά από μοντέλα ψηφιακών φωτογραφικών μηχανών Olympus. Συνοπτικά, η λειτουργία της λειτουργίας SAT μπορεί να περιγραφεί ως εξής: με βάση την αρχική εικόνα της εικόνας, δημιουργείται μια μάσκα που αντιστοιχεί στις πιο σκοτεινές περιοχές και στη συνέχεια η τιμή έκθεσης διορθώνεται αυτόματα για αυτές τις περιοχές.

Η Sony απέκτησε επίσης άδεια χρήσης των εξελίξεων της Apical. Πολλά μοντέλα συμπαγών καμερών της σειράς Cyber-shot και φωτογραφικών μηχανών DSLR της σειράς alpha εφαρμόζουν τη λεγόμενη λειτουργία Dynamic Range Optimizer (DRO).

Φωτογραφίες που τραβήχτηκαν με απενεργοποιημένο τον HP Photosmart R927 (επάνω)
και ενεργοποιημένη λειτουργία Adaptive Lighting

Όταν είναι ενεργοποιημένο το DRO, η διόρθωση εικόνας εκτελείται κατά την αρχική επεξεργασία εικόνας (δηλαδή πριν από την εγγραφή του τελικού αρχείου JPEG). Στη βασική έκδοση, το DRO έχει ρύθμιση δύο σταδίων (μπορείτε να επιλέξετε έναν τυπικό ή προηγμένο τρόπο λειτουργίας στο μενού). Όταν επιλέγετε τη λειτουργία Standard, τα επίπεδα έκθεσης προσαρμόζονται με βάση την ανάλυση εικόνας της φωτογραφίας και, στη συνέχεια, εφαρμόζεται μια καμπύλη τόνου στην εικόνα για να εξισορροπηθεί η συνολική ισορροπία. Η προηγμένη λειτουργία χρησιμοποιεί έναν πιο περίπλοκο αλγόριθμο που επιτρέπει τη διόρθωση τόσο στις σκιές όσο και στις επισημάνσεις.

Οι προγραμματιστές της Sony εργάζονται συνεχώς για να βελτιώσουν τον αλγόριθμο DRO. Για παράδειγμα, στην κάμερα SLR a700, όταν είναι ενεργοποιημένη η προηγμένη λειτουργία DRO, μπορείτε να επιλέξετε μία από τις πέντε επιλογές διόρθωσης. Επιπλέον, είναι δυνατή η αποθήκευση τριών εκδόσεων μιας εικόνας ταυτόχρονα (ένα είδος bracketing) με διαφορετικές ρυθμίσεις DRO.

Πολλά μοντέλα ψηφιακών φωτογραφικών μηχανών Nikon διαθέτουν λειτουργία D-Lighting, η οποία βασίζεται επίσης σε αλγόριθμους Apical. Είναι αλήθεια ότι, σε αντίθεση με τις λύσεις που περιγράφονται παραπάνω, το D-Lighting εφαρμόζεται ως φίλτρο για την επεξεργασία προηγουμένως αποθηκευμένων εικόνων χρησιμοποιώντας μια τονική καμπύλη, το σχήμα της οποίας σας επιτρέπει να κάνετε τις σκιές πιο ανοιχτές, διατηρώντας παράλληλα τις άλλες περιοχές της εικόνας αμετάβλητες. Επειδή όμως σε αυτήν την περίπτωση επεξεργάζονται έτοιμες εικόνες 8 bit (και όχι η αρχική εικόνα πλαισίου, η οποία έχει μεγαλύτερο βάθος bit και, κατά συνέπεια, μεγαλύτερο δυναμικό εύρος), οι δυνατότητες του D-Lighting είναι πολύ περιορισμένες. Ο χρήστης μπορεί να πάρει το ίδιο αποτέλεσμα επεξεργάζοντας την εικόνα σε ένα πρόγραμμα επεξεργασίας γραφικών.

Κατά τη σύγκριση μεγεθυσμένων θραυσμάτων, είναι σαφώς ορατό ότι οι σκοτεινές περιοχές της αρχικής εικόνας (αριστερά)
όταν ενεργοποιήθηκε η λειτουργία Adaptive Lighting, έγιναν ελαφρύτερα

Υπάρχει επίσης μια σειρά από λύσεις που βασίζονται σε άλλες αρχές. Έτσι, πολλές κάμερες της οικογένειας Lumix της Panasonic (συγκεκριμένα DMC-FX35, DMC-TZ4, DMC-TZ5, DMC-FS20, DMC-FZ18 κ.λπ.) εφαρμόζουν τη λειτουργία αναγνώρισης φωτός (Έξυπνη Έκθεση), η οποία είναι μια αναπόσπαστο μέρος του συστήματος iA έξυπνος αυτόματος έλεγχος λήψης. Η λειτουργία Έξυπνης Έκθεσης βασίζεται στην αυτόματη ανάλυση της εικόνας του πλαισίου και στη διόρθωση των σκοτεινών περιοχών της εικόνας για την αποφυγή απώλειας λεπτομέρειας στις σκιές, καθώς και στη συμπίεση (εάν είναι απαραίτητο) του δυναμικού εύρους σκηνών υψηλής αντίθεσης.

Σε ορισμένες περιπτώσεις, η λειτουργία βελτιστοποίησης δυναμικού εύρους περιλαμβάνει όχι μόνο ορισμένες λειτουργίες για την επεξεργασία της αρχικής εικόνας εικόνας, αλλά και διόρθωση των ρυθμίσεων λήψης. Για παράδειγμα, νέα μοντέλα ψηφιακών φωτογραφικών μηχανών Fujifilm (ιδίως η FinePix S100FS) εφαρμόζουν μια λειτουργία για την επέκταση του δυναμικού εύρους (Wide Dynamic Range, WDR), η οποία, σύμφωνα με τους προγραμματιστές, σας επιτρέπει να αυξήσετε το φωτογραφικό πλάτος κατά ένα ή δύο βήματα (στην ορολογία ρυθμίσεων - 200 και 400%).

Όταν είναι ενεργοποιημένο το WDR, η κάμερα τραβάει φωτογραφίες με αντιστάθμιση έκθεσης -1 ή -2 EV (ανάλογα με την επιλεγμένη ρύθμιση). Έτσι, η εικόνα του πλαισίου αποδεικνύεται υποεκτεθειμένη - αυτό είναι απαραίτητο για να διατηρηθούν οι μέγιστες πληροφορίες σχετικά με τις λεπτομέρειες στα τονισμένα σημεία. Στη συνέχεια, η εικόνα που προκύπτει επεξεργάζεται χρησιμοποιώντας μια καμπύλη τόνου, η οποία σας επιτρέπει να εξισορροπήσετε τη συνολική ισορροπία και να προσαρμόσετε το επίπεδο μαύρου. Στη συνέχεια, η εικόνα μετατρέπεται σε μορφή 8-bit και εγγράφεται ως αρχείο JPEG.

Η συμπίεση δυναμικού εύρους διατηρεί περισσότερες λεπτομέρειες
σε φώτα και σκιές, αλλά αναπόφευκτη συνέπεια μιας τέτοιας έκθεσης
είναι μια μείωση της συνολικής αντίθεσης. Στην κάτω εικόνα
Ωστόσο, η υφή των σύννεφων είναι πολύ καλύτερα ανεπτυγμένη
λόγω της χαμηλότερης αντίθεσης, αυτή η έκδοση της φωτογραφίας
φαίνεται λιγότερο φυσικό

Μια παρόμοια λειτουργία που ονομάζεται Dynamic Range Enlargement εφαρμόζεται σε μια σειρά από φωτογραφικές μηχανές compact και SLR της Pentax (Optio S12, K200D, κ.λπ.). Σύμφωνα με τον κατασκευαστή, η χρήση της λειτουργίας Dynamic Range Enlargement σάς επιτρέπει να αυξήσετε το φωτογραφικό πλάτος των εικόνων κατά 1 EV χωρίς να χάσετε λεπτομέρεια στα τονισμένα σημεία και τις σκιές.

Μια παρόμοια λειτουργία που ονομάζεται προτεραιότητα τόνου επισήμανσης (HTP) εφαρμόζεται σε πολλά μοντέλα Canon DSLR (EOS 40D, EOS 450D, κ.λπ.). Σύμφωνα με το εγχειρίδιο χρήσης, η ενεργοποίηση του HTP βελτιώνει τη λεπτομέρεια των επισημάνσεων (συγκεκριμένα, στο εύρος του γκρι από 0 έως 18%).

συμπέρασμα

Ας συνοψίσουμε. Η ενσωματωμένη συμπίεση δυναμικού εύρους σάς επιτρέπει να μετατρέψετε μια εικόνα πηγής υψηλού δυναμικού εύρους σε 8-bit με ελάχιστη ζημιά αρχείο JPEG. Χωρίς την επιλογή αποθήκευσης εικόνων σε μορφή RAW, η λειτουργία συμπίεσης δυναμικού εύρους επιτρέπει στους φωτογράφους να αξιοποιούν πληρέστερα τις δυνατότητες της κάμεράς τους κατά τη λήψη σκηνών υψηλής αντίθεσης.

Φυσικά, είναι σημαντικό να θυμόμαστε ότι η συμπίεση δυναμικού εύρους δεν είναι μια θαυματουργή θεραπεία, αλλά μάλλον ένας συμβιβασμός. Η διατήρηση της λεπτομέρειας στα τονισμένα σημεία και/ή τις σκιές έχει το κόστος της αύξησης του επιπέδου θορύβου στις σκοτεινές περιοχές της εικόνας, της μείωσης της αντίθεσης και της κάπως τραχιάς ομαλής τονικής μετάβασης.

Όπως κάθε αυτόματη λειτουργία, ο αλγόριθμος συμπίεσης δυναμικού εύρους δεν είναι μια πλήρως καθολική λύση που σας επιτρέπει να βελτιώσετε απολύτως οποιαδήποτε φωτογραφία. Επομένως, είναι λογικό να το ενεργοποιείτε μόνο σε περιπτώσεις όπου είναι πραγματικά απαραίτητο. Για παράδειγμα, για να τραβήξετε μια σιλουέτα με καλά σχεδιασμένο φόντο, πρέπει να απενεργοποιήσετε τη λειτουργία συμπίεσης δυναμικού εύρους - διαφορετικά η θεαματική σκηνή θα καταστραφεί απελπιστικά.

Ολοκληρώνοντας την εξέταση αυτού του θέματος, θα πρέπει να σημειωθεί ότι η χρήση λειτουργιών συμπίεσης δυναμικού εύρους δεν μας επιτρέπει να "βγάλουμε" λεπτομέρειες στην εικόνα που προκύπτει που δεν καταγράφηκαν από τον αισθητήρα της κάμερας. Για να επιτύχετε ικανοποιητικά αποτελέσματα κατά τη λήψη σκηνών υψηλής αντίθεσης, μπορεί να χρειαστεί να χρησιμοποιήσετε πρόσθετα εργαλεία (όπως φίλτρα ντεγκραντέ για φωτογραφία τοπίων) ή ειδικές τεχνικές (όπως λήψη πολλαπλών καρέ με bracketing έκθεσης και στη συνέχεια συγχώνευσή τους σε μία εικόνα χρησιμοποιώντας την τεχνολογία Tone Mapping ).

Το επόμενο άρθρο θα επικεντρωθεί στη συνάρτηση ριπής.

Συνεχίζεται

Ας σκεφτούμε την ερώτηση - γιατί πρέπει να αυξήσουμε την ένταση του ήχου; Για να ακούτε ήσυχους ήχους που δεν ακούγονται στις συνθήκες μας (για παράδειγμα, εάν δεν μπορείτε να ακούσετε δυνατά, εάν υπάρχει εξωτερικός θόρυβος στο δωμάτιο, κ.λπ.). Είναι δυνατόν να ενισχύσουμε τους σιωπηλούς ήχους αφήνοντας τους δυνατούς μόνους; Αποδεικνύεται ότι είναι δυνατό. Αυτή η τεχνική ονομάζεται συμπίεση δυναμικού εύρους (DRC). Για να το κάνετε αυτό, πρέπει να αλλάζετε συνεχώς την τρέχουσα ένταση - να ενισχύετε τους ήσυχους ήχους, τους δυνατούς - όχι. Ο απλούστερος νόμος της μεταβολής του όγκου είναι γραμμικός, δηλ. Η ένταση αλλάζει σύμφωνα με το νόμο output_loudness = k * input_loudness, όπου k είναι ο λόγος συμπίεσης δυναμικού εύρους:

Εικόνα 18. Συμπίεση δυναμικού εύρους.

Όταν k = 1, δεν γίνονται αλλαγές (ο όγκος εξόδου είναι ίσος με τον όγκο εισόδου). Στο κ< 1 громкость будет увеличиваться, а динамический диапазон - сужаться. Посмотрим на график (k=1/2) - тихий звук, имевший громкость -50дБ станет громче на 25дБ, что значительно громче, но при этом громкость диалогов (-27дБ) повысится всего лишь на 13.5дБ, а громкость самых громких звуков (0дБ) вообще не изменится. При k >1 - η ένταση θα μειωθεί και το δυναμικό εύρος θα αυξηθεί.

Ας δούμε τα γραφήματα όγκου (k = 1/2: Η συμπίεση DD διπλασιάζεται):

Εικόνα 19. Γραφήματα έντασης.

Όπως μπορείτε να δείτε στο πρωτότυπο υπήρχαν και οι δύο πολύ ήσυχοι ήχοι, 30 dB κάτω από το επίπεδο διαλόγου και πολύ δυνατοί - 30 dB πάνω από το επίπεδο διαλόγου. Οτι. το δυναμικό εύρος ήταν 60dB. Μετά τη συμπίεση, οι δυνατοί ήχοι είναι μόνο 15dB υψηλότεροι και οι ήσυχοι ήχοι είναι 15dB χαμηλότεροι από τους διαλόγους (το δυναμικό εύρος είναι τώρα 30dB). Έτσι, οι δυνατοί ήχοι έγιναν σημαντικά πιο ήσυχοι και οι ήσυχοι ήχοι έγιναν σημαντικά πιο δυνατοί. Σε αυτή την περίπτωση δεν υπάρχει υπερχείλιση!

Ας δούμε τώρα τα ιστογράμματα:

Εικόνα 20. Παράδειγμα συμπίεσης.

Όπως μπορείτε να δείτε καθαρά, με ενίσχυση έως +30dB, το σχήμα του ιστογράμματος διατηρείται καλά, πράγμα που σημαίνει ότι οι δυνατοί ήχοι παραμένουν καλά εκφρασμένοι (δεν φτάνουν στο μέγιστο και δεν κόβονται, όπως συμβαίνει με την απλή ενίσχυση) . Αυτό παράγει ήσυχους ήχους. Το ιστόγραμμα το δείχνει άσχημα, αλλά η διαφορά είναι πολύ αισθητή στο αυτί. Το μειονέκτημα αυτής της μεθόδου είναι τα ίδια άλματα όγκου. Ωστόσο, ο μηχανισμός εμφάνισής τους διαφέρει από τα άλματα έντασης που συμβαίνουν κατά την κοπή και ο χαρακτήρας τους είναι διαφορετικός - εμφανίζονται κυρίως όταν οι ήσυχοι ήχοι ενισχύονται πολύ έντονα (και όχι όταν κόβονται δυνατοί, όπως με την κανονική ενίσχυση). Ένα υπερβολικό επίπεδο συμπίεσης οδηγεί σε ισοπέδωση της εικόνας του ήχου - όλοι οι ήχοι τείνουν να έχουν την ίδια ένταση και ανέκφραση.

Η υπερβολική ενίσχυση των σιωπηλών ήχων μπορεί να προκαλέσει τον ακουστό θόρυβο της εγγραφής. Επομένως, το φίλτρο χρησιμοποιεί έναν ελαφρώς τροποποιημένο αλγόριθμο έτσι ώστε το επίπεδο θορύβου να αυξάνεται λιγότερο:

Εικόνα 21. Αύξηση της έντασης χωρίς αύξηση του θορύβου.

Εκείνοι. σε επίπεδο έντασης -50dB, η συνάρτηση μεταφοράς κλίνει και ο θόρυβος θα ενισχυθεί λιγότερο (κίτρινη γραμμή). Ελλείψει τέτοιας κάμψης, ο θόρυβος θα είναι πολύ πιο δυνατός (γκρι γραμμή). Αυτή η απλή τροποποίηση μειώνει σημαντικά την ποσότητα του θορύβου ακόμη και σε πολύ υψηλά επίπεδα συμπίεσης (συμπίεση 1:5 στην εικόνα). Το επίπεδο "DRC" στο φίλτρο ρυθμίζει το επίπεδο απολαβής για ήσυχους ήχους (στα -50 dB), π.χ. Το επίπεδο συμπίεσης 1/5 που φαίνεται στην εικόνα αντιστοιχεί στο επίπεδο +40dB στις ρυθμίσεις του φίλτρου.

Σε μια εποχή που οι ερευνητές μόλις άρχιζαν να λύνουν το πρόβλημα της δημιουργίας μιας διεπαφής ομιλίας για υπολογιστές, συχνά έπρεπε να φτιάξουν τον δικό τους εξοπλισμό που θα επέτρεπε την εισαγωγή ηχητικών πληροφοριών στον υπολογιστή και την έξοδο τους από τον υπολογιστή. Σήμερα, τέτοιες συσκευές μπορεί να έχουν μόνο ιστορικό ενδιαφέρον, καθώς οι σύγχρονοι υπολογιστές μπορούν εύκολα να εξοπλιστούν με συσκευές εισόδου και εξόδου ήχου, όπως προσαρμογείς ήχου, μικρόφωνα, ακουστικά και ηχεία.

Δεν θα εμβαθύνουμε στις λεπτομέρειες της εσωτερικής δομής αυτών των συσκευών, αλλά θα μιλήσουμε για τον τρόπο λειτουργίας τους και θα παρέχουμε ορισμένες συστάσεις για την επιλογή συσκευών υπολογιστή ήχου για εργασία με συστήματα αναγνώρισης και σύνθεσης ομιλίας.

Όπως είπαμε ήδη στο προηγούμενο κεφάλαιο, ο ήχος δεν είναι τίποτα άλλο από δονήσεις αέρα, η συχνότητα των οποίων βρίσκεται στο εύρος των συχνοτήτων που αντιλαμβάνεται ο άνθρωπος. Τα ακριβή όρια του εύρους ακουστικών συχνοτήτων μπορεί να διαφέρουν από άτομο σε άτομο, αλλά οι ηχητικές δονήσεις πιστεύεται ότι βρίσκονται στην περιοχή από 16-20.000 Hz.

Ο σκοπός ενός μικροφώνου είναι να μετατρέπει τους ηχητικούς κραδασμούς σε ηλεκτρικούς κραδασμούς, οι οποίοι στη συνέχεια μπορούν να ενισχυθούν, να φιλτραριστούν για να αφαιρέσουν παρεμβολές και να ψηφιοποιηθούν για την εισαγωγή ηχητικών πληροφοριών σε έναν υπολογιστή.

Με βάση την αρχή λειτουργίας τους, τα πιο κοινά μικρόφωνα χωρίζονται σε άνθρακα, ηλεκτροδυναμικά, συμπυκνωτή και ηλεκτρονικά. Ορισμένα από αυτά τα μικρόφωνα απαιτούν εξωτερική πηγήρεύμα (για παράδειγμα, άνθρακας και συμπυκνωτής), άλλοι, υπό την επίδραση ηχητικών δονήσεων, είναι ικανοί να παράγουν ανεξάρτητα εναλλασσόμενη ηλεκτρική τάση (αυτά είναι ηλεκτροδυναμικά και ηλεκτροδυναμικά μικρόφωνα).

Μπορείτε επίσης να διαχωρίσετε τα μικρόφωνα ανάλογα με τον σκοπό τους. Υπάρχουν μικρόφωνα στούντιο που μπορούν να κρατηθούν στο χέρι σας ή να τοποθετηθούν σε βάση, υπάρχουν μικρόφωνα ραδιοφώνου που μπορούν να κουμπωθούν σε ρούχα κ.λπ.

Υπάρχουν επίσης μικρόφωνα που έχουν σχεδιαστεί ειδικά για υπολογιστές. Τέτοια μικρόφωνα συνήθως τοποθετούνται σε βάση τοποθετημένη στην επιφάνεια ενός τραπεζιού. Τα μικρόφωνα υπολογιστών μπορούν να συνδυαστούν με ακουστικά, όπως φαίνεται στην Εικ. 2-1.

Ρύζι. 2-1. Ακουστικά με μικρόφωνο

Πώς μπορείτε να επιλέξετε από την ποικιλία μικροφώνων που ταιριάζουν καλύτερα για συστήματα αναγνώρισης ομιλίας;

Κατ 'αρχήν, μπορείτε να πειραματιστείτε με οποιοδήποτε μικρόφωνο έχετε, αρκεί να μπορεί να συνδεθεί στον προσαρμογέα ήχου του υπολογιστή σας. Ωστόσο, οι προγραμματιστές συστημάτων αναγνώρισης ομιλίας συνιστούν την αγορά ενός μικροφώνου που, κατά τη λειτουργία, θα βρίσκεται σε σταθερή απόσταση από το στόμα του ομιλητή.

Εάν η απόσταση μεταξύ του μικροφώνου και του στόματος δεν αλλάξει, τότε η μέση στάθμη του ηλεκτρικού σήματος που προέρχεται από το μικρόφωνο δεν θα αλλάξει πάρα πολύ. Αυτό θα έχει θετικό αντίκτυπο στην απόδοση των σύγχρονων συστημάτων αναγνώρισης ομιλίας.

Ποιο είναι το πρόβλημα?

Ένα άτομο είναι σε θέση να αναγνωρίσει με επιτυχία την ομιλία, η ένταση της οποίας ποικίλλει σε πολύ μεγάλο εύρος. Ο ανθρώπινος εγκέφαλος είναι σε θέση να φιλτράρει την ήσυχη ομιλία από παρεμβολές, όπως τον θόρυβο των αυτοκινήτων που περνούν στο δρόμο, τις εξωτερικές συνομιλίες και τη μουσική.

Όσο για τα σύγχρονα συστήματα αναγνώρισης ομιλίας, οι ικανότητές τους σε αυτόν τον τομέα αφήνουν πολλά να είναι επιθυμητά. Εάν το μικρόφωνο βρίσκεται σε ένα τραπέζι, τότε όταν γυρίσετε το κεφάλι σας ή αλλάξετε τη θέση του σώματός σας, η απόσταση μεταξύ του στόματός σας και του μικροφώνου θα αλλάξει. Αυτό θα αλλάξει το επίπεδο εξόδου του μικροφώνου, το οποίο με τη σειρά του θα μειώσει την αξιοπιστία της αναγνώρισης ομιλίας.

Επομένως, όταν εργάζεστε με συστήματα αναγνώρισης ομιλίας, τα καλύτερα αποτελέσματα θα επιτευχθούν εάν χρησιμοποιείτε ένα μικρόφωνο συνδεδεμένο σε ακουστικά, όπως φαίνεται στην Εικ. 2-1. Όταν χρησιμοποιείτε ένα τέτοιο μικρόφωνο, η απόσταση μεταξύ του στόματος και του μικροφώνου θα είναι σταθερή.

Εφιστούμε επίσης την προσοχή σας στο γεγονός ότι όλα τα πειράματα με συστήματα αναγνώρισης ομιλίας γίνονται καλύτερα σε ιδιωτικότητα σε ένα ήσυχο δωμάτιο. Σε αυτή την περίπτωση, η επίδραση των παρεμβολών θα είναι ελάχιστη. Φυσικά, εάν πρέπει να επιλέξετε ένα σύστημα αναγνώρισης ομιλίας που μπορεί να λειτουργήσει σε συνθήκες ισχυρών παρεμβολών, τότε οι δοκιμές πρέπει να γίνουν διαφορετικά. Ωστόσο, από όσο γνωρίζουν οι συγγραφείς του βιβλίου, η θόρυβος των συστημάτων αναγνώρισης ομιλίας εξακολουθεί να είναι πολύ, πολύ χαμηλή.

Το μικρόφωνο μετατρέπει τα ηχητικά κύματα σε δονήσεις για εμάς. ηλεκτρικό ρεύμα. Αυτές οι διακυμάνσεις φαίνονται στην οθόνη του παλμογράφου, αλλά μην βιαστείτε στο κατάστημα για να αγοράσετε αυτήν την ακριβή συσκευή. Μπορούμε να πραγματοποιήσουμε όλες τις παλμογραφικές μελέτες χρησιμοποιώντας έναν κανονικό υπολογιστή εξοπλισμένο με έναν προσαρμογέα ήχου, για παράδειγμα, έναν προσαρμογέα Sound Blaster. Αργότερα θα σας πούμε πώς να το κάνετε αυτό.

Στο Σχ. 2-2 δείξαμε τον παλμογράφο ηχητικό σήμα, που προκύπτει από την προφορά ενός μακρού ήχου α. Αυτή η κυματομορφή λήφθηκε χρησιμοποιώντας το πρόγραμμα GoldWave, για το οποίο θα μιλήσουμε αργότερα σε αυτό το κεφάλαιο του βιβλίου, καθώς και χρησιμοποιώντας έναν προσαρμογέα ήχου Sound Blaster και ένα μικρόφωνο παρόμοιο με αυτό που φαίνεται στην Εικ. 2-1.

Ρύζι. 2-2. Ταλαντόγραμμα ηχητικού σήματος

Το πρόγραμμα GoldWave σάς επιτρέπει να τεντώσετε τον παλμογράφο κατά μήκος του άξονα του χρόνου, κάτι που σας επιτρέπει να δείτε τις πιο μικρές λεπτομέρειες. Στο Σχ. 2-3 δείξαμε ένα τεντωμένο θραύσμα του προαναφερθέντος παλμογράφου ήχου α.

Ρύζι. 2-3. Θραύσμα παλμογράφου ακουστικού σήματος

Λάβετε υπόψη ότι το μέγεθος του σήματος εισόδου που προέρχεται από το μικρόφωνο αλλάζει περιοδικά και παίρνει θετικές και αρνητικές τιμές.

Εάν υπήρχε μόνο μία συχνότητα στο σήμα εισόδου (δηλαδή, εάν ο ήχος ήταν "καθαρός"), η κυματομορφή που λαμβανόταν από το μικρόφωνο θα ήταν ένα ημιτονοειδές κύμα. Ωστόσο, όπως έχουμε ήδη πει, το φάσμα των ήχων της ανθρώπινης ομιλίας αποτελείται από ένα σύνολο συχνοτήτων, με αποτέλεσμα το σχήμα του παλμογράφου του σήματος ομιλίας να απέχει πολύ από το ημιτονοειδές.

Θα καλέσουμε ένα σήμα του οποίου το μέγεθος αλλάζει συνεχώς με την πάροδο του χρόνου αναλογικό σήμα. Αυτό ακριβώς είναι το σήμα που έρχεται από το μικρόφωνο. Σε αντίθεση με το αναλογικό, ψηφιακό σήμαείναι ένα σύνολο αριθμητικών τιμών που αλλάζουν διακριτά με την πάροδο του χρόνου.

Για να μπορέσει ένας υπολογιστής να επεξεργαστεί ένα ηχητικό σήμα, πρέπει να μετατραπεί από αναλογική σε ψηφιακή μορφή, δηλαδή να παρουσιαστεί ως σύνολο αριθμητικών τιμών. Αυτή η διαδικασία ονομάζεται ψηφιοποίηση αναλογικού σήματος.

Η ψηφιοποίηση ενός ηχητικού (και οποιουδήποτε αναλογικού) σήματος πραγματοποιείται χρησιμοποιώντας μια ειδική συσκευή που ονομάζεται μετατροπέας αναλογικού σε ψηφιακό ADC (Αναλογικός σε ψηφιακός μετατροπέας, ADC). Αυτή η συσκευή βρίσκεται στην πλακέτα του προσαρμογέα ήχου και είναι ένα μικροκύκλωμα με κανονική εμφάνιση.

Πώς λειτουργεί ένας μετατροπέας αναλογικού σε ψηφιακό;

Μετρά περιοδικά τη στάθμη του σήματος εισόδου και εξάγει μια αριθμητική τιμή του αποτελέσματος της μέτρησης. Αυτή η διαδικασία απεικονίζεται στο Σχ. 2-4. Εδώ, τα γκρίζα ορθογώνια υποδεικνύουν τιμές σήματος εισόδου που μετρώνται σε κάποιο σταθερό χρονικό διάστημα. Ένα σύνολο τέτοιων τιμών είναι μια ψηφιοποιημένη αναπαράσταση του αναλογικού σήματος εισόδου.

Ρύζι. 2-4. Μετρήσεις πλάτους σήματος σε σχέση με το χρόνο

Στο Σχ. 2-5 δείξαμε τη σύνδεση ενός μετατροπέα αναλογικού σε ψηφιακό σε μικρόφωνο. Σε αυτή την περίπτωση, παρέχεται ένα αναλογικό σήμα στην είσοδο x 1 και ένα ψηφιακό σήμα αφαιρείται από τις εξόδους u 1 -u n.

Ρύζι. 2-5. Μετατροπέας αναλογικού σε ψηφιακό

Οι μετατροπείς αναλογικού σε ψηφιακό χαρακτηρίζονται από δύο σημαντικές παραμέτρους - τη συχνότητα μετατροπής και τον αριθμό των επιπέδων κβαντοποίησης του σήματος εισόδου. Η σωστή επιλογή αυτών των παραμέτρων είναι κρίσιμη για την επίτευξη επαρκούς ψηφιακής αναπαράστασης του αναλογικού σήματος.

Πόσο συχνά χρειάζεται να μετράτε το πλάτος του αναλογικού σήματος εισόδου, ώστε να μην χάνονται πληροφορίες σχετικά με τις αλλαγές στο αναλογικό σήμα εισόδου ως αποτέλεσμα της ψηφιοποίησης;

Φαίνεται ότι η απάντηση είναι απλή - το σήμα εισόδου πρέπει να μετράται όσο το δυνατόν συχνότερα. Πράγματι, όσο πιο συχνά ένας μετατροπέας αναλογικού σε ψηφιακό κάνει τέτοιες μετρήσεις, τόσο καλύτερα θα είναι σε θέση να παρακολουθεί τις παραμικρές αλλαγές στο πλάτος του αναλογικού σήματος εισόδου.

Ωστόσο, οι υπερβολικά συχνές μετρήσεις μπορεί να οδηγήσουν σε αδικαιολόγητη αύξηση της ροής ψηφιακών δεδομένων και σπατάλη πόρων υπολογιστή κατά την επεξεργασία του σήματος.

Ευτυχώς, η επιλογή της σωστής συχνότητας μετατροπής (συχνότητα δειγματοληψίας) είναι αρκετά απλή. Για να γίνει αυτό, αρκεί να στραφούμε στο θεώρημα του Kotelnikov, γνωστό στους ειδικούς στον τομέα της επεξεργασίας ψηφιακών σημάτων. Το θεώρημα δηλώνει ότι η συχνότητα μετατροπής πρέπει να είναι διπλάσια από τη μέγιστη συχνότητα του φάσματος του μετατρεπόμενου σήματος. Επομένως, για να ψηφιοποιήσετε χωρίς να χάσετε την ποιότητα ενός σήματος ήχου του οποίου η συχνότητα κυμαίνεται μεταξύ 16-20.000 Hz, πρέπει να επιλέξετε μια συχνότητα μετατροπής όχι μικρότερη από 40.000 Hz.

Σημειώστε, ωστόσο, ότι στον επαγγελματικό εξοπλισμό ήχου η συχνότητα μετατροπής επιλέγεται πολλές φορές υψηλότερη από την καθορισμένη τιμή. Αυτό γίνεται για να επιτευχθεί πολύ Υψηλή ποιότηταψηφιοποιημένος ήχος. Αυτή η ποιότητα δεν είναι σχετική με τα συστήματα αναγνώρισης ομιλίας, επομένως δεν θα εστιάσουμε την προσοχή σας σε αυτήν την επιλογή.

Ποια συχνότητα μετατροπής χρειάζεται για την ψηφιοποίηση του ήχου της ανθρώπινης ομιλίας;

Δεδομένου ότι οι ήχοι της ανθρώπινης ομιλίας βρίσκονται στο εύρος συχνοτήτων 300-4000 Hz, η ελάχιστη απαιτούμενη συχνότητα μετατροπής είναι 8000 Hz. Ωστόσο, πολλοί προγράμματα υπολογιστήΗ αναγνώριση ομιλίας χρησιμοποιεί τυπική συχνότητα μετατροπής 44.000 Hz για συμβατικούς προσαρμογείς ήχου. Αφενός, μια τέτοια συχνότητα μετατροπής δεν οδηγεί σε υπερβολική αύξηση της ροής ψηφιακών δεδομένων και αφετέρου εξασφαλίζει ψηφιοποίηση ομιλίας με επαρκή ποιότητα.

Πίσω στο σχολείο, μας διδάχτηκαν ότι με οποιεσδήποτε μετρήσεις προκύπτουν λάθη, τα οποία δεν μπορούν να εξαλειφθούν εντελώς. Τέτοια σφάλματα προκύπτουν λόγω της περιορισμένης ανάλυσης των οργάνων μέτρησης, καθώς και λόγω του γεγονότος ότι η ίδια η διαδικασία μέτρησης μπορεί να επιφέρει ορισμένες αλλαγές στη μετρούμενη τιμή.

Ένας μετατροπέας αναλογικού σε ψηφιακό αντιπροσωπεύει το αναλογικό σήμα εισόδου ως ροή αριθμών περιορισμένης χωρητικότητας. Οι συμβατικοί προσαρμογείς ήχου περιέχουν μπλοκ ADC 16-bit ικανά να αναπαριστούν το πλάτος του σήματος εισόδου ως 216 = 65536 διαφορετικές τιμές. Οι συσκευές ADC σε εξοπλισμό ήχου υψηλής τεχνολογίας μπορούν να είναι 20-bit, παρέχοντας μεγαλύτερη ακρίβεια στην αναπαράσταση του πλάτους του σήματος ήχου.

Современные системы и программы распознавания р