stoxoi155.jpg
28433A9E-A107-46E2-BD12DB2B75ADF9DE.jpg
Η ανάπτυξη των τεχνολογιών σύνθεσης και αναγνώρισης φωνής είναι τέτοια που επιτρέπει, σε σημαντικό βαθμό, την αυτοματοποίηση της φωνητικής επικοινωνίας. Οι εφαρμογές τεχνολογίας φωνής είναι πλέον αρκετά ώριμες, ώστε να είναι πλέον εύκολη η υλοποίηση αυτόματων συστημάτων πληροφόρησης σε πολύ σύντομο χρονικό διάστημα.

Οι πιο γνωστές υπηρεσίες οι οποίες παρέχονται είναι:

Φωνο-Αλληλεπιδραστική Απόκριση - Interactive Voice Response (IVR): Αυτόματα συστήματα που με τη χρήση φωνής αποκρίνονται σε κάποιον που κάλεσε το σύστημα μέσω τηλεφώνου. Ο χρήστης δηλώνει τις επιθυμίες του στο σύστημα φωνητικά ή με τη χρήση των πλήκτρων του τηλεφώνου (Dual-tone multi-frequency signaling, DTMF).

Αναγνώριση Φωνής - Speech Recognition: Η αυτόματη διαδικασία αναγνώρισης και επεξεργασίας της ομιλίας.

Σύνθεση Φωνής - Speech Synthesis: Συνήθως ο όρος αναφέρεται στη δυνατότητα παραγωγής σήματος φωνής που αντιστοιχεί σε κάποιο κείμενο. Στην περίπτωση αυτή χρησιμοποιείται ο όρος Σύνθεση Φωνής από Κείμενο (Text-to-Speech) και αναφέρεται στη διαδικασία μετατροπής κειμένου σε συνθετική φωνή με τη βοήθεια Η/Υ. Ένα σύστημα θα μπορούσε να παράγει συνθετική ομιλία χρησιμοποιώντας:



  • Συρραφή (concatenation) προηχογραφημένων λέξεων (περιορισμένο λεξιλόγιο)
  • Συρραφή προηχογραφημένων και κατάλληλα αποθηκευμένων φωνημάτων, διφωνημάτων, τριφωνημάτων κλπ., όπου φώνημα είναι η μικρότερη ηχητική μονάδα, η οποία διαφοροποιεί τον ένα ήχο από τον άλλο σε οποιαδήποτε ομιλούμενη γλώσσα ή διάλεκτο.
  • Χρήση παραμετρικά ελεγχόμενου μοντέλου παραγωγής ομιλίας

Δραστηριότητες
  • Δημιούργησε μια παρουσίαση για τις τεχνολογίες σύνθεσης και αναγνώρισης φωνής. Στη συνέχεια, χρησιμοποιώντας κατάλληλα Web 2.0 εργαλεία (π.χ. Slide Talk, http://slidetalk.net/), προσπάθησε να την εμπλουτίσεις με προσθήκη ψηφιακής φωνής.
  • Αναζήτησε στο Διαδίκτυο εφαρμογές αναγνώρισης φωνής (π.χ. VoiceNote II)
  • Καθώς η τεχνολογία εξελίσσεται, ακούγοντας ηχογραφημένες οδηγίες, είναι δύσκολο να καταλάβεις αν ακούς μια αναπαραγωγή προηχογραφημένου μηνύματος ή έναν συνθέτη ομιλίας. Μπορεί να έχεις ένα ξυπνητήρι που σε ξυπνά ανακοινώνοντας την ώρα ή ένα πρόγραμμα πλοήγησης αυτοκινήτου που σε καθοδηγεί. Έχεις ακούσει για ενσωματωμένους αφηγητές σε e-book readers ή προγράμματα ανάγνωσης οθόνης; Τα Windows διαθέτουν ένα βασικό πρόγραμμα ανάγνωσης οθόνης (για άτομα με προβλήματα όρασης) που ονομάζεται Αφηγητής. Η τεχνολογία σύνθεσης φωνής από κείμενο έρχεται επίσης να διευρύνει την προσβασιμότητα αρκετών ιστοσελίδων. Να συζητήσεις στην τάξη σου για τις εφαρμογές της σύνθεσης φωνής που γνωρίζετε ή χρησιμοποιείτε.


ΒΙΒΛΙΟΓΡΑΦΙΑ - ΑΝΑΦΟΡΕΣ
  • Καραμπέτσος, Σ. (2010) Βελτίωση της ποιότητας συνθετικής φωνής και εφαρμογή σε σύγχρονα τηλεπικοινωνιακά περιβάλλοντα και υπηρεσίες, Διδακτορική Διατριβή, ΕΜΠ (Ανακτήθηκε 23/09/2015 από http://goo.gl/vUw5d0)

ΠΗΓΕΣ - ΥΛΙΚΟ ΓΙΑ ΕΠΙΠΛΕΟΝ ΜΕΛΕΤΗ
  • Σύνθεση φωνής από κείμενο στην ελληνική γλώσσα,Πύλη για την ελληνική γλώσσα (http://goo.gl/hpbOsI)
  • Βίντεο:Behind the Mic: The Science of Talking with Computers (https://goo.gl/BnGyWG)