stoxoi_132.jpg


data_compression.png

Η συμπίεση δεδομένων (data compression), είναι η διαδικασία περιορισμού του μεγέθους ενός αρχείου, ώστε να χρειάζεται λιγότερο χώρο για την αποθήκευση ή τη μετάδοσή του.
Για παράδειγμα αν μειώσετε κατά το ήμισυ το μέγεθος ενός αρχείου, μπορείτε να αποθηκεύσετε περισσότερα αρχεία στο ίδιο αποθηκευτικό μέσο, ή να κατεβάσετε (download) τα αρχεία πιο γρήγορα (και στο ήμισυ του κόστους εάν πληρώνετε για το κατέβασμα).

Παρόλο που η χωρητικότητα των δίσκων ή η ταχύτητα σύνδεσης στο Διαδίκτυο συνεχώς αυξάνει, πάντα υπάρχει κέρδος (χώρος, χρόνος, κόστος) με μικρότερα, συμπιεσμένα αρχεία. Η διαδικασία της συμπίεσης εφαρμόζεται συστηματικά στα υπολογιστικά συστήματα που χρησιμοποιούν και επεξεργάζονται μεγάλο όγκο ψηφιακών δεδομένων (π.χ. Google, Facebook), όπου μείωση του χώρου αποθήκευσης σημαίνει μείωση των υπολογιστών που απαιτούνται και κατά συνέπεια μεγάλη εξοικονόμηση ενέργειας και προστασία του περιβάλλοντος.
jpeg.jpg
mp3.jpg
mpeg.jpg
zip.jpg
rar.jpg

Χρησιμοποιείτε καθημερινά διάφορες τεχνικές (μεθόδους) συμπίεσης όπως JPEG (για φωτογραφίες), MP3 (για ήχο), MPEG (για βίντεο), και ZIP (για πολλά είδη δεδομένων). Αν η μέθοδος JPEG μειώνει τις φωτογραφίες στο ένα δέκατο του αρχικού τους μεγέθους, η φωτογραφική σας μηχανή (ή το κινητό σας) μπορεί να αποθηκεύσει 10 πλάσιες φωτογραφίες και οι εικόνες στο διαδίκτυο μπορούν να κατέβουν 10 φορές πιο γρήγορα.

Τα συμπιεσμένα δεδομένα για να επεξεργαστούν, πρώτα αποσυμπιέζονται (decompression).
compress_decompress.png
Πηγή: Lossy vs Lossless Methods
lossless_lossy.png

Συμπίεση κειμένου με τον αλγόριθμο κωδικοποίησης Ziv-Lempel

Η βασική ιδέα της κωδικοποίησης Ziv-Lempel είναι ότι σε πολλά αρχεία (κυρίως κειμένου), επαναλαμβάνονται συχνά ακολουθίες χαρακτήρων (για παράδειγμα το άρθρο «τον»). Επομένως για να μην αποθηκεύονται επανειλημμένα, γίνεται αντικατάστασή τους με μια αναφορά στο σημείο που εμφανίστηκαν την τελευταία φορά. Εφ 'όσον η αναφορά καταλαμβάνει λιγότερο χώρο από τη φράση που αντικαθίσταται, γίνεται εξοικονόμιση χώρου. Η αναφορά είναι στην πραγματικότητα δύο αριθμοί. Ο πρώτος αριθμός αναφέρεται σε πόσους χαρακτήρες πρέπει να μετρήσουμε προς τα πίσω, μέχρι το σημείο όπου η προηγούμενη φράση ξεκινά. Ο δεύτερος αριθμός αναφέρεται στο μήκος της φράσης. Συνήθως, το μέγεθος αρχείων κειμένου μειώνεται στο ένα τέταρτο του αρχικού τους μεγέθους.

Περισσότερες πληροφορίες θα ανακαλύψετε στο παρακάτω μαθησιακό αντικείμενο και το αντίστοιχο φύλλο εργασίας
COMPRESSION_LWZ.png





ΒΙΒΛΙΟΓΡΑΦΙΑ - ΑΝΑΦΟΡΕΣ
  • Univesity of Canterbury (2015). Computer Science Field Guide, New Zealand 2015 (Ανακτήθηκε 19/11/2016 από http://www.csfieldguide.org.nz/en/index.html, http://www.csfieldguide.org.nz/en/teacher/index.html)
  • Παπακωνσταντίνου, Γ, Τσανάκας, Π., Κοζύρης, Ν., Μανουσοπούλου, Α., Ματζάκος, Π. Τεχνολογία Υπολογιστικών Συστημάτων & Λειτουργικά Συστήματα, Παιδαγωγικό Ινστιτούτο, Αθήνα

ΠΗΓΕΣ - ΥΛΙΚΟ ΓΙΑ ΕΠΙΠΛΕΟΝ ΜΕΛΕΤΗ

Παπακωνσταντίνου, Γ, Τσανάκας, Π., Κοζύρης, Ν., Μανουσοπούλου, Α., Ματζάκος, Π. Τεχνολογία Υπολογιστικών Συστημάτων & Λειτουργικά Συστήματα, Παιδαγωγικό Ινστιτούτο, Αθήνα