Metadata: τα data στο μικροσκόπιο



Το εκτιμώμενο μέγεθος του ψηφιακού σύμπαντος στα τέλη του 2020, σύμφωνα με το παγκόσμιο οικονομικό φόρουμ, θα είναι 44 zettabytes (44 πεντάκις εκατομύρια bytes)· 40 φορές περισσότερα bytes από όσα αστέρια υπάρχουν στον ορατό σύμπαν. Κάθε μέρα στέλνονται 500 εκ. τιτιβίσματα, 294 δις. emails, 4 petabytes (4 τετράκις εκατομύρια bytes) data παράγονται στο facebook, 4 terabytes (4 δισεκατομύρια bytes) data παραγονται από συνδεδεμένα αυτοκίνητα, 65 δις. μηνύματα ανταλλάσονται στο whatsapp και γίνονται 5 δις αναζητήσεις. Η εκτίμηση είναι ότι μέχρι το 2025 θα παράγονται 463 exabytes (463 τετράκις bytes) πληροφορίας κάθε μέρα.

Με μια γρήγορη αναζήτηση στο διαδίκτυο, οι στατιστικές, οι μετρήσεις και οι εκτιμήσεις που βρήκαμε για τον “όγκο” των data ήταν αρκετές για να γεμίσουν αρκετές από αυτές τις σελίδες με πολλά μηδενικά. Πόσοι χρήστες του internet υπάρχουν και πόσο αυξάνονται; Τί παράγουμε κάθε χρόνο, κάθε μήνα, κάθε μέρα, κάθε λεπτό; Από πού παράγονται; Πώς παράγονται; Μηδενικά που προκαλούν δέος, ειδικά όταν συγκρίνονται με την ύλη, πχ τα αστέρια. Κάπου αλλού βρήκαμε ότι αν ένα byte ήταν ένα γαλόνι νερού (περίπου 3,7 λίτρα) θα χρειάζοταν 2 δευτερόλεπτα, με τον υπάρχον ρυθμό παραγωγής data, για να γεμίσει ένα μέσο σπίτι. Τί εννοεί με μέσο σπίτι ο ποιητής δεν το διευκρινίζει, αλλά στο απαραίτητα αποβλακωτικό σχεδιάκι δίπλα, υπήρχε ένα σπίτι σαν αυτό που ζωγραφίζαμε στο νηπιαγωγείο: ένα τετράγωνο με ένα τρίγωνο από πάνω, μάλλον διώροφο.
Υπάρχει η τάση να συγκρίνεται η πληροφορία με κάτι υλικό· σαν να προσπαθεί να στερεωθεί η ιδεολογία που την περιβάλλει με κάτι το οικείο. Τί είναι όμως η πληροφορία και τα data; Έχουμε αναφερθεί στο παρελθόν [1]:

Τα data (και η γενικευμένη, καθολική data-ποίηση) είναι το καινούργιο “χρυσάφι”, η καινούργια ατέλειωτη πρώτη ύλη του βιοπληροφορικού καπιταλισμού. Η 4η βιομηχανική επανάσταση στηρίζεται παντού στα data, στα δεδομένα: στη συγκέντρωση, στη διαχείριση και στην επεξεργασία τους, στην καπιταλιστική αξιοποίησή τους. Όλα τα αναγγελμένα θαύματα της 4ης βιομηχανικής επανάστασης, απ’ το internet of things μέχρι το cloud, απ’ την εξατομικευμένη ιατρική μέχρι την καθολική μεσολάβηση / μηχανοποίηση της καθημερινής ζωής, στηρίζονται στα ή περνάνε μέσα από τα data.

[…]
Όσο κι αν φαίνεται παράξενο ΔΕΝ υπάρχει συγκεκριμένος ορισμός τι είναι “δεδομένο”!!! Θα μπορούσε κανείς να υποθέσει ότι πρόκειται για την “μονάδα πληροφορίας” - αλλά έτσι γίνεται μια μετάθεση ορισμών απ’ το “δεδομένο” στην “πληροφορία”, για την οποία επίσης ΔΕΝ υπάρχει συγκεκριμένος και ακριβής ορισμός!!

Δεν είναι καθόλου τολμηρό, αντίθετα είναι ιστορικά ακριβές, να υποστηρίξει κανείς ότι τα data (στον πληθυντικό) είναι μια πολύ πρόσφατη κατασκευή σαν “έννοια”, ένα είδος μετα-εννόησης άμεσα και οργανικά σχετισμένο με την σύλληψη και την λειτουργία των ηλεκτρονικών υπολογιστών. Μια συγκεκριμένη μαθηματική θεωρία που συνέλαβε την λειτουργία και την χρησιμότητα της μηχανικής διευθέτησης “αποφάνσεων” ναι ή όχι (με πιο διάσημο δημιουργό τον αμερικάνο μαθηματικό Claude Shannon) είχε ανάγκη από ονόματα (και θεωρία) για την λειτουργία αυτών των διακοπτών δύο θέσεων (“ναι” ή “όχι”). Χωρίς υπερβολή η ιδέα περί data γέννησε τους ηλεκτρονικούς υπολογιστές και όχι το ανάποδο: οτιδήποτε μπορεί να αναχθεί στο on ή off (της ροής ηλεκτρικού ρεύματος) είναι δεδομένο (και με ορισμένες προϋποθέσεις πληροφορία).

Αν και η έννοια της πληροφορίας είναι πιο διευρημένη, αυτή των δεδομένων/data σχετίζεται αποκλειστικά με τους υπολογιστές. Η πρώτη χρήση του όρου το 1946 υποδήλωνε “επικοινωνίσιμες και αποθηκεύσιμες πληροφορίες υπολογιστή”. Στα λατινικά η λέξη data είναι ο πληθυντικός της λέξης datum: αντικείμενο, αλλά η συνηθισμένη χρήση της στα αγγλικά είναι σε ενικό που δηλώνει το αμέτρητο, όπως η βροχή ή η άμμος· σαν φάρσα της ιστορίας για κάτι που έχει ως κύριο σκοπό την μέτρηση.

Το τοπίο είναι αρκετά θολό όταν προσπαθούμε να συλλάβουμε την ιδέα της πληροφορίας και των δεδομένων/data. Οι πρώτες αναφορές μάλλον είναι σε προτάσεις που περιγράφουν κάποιο αντικείμενο· μετά σκεφτόμαστε κάποιο γεγονός ως πληροφορία και ίσως λίγο αργότερα φανταστούμε μια εικόνα, έναν ήχο ή πιο σπάνια μια γεύση ή μια μυρωδιά. Κάπου ενδιάμεσα παρεμβάλλονται η γνώση, η αντίληψη και οι διαφορετικές ερμηνείες. Η απομόνωση αυτών των πληροφοριών από τις παραπάνω παρεμβολές και γενικά από την ανθρώπινη αντίληψη/ερμηνεία/κατανόηση ίσως μας φέρνει πιο κοντά σε μια απάντηση για το τί είναι πληροφορία/data. Ο σκοπός της είναι να γίνεται αντιληπτή/ερμηνεύσιμη/κατανοητή από την μηχανή και όχι από την ανθρώπινη εμπειρία· εκείνη έρχεται σε δεύτερο χρόνο για να προσπαθήσει να αντιληφθεί/ερμηνεύσει/κατανοήσει την πλέον μεσολαβημένη πληροφορία.

Αν λοιπόν η πληροφορία/data είναι η μεταφρασμένη ανθρώπινη εμπειρία στην γλώσσα της μηχανής, η συλλογή της σε αποθήκες (βάσεις δεδομένων και data centers) προς επεξεργασία είναι η λειτουργία από την οποία προκύπτουν τα big data. Είναι σημαντική αυτή η επισήμανση: τα big data  είναι απλά αυτή η τεράστια συλλογή των data, παρόλο που στην καθομιλουμένη υποννοείται και η επεξεργασία/διαχείρισή τους. Οι ειδικοί προς το παρόν καμαρώνουν για τις μεγάλες αποθήκες δεδομένων που έχουν συγκεντρώσει και αυξάνουν συνεχώς, ενώ η διαδικασία της επεξεργασίας τους υστερεί ακόμα σε σχέση με τον όγκο που έχουν στην διάθεσή τους. Οι έξυπνοι αλγόριθμοι μηχανικής μάθησης (machine learning) και οι τεχνητές νοημοσύνες προπονούνται αδιάκοπα για να εκπληρώσουν τις θαυμαστές υποσχέσεις των ειδικών.

Η επεξεργασία όλων αυτών των πληροφοριών που φανταζόμαστε ως data, όπως τα μηνύματα που ανταλλάσσονται, τις αναζητήσεις και τις επισκέψεις σε ιστο-σελίδες, τις φωτογραφίες και τα βίντεο που δημοσιεύονται, είναι στην ουσία και κατά κύριο λόγο η επεξεργασία του πλαισίου τους, και κατά δεύτερο λόγο το ίδιο το περιεχόμενο – όπως τουλάχιστον θα το αντιλαμβανόταν/ερμήνευε/κατανοούσε η ανθρώπινη εμπειρία. Η έκφραση του προσώπου για παράδειγμα, σε συνδυασμό με τον φωτισμό, την τοποθεσία, την ημερομηνία, το πού δημοσιεύτηκε η φωτογραφία, αν υπάρχουν και άλλα άτομα, η ανάλυση των pixel , ακόμα και ο τρόπος που κράταγε ο φωτογράφος το κινητό είναι οι χρήσιμες για την μηχανή πληροφορίες· η μηχανή δεν θέλει να θυμηθεί, θέλει να αναλύσει και να αποθηκεύσει. Αυτές οι πληροφορίες/data που θέλουν να φτάσουν μέχρι την απειρο-ελάχιστη κλίμακα της ύπαρξης και αποτελούν την πρώτη ύλη του νέου παραδείγματος, ονομάζονται metadata στην γλώσσα των ειδικών.

Cyborg #19

[...]

...η συνέχεια στο έντυπο τεύχος του Cyborg.
σημεία διακίνησης ]

 Wintermute

Σημειώσεις

1 - Τί είναι τα data και σε ποιόν ανήκουν; - Cyborg #13,  Οκτώβρης 2018
επιστροφή]

από sarajevomag

Δεν υπάρχουν σχόλια:

Από το Blogger.