Ποιος συλλέγει μεγάλα δεδομένα και γιατί;

Το φθινόπωρο του 2019, ξέσπασε ένα σκάνδαλο με την υπηρεσία Apple Card: κατά την εγγραφή της, εξέδιδε διαφορετικά πιστωτικά όρια για άνδρες και γυναίκες. Ακόμα και ο Steve Wozniak δεν είχε τύχη:

Ένα χρόνο νωρίτερα, αποκαλύφθηκε ότι η πλατφόρμα Netflix εμφανίζει στους χρήστες διαφορετικές αφίσες και teaser, ανάλογα με το φύλο, την ηλικία και την εθνικότητα τους. Για αυτό, η υπηρεσία κατηγορήθηκε για ρατσισμό.

Τέλος, ο Mark Zuckerberg επιπλήττεται τακτικά για φερόμενη συλλογή, πώληση και χειραγώγηση των δεδομένων των χρηστών του από το Facebook. Με τα χρόνια, κατηγορήθηκε και μάλιστα δικάστηκε για χειραγώγηση κατά τις αμερικανικές εκλογές, βοήθεια στις ρωσικές ειδικές υπηρεσίες, υποκίνηση μίσους και ριζοσπαστικών απόψεων, ακατάλληλη διαφήμιση, διαρροή δεδομένων χρηστών, παρεμπόδιση ερευνών κατά παιδεραστών.

Ανάρτηση στο Facebook από τον zuck

Ταυτόχρονα, η διαδικτυακή υπηρεσία Pornhub δημοσιεύει ετησίως αναφορές για το τι είδους πορνό αναζητούν άνθρωποι διαφορετικών εθνικοτήτων, φύλου και ηλικίας. Και για κάποιο λόγο αυτό δεν ενοχλεί κανέναν. Αν και όλες αυτές οι ιστορίες είναι παρόμοιες: σε καθεμία από αυτές έχουμε να κάνουμε με μεγάλα δεδομένα, τα οποία στον XNUMX αιώνα αποκαλούνται «νέο λάδι».

Τι είναι τα μεγάλα δεδομένα

Τα μεγάλα δεδομένα – είναι επίσης μεγάλα δεδομένα (eng. Big Data) ή μεταδεδομένα – είναι μια σειρά δεδομένων που φθάνουν τακτικά και σε μεγάλους όγκους. Συλλέγονται, επεξεργάζονται και αναλύονται, με αποτέλεσμα σαφή μοντέλα και μοτίβα.

Χαρακτηριστικό παράδειγμα είναι τα δεδομένα από τον Μεγάλο Επιταχυντή Αδρονίων, ο οποίος έρχεται συνεχώς και σε μεγάλες ποσότητες. Με τη βοήθειά τους, οι επιστήμονες λύνουν πολλά προβλήματα.

Αλλά τα μεγάλα δεδομένα στον Ιστό δεν είναι μόνο στατιστικά στοιχεία για επιστημονική έρευνα. Μπορούν να χρησιμοποιηθούν για να παρακολουθούν πώς συμπεριφέρονται οι χρήστες διαφορετικών ομάδων και εθνικοτήτων, σε τι δίνουν προσοχή και πώς αλληλεπιδρούν με το περιεχόμενο. Μερικές φορές, για αυτό, τα δεδομένα συλλέγονται όχι από μία πηγή, αλλά από πολλές, συγκρίνοντας και προσδιορίζοντας ορισμένα πρότυπα.

Για το πόσο σημαντικά είναι τα μεγάλα δεδομένα στο δίκτυο, άρχισαν να μιλούν όταν ήταν πραγματικά πολλά. Στις αρχές του 2020, υπήρχαν 4,5 δισεκατομμύρια χρήστες του Διαδικτύου στον κόσμο, εκ των οποίων τα 3,8 δισεκατομμύρια ήταν εγγεγραμμένοι στα κοινωνικά δίκτυα.

Ποιος έχει πρόσβαση σε Big Data

Σύμφωνα με έρευνες, περισσότερες από τις μισές χώρες μας πιστεύουν ότι τα δεδομένα τους στο δίκτυο χρησιμοποιούνται από τρίτους. Ταυτόχρονα, πολλοί δημοσιεύουν προσωπικά στοιχεία, φωτογραφίες, ακόμη και έναν αριθμό τηλεφώνου σε κοινωνικά δίκτυα και εφαρμογές.

Ποιος συλλέγει μεγάλα δεδομένα και γιατί;
Ποιος συλλέγει μεγάλα δεδομένα και γιατί;
Ποιος συλλέγει μεγάλα δεδομένα και γιατί;
Ποιος συλλέγει μεγάλα δεδομένα και γιατί;

Πρέπει να εξηγηθεί εδώ: το πρώτο πρόσωπο είναι ο ίδιος ο χρήστης, το οποίο τοποθετεί τα δεδομένα του σε οποιονδήποτε πόρο ή εφαρμογή. Ταυτόχρονα, συμφωνεί (βάζει ένα τικ στη συμφωνία) στην επεξεργασία των δεδομένων αυτών δεύτερο μέρος – δηλαδή οι κάτοχοι του πόρου. Ένα τρίτο μέρος είναι εκείνο στο οποίο οι κάτοχοι του πόρου μπορούν να μεταφέρουν ή να πουλήσουν δεδομένα χρήστη. Συχνά αυτό αναγράφεται στη συμφωνία χρήστη, αλλά όχι πάντα.

Το τρίτο μέρος είναι κυβερνητικές υπηρεσίες, χάκερ ή εταιρείες που αγοράζουν δεδομένα για εμπορικούς σκοπούς. Ο πρώτος μπορεί να λάβει δεδομένα με απόφαση δικαστηρίου ή ανώτερης αρχής. Οι χάκερ, φυσικά, δεν χρησιμοποιούν δικαιώματα – απλώς χακάρουν τις βάσεις δεδομένων που είναι αποθηκευμένες στους διακομιστές. Οι εταιρείες (από το νόμο) μπορούν να έχουν πρόσβαση σε δεδομένα μόνο εάν εσείς οι ίδιοι τις έχετε επιτρέψει – επιλέγοντας το πλαίσιο κάτω από τη συμφωνία. Διαφορετικά, είναι παράνομο.

Γιατί οι εταιρείες χρησιμοποιούν Big Data;

Τα μεγάλα δεδομένα στον εμπορικό τομέα χρησιμοποιούνται εδώ και δεκαετίες, απλά δεν ήταν τόσο έντονα όσο τώρα. Αυτά είναι, για παράδειγμα, αρχεία από κάμερες παρακολούθησης, δεδομένα από πλοηγούς GPS ή διαδικτυακές πληρωμές. Τώρα, με την ανάπτυξη κοινωνικών δικτύων, διαδικτυακών υπηρεσιών και εφαρμογών, όλα αυτά μπορούν να συνδεθούν και να αποκτήσουν την πιο ολοκληρωμένη εικόνα: πού ζουν οι πιθανοί πελάτες, τι τους αρέσει να παρακολουθούν, πού πηγαίνουν διακοπές και τι μάρκα αυτοκινήτου έχουν.

Από τα παραπάνω παραδείγματα, είναι ξεκάθαρο ότι με τη βοήθεια μεγάλων δεδομένων, οι εταιρείες, πρώτα απ 'όλα, θέλουν να στοχεύσουν διαφημίσεις. Δηλαδή, να προσφέρει προϊόντα, υπηρεσίες ή μεμονωμένες επιλογές μόνο στο κατάλληλο κοινό και ακόμη και να προσαρμόζει το προϊόν για έναν συγκεκριμένο χρήστη. Επιπλέον, η διαφήμιση στο Facebook και σε άλλες μεγάλες πλατφόρμες γίνεται ολοένα και πιο ακριβή και η προβολή της σε όλους στη σειρά δεν είναι καθόλου επικερδής.

Πληροφορίες για πιθανούς πελάτες από ανοιχτές πηγές χρησιμοποιούνται ενεργά από ασφαλιστικές εταιρείες, ιδιωτικές κλινικές και εργοδότες. Οι πρώτοι, για παράδειγμα, μπορούν να αλλάξουν τους όρους ασφάλισης εάν δουν ότι συχνά αναζητάτε πληροφορίες για ορισμένες ασθένειες ή φάρμακα και οι εργοδότες μπορούν να αξιολογήσουν εάν είστε επιρρεπείς σε συγκρούσεις και αντικοινωνική συμπεριφορά.

Υπάρχει όμως ένα άλλο σημαντικό καθήκον που δυσκολεύεται τα τελευταία χρόνια: να έρθουμε κοντά στο πιο φερέγγυο κοινό. Αυτό δεν είναι τόσο εύκολο να γίνει, αν και το έργο διευκολύνεται σημαντικά από τις υπηρεσίες πληρωμών και τους ηλεκτρονικούς ελέγχους μέσω ενός ενιαίου OFD (διαχειριστής δημοσιονομικών δεδομένων). Για να έρθουν όσο το δυνατόν πιο κοντά, οι εταιρείες προσπαθούν ακόμη και να εντοπίσουν και να «γαλουχήσουν» πιθανούς πελάτες από την παιδική ηλικία.: μέσω διαδικτυακών παιχνιδιών, διαδραστικών παιχνιδιών και εκπαιδευτικών υπηρεσιών.

Πώς λειτουργεί;

Οι μεγαλύτερες ευκαιρίες για συλλογή δεδομένων προέρχονται από παγκόσμιες εταιρείες που διαθέτουν πολλές υπηρεσίες ταυτόχρονα. Το Facebook έχει πλέον περισσότερους από 2,5 δισεκατομμύρια ενεργούς χρήστες. Ταυτόχρονα, η εταιρεία διαθέτει και άλλες υπηρεσίες: Instagram – πάνω από 1 δισεκατομμύριο, WhatsApp – περισσότερα από 2 δισεκατομμύρια και άλλες.

Αλλά η Google έχει ακόμη μεγαλύτερη επιρροή: το Gmail χρησιμοποιείται από 1,5 δισεκατομμύρια ανθρώπους στον κόσμο, άλλα 2,5 δισεκατομμύρια από το λειτουργικό σύστημα Android για κινητά, περισσότερα από 2 δισεκατομμύρια από το YouTube. Και αυτό δεν υπολογίζει την αναζήτηση Google και τις εφαρμογές Χάρτες Google, το κατάστημα Google Play και το πρόγραμμα περιήγησης Chrome. Απομένει να στερεώσετε την ηλεκτρονική σας τράπεζα – και η Google θα μπορεί να γνωρίζει κυριολεκτικά τα πάντα για εσάς. Παρεμπιπτόντως, η Yandex είναι ήδη ένα βήμα μπροστά από αυτή την άποψη, αλλά καλύπτει μόνο το ρωσόφωνο κοινό.



???? Πρώτα απ 'όλα, οι εταιρείες ενδιαφέρονται για αυτά που δημοσιεύουμε και μας αρέσουν στα κοινωνικά δίκτυα. Για παράδειγμα, αν η τράπεζα δει ότι είστε παντρεμένοι και σας αρέσουν ενεργά τα κορίτσια στο Instagram ή στο Tinder, είναι πιο πιθανό να εγκρίνετε ένα καταναλωτικό δάνειο. Και η υποθήκη για την οικογένεια έχει φύγει.

Είναι επίσης σημαντικό σε ποιες διαφημίσεις κάνετε κλικ, πόσο συχνά και με ποιο αποτέλεσμα.

(Δηλ Το επόμενο βήμα είναι τα προσωπικά μηνύματα: περιέχουν πολύ περισσότερες πληροφορίες. Διέρρευσαν μηνύματα στο VKontakte, στο Facebook, στο WhatsApp και σε άλλα instant messenger. Σύμφωνα με αυτούς, παρεμπιπτόντως, είναι εύκολο να παρακολουθείτε τη γεωγραφική θέση τη στιγμή της αποστολής του μηνύματος. Σίγουρα έχετε παρατηρήσει: όταν συζητάτε να αγοράσετε κάτι ή απλώς να παραγγείλετε πίτσα με κάποιον, η σχετική διαφήμιση εμφανίζεται αμέσως στη ροή.

🚕 Τα μεγάλα δεδομένα χρησιμοποιούνται ενεργά και «διαρρέουν» από υπηρεσίες παράδοσης και ταξί. Ξέρουν πού ζείτε και εργάζεστε, τι αγαπάτε, ποιο είναι κατά προσέγγιση το εισόδημά σας. Η Uber, για παράδειγμα, δείχνει την τιμή υψηλότερη εάν οδηγείτε στο σπίτι από το μπαρ και προφανώς έχετε παρακάνει. Και όταν έχετε ένα σωρό άλλα aggregators στο τηλέφωνό σας, αντίθετα, θα προσφέρουν φθηνότερα.

(Δηλ Υπάρχουν υπηρεσίες που χρησιμοποιούν φωτογραφίες και βίντεο για να συλλέξουν όσο το δυνατόν περισσότερες πληροφορίες. Για παράδειγμα, βιβλιοθήκες υπολογιστικής όρασης – η Google διαθέτει μία. Σαρώνουν εσάς και το περιβάλλον σας για να δουν τι μέγεθος ή ύψος είστε, τι μάρκες φοράτε, τι αυτοκίνητο οδηγείτε, αν έχετε παιδιά ή κατοικίδια.

(Δηλ Όσοι παρέχουν πύλες SMS στις τράπεζες για τις αποστολές τους μπορούν να παρακολουθούν τις αγορές σας στην κάρτα – γνωρίζοντας τα τελευταία 4 ψηφία και έναν αριθμό τηλεφώνου – και στη συνέχεια πουλήστε αυτά τα δεδομένα σε κάποιον άλλο. Εξ ου και όλο αυτό το spam με εκπτώσεις και πίτσα ως δώρο.

🤷️️ Τέλος, εμείς οι ίδιοι διαρρέουμε τα δεδομένα μας στις αριστερές υπηρεσίες και εφαρμογές. Θυμηθείτε τη διαφημιστική εκστρατεία γύρω από το Getcontact, όταν όλοι ήταν πρόθυμοι να συμπληρώσουν τον αριθμό τηλεφώνου τους για να μάθουν πώς γράφτηκε από άλλους. Και τώρα βρείτε τη συμφωνία τους και διαβάστε τι λέει για τη μεταφορά των δεδομένων σας (σπόιλερ: οι κάτοχοι μπορούν να τα μεταβιβάσουν σε τρίτους κατά την κρίση τους):

Ποιος συλλέγει μεγάλα δεδομένα και γιατί;

Οι εταιρείες μπορούν να συλλέγουν με επιτυχία και ακόμη και να πουλούν δεδομένα χρηστών για χρόνια, μέχρι να καταλήξουν σε αγωγή – όπως συνέβη με το ίδιο Facebook. Και τότε τον καθοριστικό ρόλο έπαιξε η παραβίαση του GDPR από την εταιρεία – ένας νόμος στην ΕΕ που περιορίζει τη χρήση δεδομένων πολύ πιο αυστηρά από τον αμερικανικό. Ένα άλλο πρόσφατο παράδειγμα είναι το σκάνδαλο προστασίας από ιούς Avast: μια από τις θυγατρικές υπηρεσίες της εταιρείας συνέλεξε και πούλησε δεδομένα από 100 έως 400 εκατομμύρια χρήστες.

Όμως όλα αυτά έχουν κάποιο πλεονέκτημα για εμάς;

Πόσο μας βοηθούν όλα τα μεγάλα δεδομένα;

Ναι, υπάρχει και μια φωτεινή πλευρά.

Τα μεγάλα δεδομένα βοηθούν στη σύλληψη εγκληματιών και στην πρόληψη τρομοκρατικών επιθέσεων, στην εύρεση αγνοούμενων παιδιών και στην προστασία τους από τον κίνδυνο.

Με τη βοήθειά τους εμείς λαμβάνουμε δροσερές προσφορές από τράπεζες και προσωπικές εκπτώσεις. Χάρη σε αυτούς εμείς δεν πληρώνουμε για πολλές υπηρεσίες και κοινωνικά δίκτυα που κερδίζουν μόνο από διαφημίσεις. Διαφορετικά, μόνο το Instagram θα μας κόστιζε αρκετές χιλιάδες δολάρια το μήνα.

Μόνο το Facebook έχει 2,4 δισεκατομμύρια ενεργούς χρήστες. Παράλληλα, τα κέρδη τους για το 2019 ανήλθαν σε 18,5 δισεκατομμύρια δολάρια. Αποδεικνύεται ότι η εταιρεία κερδίζει έως και 7,7 $ ετησίως από κάθε χρήστη μέσω διαφήμισης.

Τέλος, μερικές φορές είναι απλώς βολικό: όταν οι υπηρεσίες γνωρίζουν ήδη πού βρίσκεστε και τι θέλετε και δεν χρειάζεται να αναζητήσετε μόνοι σας τις πληροφορίες που χρειάζεστε.

Ένας άλλος πολλά υποσχόμενος τομέας για την εφαρμογή Big Data είναι η εκπαίδευση.

Σε ένα από τα αμερικανικά πανεπιστήμια στη Βιρτζίνια, πραγματοποιήθηκε μια μελέτη για τη συλλογή δεδομένων για φοιτητές της λεγόμενης ομάδας κινδύνου. Αυτοί είναι αυτοί που σπουδάζουν ελάχιστα, χάνουν μαθήματα και πρόκειται να εγκαταλείψουν. Γεγονός είναι ότι στις πολιτείες κάθε χρόνο αφαιρούνται περίπου 400 άτομα. Αυτό είναι κακό τόσο για τα πανεπιστήμια, των οποίων οι αξιολογήσεις έχουν μειωθεί και η χρηματοδότησή τους, όσο και για τους ίδιους τους φοιτητές: πολλοί παίρνουν δάνεια για την εκπαίδευση, τα οποία, μετά την αφαίρεση, θα πρέπει ακόμα να αποπληρωθούν. Για να μην αναφέρουμε τον χαμένο χρόνο και τις προοπτικές καριέρας. Με τη βοήθεια μεγάλων δεδομένων, είναι δυνατό να εντοπιστούν οι καθυστερήσεις στο χρόνο και να τους προσφέρουμε έναν δάσκαλο, επιπλέον μαθήματα και άλλη στοχευμένη βοήθεια.

Αυτό, παρεμπιπτόντως, είναι επίσης κατάλληλο για σχολεία: τότε το σύστημα θα ειδοποιήσει τους δασκάλους και τους γονείς - λένε, το παιδί έχει προβλήματα, ας το βοηθήσουμε μαζί. Τα Big Data θα σας βοηθήσουν επίσης να κατανοήσετε ποια σχολικά βιβλία λειτουργούν καλύτερα και ποιοι δάσκαλοι εξηγούν το υλικό πιο εύκολα.

Ένα άλλο θετικό παράδειγμα είναι το προφίλ σταδιοδρομίας.: είναι όταν οι έφηβοι βοηθούνται να αποφασίσουν για το μελλοντικό τους επάγγελμα. Εδώ, τα μεγάλα δεδομένα σάς επιτρέπουν να συλλέγετε πληροφορίες που δεν μπορούν να ληφθούν χρησιμοποιώντας παραδοσιακά τεστ: πώς συμπεριφέρεται ο χρήστης, τι δίνει προσοχή, πώς αλληλεπιδρά με το περιεχόμενο.

Στις ίδιες ΗΠΑ λειτουργεί πρόγραμμα επαγγελματικού προσανατολισμού – SC ACCELERATE. Μεταξύ άλλων, χρησιμοποιεί την τεχνολογία GPS CareerChoice: αναλύει δεδομένα σχετικά με τη φύση των μαθητών, τις κλίσεις τους στα θέματα, τα δυνατά και τα αδύνατα σημεία τους. Στη συνέχεια, τα δεδομένα χρησιμοποιούνται για να βοηθήσουν τους εφήβους να επιλέξουν τα σωστά κολέγια για αυτούς.


Εγγραφείτε και ακολουθήστε μας στο Yandex.Zen — τεχνολογία, καινοτομία, οικονομία, εκπαίδευση και κοινή χρήση σε ένα κανάλι.

Αφήστε μια απάντηση