Πώς είναι τα μεγάλα δεδομένα που αλλάζουν την καθημερινή ζωή σε ολόκληρη την Αμερική;

Πώς είναι τα μεγάλα δεδομένα που αλλάζουν την καθημερινή ζωή σε ολόκληρη την Αμερική;
Πώς είναι τα μεγάλα δεδομένα που αλλάζουν την καθημερινή ζωή σε ολόκληρη την Αμερική;

Βίντεο: Από την Τέχνη της Ψηφιακής Επιστήμης στην Επιστήμη των Ψηφιακών Τεχνών | Συμπόσιο S+T+Arts 2020 2024, Ιούνιος

Βίντεο: Από την Τέχνη της Ψηφιακής Επιστήμης στην Επιστήμη των Ψηφιακών Τεχνών | Συμπόσιο S+T+Arts 2020 2024, Ιούνιος
Anonim

Η ιδέα των «μεγάλων δεδομένων» έχει γίνει πανταχού παρούσα, τι είναι αυτό και πώς αλλάζει ο τρόπος που ζούμε; Κάναμε κάθισμα με τον επιστήμονα δεδομένων, τον υποψήφιο του Harvard PhD και τον υποψήφιο για την Εθνική Βιβλιοθήκη, Cathy O'Neil, για να μάθουμε.

CT: Ας ξεκινήσουμε με τα βασικά - τι ακριβώς είναι τα "μεγάλα δεδομένα";

CO: Μεγάλα δεδομένα είναι μια νέα προσέγγιση για την πρόβλεψη των πραγμάτων. Πιο συγκεκριμένα, τα «μεγάλα δεδομένα» είναι η χρήση παρεμπιπτόντως συλλεγόμενων δεδομένων - όπως το πώς αναζητάτε μέσω του προγράμματος περιήγησης ή του τι κάνετε στο Facebook - για να συνάγετε τα πράγματα για εσάς, όπως αυτά που πρόκειται να αγοράσετε ή ποιες είναι οι πολιτικές σας ευθύνες. Είναι ένας έμμεσος τρόπος να αποκαλύψεις τους ανθρώπους. Για παράδειγμα, μια φωτογραφική μηχανή που μας παρακολουθεί δεν ρωτάει τι κάνεις; - απλά παίρνει για να δούμε τι κάνουμε.

CT: Και τι είναι ένας αλγόριθμος;

CO: Οι αλγόριθμοι είναι υπολογισμοί που [ερμηνεύουν] τα δεδομένα που συγκεντρώθηκαν για σας για να δημιουργήσουν μια πρόβλεψη. Σκεφτείτε το ως μια μαθηματική εξίσωση που προσπαθεί να απαντήσει σε μια ερώτηση που πλαισιώνεται ως πρόβλεψη, όπως: «Είναι αυτό το πρόσωπο που πρόκειται να αγοράσει κάτι; ή "Είναι αυτό το πρόσωπο που πρόκειται να ψηφίσει για κάποιον;"

CT: Γιατί ακούω τόσα πολλά γι 'αυτό τώρα;

CO: Πριν από τα «μεγάλα δεδομένα», οι στατιστικολόγοι θα έκαναν ακριβά πράγματα όπως η δημοσκόπηση για να καταλάβουν το μέλλον. Για παράδειγμα, ζητώντας από τους ανθρώπους άμεσες ερωτήσεις όπως: «Ποιον πρόκειται να ψηφίσετε;» Τώρα, βασιζόμαστε όλο και περισσότερο σε «εξάτμιση δεδομένων», το οποίο λέω τα δεδομένα που συλλέγονται για σας συνεχώς, για να συμπεράνω τα πράγματα για σας.

Πριν από τα «μεγάλα δεδομένα», οι εταιρείες είχαν μόνο άγριες εικασίες για να κάνουν. Τώρα έχουμε καλύτερα από άγριες εικασίες. Αυτό που εκπλήσσει είναι ότι οι περισσότεροι μεγάλοι αλγόριθμοι δεδομένων είναι άγρια ​​ανακριβείς και δεν υπάρχει λόγος να πιστεύουμε ότι έχουν δίκιο. Αλλά είναι καλύτερες από άγριες εικασίες. Και γι 'αυτό τα μεγάλα δεδομένα έχουν απογειωθεί όπως έχει.

CT: Αν είναι ανακριβείς, τότε τι αντανακλούν;

CO: Τα εσφαλμένα σύνολα δεδομένων που τα τροφοδοτούμε. Οι αλγόριθμοι δεν γνωρίζουν τίποτα πέρα ​​από αυτό που τους λέμε. Έτσι, όταν έχουμε ανομοιογενή δεδομένα και το τροφοδοτούμε με τον αλγόριθμο, ή με προκατειλημμένα δεδομένα, θα θεωρήσει ότι είναι πραγματικότητα.

Image

Ailsa Johnson / © Πολιτιστικό Ταξίδι

CT: Τι είναι ένα πραγματικό παράδειγμα αυτού;

CO: Ένα παράδειγμα μπορεί να είναι ότι στις Ηνωμένες Πολιτείες οι μαύροι είναι πέντε φορές πιο πιθανό να συλληφθούν για το κάπνισμα από τους λευκούς. Αυτό δεν συμβαίνει επειδή οι μαύροι άνθρωποι καπνίζουν κατσαρόλα πιο συχνά - και οι δύο ομάδες καπνίζουν κατσαρόλα με τον ίδιο ρυθμό. Οι μαύροι είναι πολύ πιθανότερο να συλληφθούν για αυτό. Εάν το παραδώσετε σε έναν αλγόριθμο, το οποίο κάνουμε, θα συμπεράνει σωστά ότι οι μαύροι άνθρωποι είναι πολύ πιθανότερο στο μέλλον να συλληφθούν για το κάπνισμα. Και τότε θα δώσει στους μαύρους ανθρώπους υψηλότερες βαθμολογίες κινδύνου για την εγκληματικότητα, πράγμα που έχει επιπτώσεις στην ποινική καταδίκη.

Ένα άλλο παράδειγμα είναι ένα πείραμα σκέψης. Θα χρησιμοποιήσω το Fox News, επειδή η Fox News είχε εκρήξεις που σχετίζονταν πρόσφατα με μια εσωτερική κουλτούρα του σεξισμού. Το πείραμα είναι «Τι θα συμβεί αν η Fox News προσπάθησε να χρησιμοποιήσει τα δικά της δεδομένα για να δημιουργήσει έναν αλγόριθμο μηχανικής μάθησης για να προσλάβει ανθρώπους στο μέλλον;»

Πέστε ότι ψάχνουμε για ανθρώπους που ήταν επιτυχείς στο Fox News, για παράδειγμα. Εξαρτάται από το πώς θα ορίσατε την επιτυχία, αλλά συνήθως θα δούμε ανθρώπους που παίρνουν αυξήσεις, προωθήσεις ή παραμονή για μεγάλο χρονικό διάστημα. Με οποιοδήποτε από αυτά τα μέτρα, τα δεδομένα θα αντανακλούν ότι οι γυναίκες δεν θα πετύχουν στο Fox News. Αν χρησιμοποιηθεί ως αλγόριθμοι μίσθωσης, θα προωθήσει αυτό το πρόβλημα. Θα εξετάσει μια ομάδα αιτούντων και θα έλεγε «δεν θέλω να προσλάβει γυναίκες, διότι δεν είναι επιτυχείς εδώ. Δεν είναι καλές μισθώσεις. " Και δεν πρέπει απλώς να είναι η Fox News - κάθε εταιρική κουλτούρα έχει προκατάληψη. Όταν τροφοδοτείτε δεδομένα αλγορίθμου, τότε η αλλοίωση του αλγορίθμου διαδίδει αυτό. Συνεχίζει να ενισχύει τις προκαταλήψεις που υπάρχουν ήδη στην κοινωνία.

CT: Είναι οι προκαταλήψεις σκόπιμες;

CO: Δεν νομίζω ότι οι επιστήμονες των δεδομένων προσπαθούν να κάνουν σεξιστικούς ή ρατσιστικούς αλγορίθμους. Αλλά οι αλγόριθμοι μηχανικής μάθησης είναι εξαιρετικά καλοί στο να πάρουν σχετικά νουκιστά σχέδια και στη συνέχεια να τα πολλαπλασιάσουν. Δεν είναι κάτι που οι επιστήμονες των δεδομένων σκοπεύουν να κάνουν, αλλά είναι προκαταλήψεις παρόλα αυτά.

CT: Τι ρόλο παίζουν οι ανακριβείς αλγόριθμοι στην καθημερινότητά μας;

CO: Χρησιμοποιούνται σε κάθε είδους αποφάσεις για τη ζωή των ανθρώπων - τα πάντα, από τις εισαγωγές στο κολέγιο μέχρι να βρουν δουλειά.

Υπάρχουν αλγόριθμοι που αποφασίζουν πώς η αστυνομία θα αστυνομεύσει τις γειτονιές, καθώς και αλγόριθμους που αποφασίζουν πώς οι δικαστές θα καταδικάσουν τους κατηγορούμενους. Υπάρχουν αλγόριθμοι που καθορίζουν πόσα χρήματα θα πληρώσετε για την ασφάλιση ή τι είδους APR [επιτόκιο] λαμβάνετε στην πιστωτική σας κάρτα. Υπάρχουν αλγόριθμοι που αποφασίζουν για τον τρόπο που κάνετε στην εργασία σας, οι οποίοι χρησιμοποιούνται για τον προσδιορισμό των αυξήσεων των αποδοχών. Υπάρχουν αλγόριθμοι σε κάθε βήμα του τρόπου, από τη γέννηση έως τον θάνατο.

CT: Τότε πού μας αφήνει αυτό;

CO: Έχουμε περάσει στην εποχή των μεγάλων δεδομένων και έχουμε ρίξει αλγόριθμους σε κάθε πρόβλημα που έχουμε, υποθέτοντας ότι αυτοί οι αλγόριθμοι πρέπει να είναι πιο δίκαιοι από τους ανθρώπους - αλλά στην πραγματικότητα είναι εξίσου άδικο με τους ανθρώπους. Πρέπει να κάνουμε καλύτερα.

Κάντε κλικ εδώ για να διαβάσετε το δεύτερο μέρος της συνέντευξής μας με τον Δρ O'Neil. Το βιβλίο της, Τα όπλα της καταστροφής της μαμάς: Πόσο μεγάλα δεδομένα αυξάνουν την ανισότητα και απειλούν τη δημοκρατία είναι διαθέσιμα τώρα.