Άρθρο γνώμης – Εξερευνώντας τη δημοσιογραφία δεδομένων

Από τον Jonathan Soma, Καθηγητής πρακτικής στη δημοσιογραφία δεδομένων στην έδρα Knight και Διευθυντής του επαγγελματικού προγράμματος Lede στο Πανεπιστήμιο Columbia 

Εξερευνώντας τη δημοσιογραφία δεδομένων

Αναρωτιέσαι τι χρειάζεται για να γίνεις δημοσιογράφος δεδομένων; Η απάντηση δεν είναι μία. Ο τομέας της δημοσιογραφίας δεδομένων είναι τόσο μεγάλος που οι τρόποι να τον προσεγγίσεις είναι όσοι και οι ιστορίες που μπορείς να γράψεις.

Σε αντίθεση με παραδοσιακούς κλάδους δημοσιογραφίας όπως το φωτορεπορτάζ ή η δημοσιογραφία για περιοδικά, η δημοσιογραφία δεδομένων επικεντρώνεται κυρίως στην προέλευση των πληροφοριών και όχι στην τελική παρουσίασή τους. Στην ουσία, τα δεδομένα χρησιμεύουν ως άλλη “γλώσσα” για τη συλλογή πληροφοριών. Αν μιλούσα ισπανικά, θα είχα τη δυνατότητα να γράψω πολύ περισσότερες ιστορίες σε διάφορες πολιτείες της Αμερικής. Το ίδιο συμβαίνει και με τα δεδομένα. Αποκτώντας δεξιότητες στον χειρισμό δεδομένων, ανοίγεις πόρτες σε έναν τεράστιο πλούτο πηγών και πληροφοριών που διαφορετικά θα ήταν απρόσιτες.

Όταν λοιπόν μιλάμε για έναν τόσο ευρύ πεδίο, από πού μπορεί κανείς να ξεκινήσει και πού μπορεί να φτάσει; Ας ρίξουμε μια ματιά σε μερικά παραδείγματα από τα διάφορα υποείδη του.

Εξειδικευμένη δημοσιογραφία (beat reporting)

Οι εξειδικευμένοι δημοσιογράφοι είναι συνήθως “κατά τύχη” δημοσιογράφοι δεδομένων, οι οποίοι αποκτούν τα εργαλεία και τις δεξιότητες που χρειάζονται για να ολοκληρώσουν μια ιστορία. Για παράδειγμα, κατά τη σύνταξη ενός άρθρου σχετικά με τις επιδόσεις ενός σχολείου, ένας δημοσιογράφος είναι πολύ πιθανό να χρειαστεί να εξετάσει υπολογιστικά φύλλα με πληροφορίες για τα ποσοστά αποφοίτησης στις διάφορες σχολικές περιφέρειες μιας πόλης, γεγονός που μπορεί να τον ωθήσει στη χρήση συγκεντρωτικών πινάκων (pivot tables) για την ομαδοποίηση και τη σύνοψη δεδομένων.

ΠΡΑΚΤΙΚΗ ΑΣΚΗΣΗ: Βρείτε μια πύλη ανοικτών δεδομένων για τη χώρα ή την πόλη σας. Χρησιμοποιήστε συγκεντρωτικούς πίνακες για να συνοψίσετε τα δεδομένα με βάση τις πολιτείες ή τις περιφέρειες.

Ερευνητική δημοσιογραφία

Οι ερευνητές δημοσιογράφοι έχουν μεγάλη εμπειρία στο κομμάτι της απόκτησης δεδομένων και γνωρίζουν καλά ότι δεν βρίσκεις πάντα αυτό που θέλεις σε ένα απλό αρχείο Excel που κατεβαίνει με ένα κλικ. Συχνά κάνουν χρήση επεκτάσεων Chrome ή της Python για να δημιουργήσουν διαδραστικά εργαλεία για web scraping που “χτενίζουν” ιστοσελίδες, συμπληρώνοντας φόρμες και κάνοντας κλικ σε κουμπιά, ενώ παράλληλα κατεβάζουν σημαντικές πληροφορίες που είναι κλειδωμένες στο διαδίκτυο.

Τα δεδομένα που λαμβάνονται μέσω αιτημάτων ελευθερίας της πληροφόρησης έχουν συχνά μορφή που δεν είναι φιλική προς τον χρήστη, όπως σκαναρισμένα email ή πίνακες ενσωματωμένους σε αρχεία PDF. Η εξαγωγή κειμένου από αυτές τις σαρώσεις μπορεί να απαιτεί χρήση τεχνολογίας οπτικής αναγνώρισης χαρακτήρων (OCR), αν και εργαλεία όπως το Pinpoint της Google ή οι νεότερες εκδόσεις του MacOS Preview προσφέρουν αυτοματοποιημένες λύσεις. Οι πίνακες λογιστικών φύλλων που εμφανίζονται σε μορφή PDF είναι ένας διαρκής πονοκέφαλος για τους δημοσιογράφους δεδομένων, οι οποίοι καταφεύγουν στη χρήση του Cometdocs, του Tabula ή του pdfplumber της Python για να τους διαχειριστούν.

ΠΡΑΚΤΙΚΗ ΑΣΚΗΣΗ: Ανεβάστε ένα έγγραφο (ή μια φωτογραφία ενός εγγράφου) στο Pinpoint της Google για να αξιολογήσετε την ακρίβεια εξαγωγής κειμένου. Βρείτε ένα PDF με έναν πίνακα και δοκιμάστε τις δυνατότητες του Cometdocs ή του Tabula.

Χαρτογράφηση και γεωγραφική ανάλυση

Ο τομέας της χαρτογράφησης και της γεωγραφικής ανάλυσης έχει κερδίσει έδαφος τα τελευταία χρόνια, καθώς προσφέρει στους δημοσιογράφους ένα μέσο για να εξερευνήσουν περιοχές με lock-down και εμπόλεμες ζώνες μέσω δορυφορικών εικόνων. Τα δεδομένα προέρχονται από δορυφόρους που χρηματοδοτούνται από τις ΗΠΑ ή την ΕΕ, καθώς και από ιδιωτικές εταιρείες που παρέχουν καθημερινά στιγμιότυπα από όλο τον πλανήτη. Οι δημοσιογράφοι δεδομένων μπορούν να επεξεργαστούν αυτά τα δεδομένα, χρησιμοποιώντας δωρεάν εργαλεία όπως το GDAL και το QGIS ή μπορούν να επιλέξουν τη χρήση εργαλείων επί πληρωμή, όπως το ArcGIS της ESRI.

Η χαρτογράφηση, όπως την ξέρουμε, είναι μόνο ένα μικρό τμήμα του ευρύτερου τομέα που είναι γνωστός ως GIS ή γεωγραφικά συστήματα πληροφοριών. Τα GIS  αποτελούν ξεχωριστό επιστημονικό κλάδο και μπορεί να συναντήσετε δημοσιογράφους με μεταπτυχιακά ή ακόμα και διδακτορικά διπλώματα που ειδικεύονται σε αυτόν. Αυτό δεν πρέπει να σας αποθαρρύνει, όμως! Τα πρώτα βήματα σε αυτόν τον τομέα δεν ήταν ποτέ πιο εύκολα!

ΠΡΑΚΤΙΚΗ ΑΣΚΗΣΗ: Χρησιμοποιήστε τις ιστορικές εικόνες του Google Earth Pro για να δείξετε τις αλλαγές με την πάροδο του χρόνου σε ένα δεδομένο σημείο του πλανήτη ή δοκιμάστε να δημιουργήσετε μια εμπειρία “scrollytelling” με το MapBox.

Δημοσιογραφία γραφικών (graphics journalism)

Η δημοσιογραφία γραφικών είναι η πιο προηγμένη τεχνικά εκδοχή της δημοσιογραφίας δεδομένων. Προτού ένας δημοσιογράφος γραφικών φτάσει στο στάδιο της οπτικοποίησης, συχνά ασχολείται με εργασίες όπως η απόξεση, ο καθαρισμός και η ανάλυση δεδομένων, όπως ακριβώς και ένας “παραδοσιακός” δημοσιογράφος δεδομένων. Οι εργασίες αυτές είναι απαραίτητες για τη δημιουργία διαγραμμάτων και γραφημάτων. Το Datawrapper είναι ένα δημοφιλές και φιλικό προς τον χρήστη εργαλείο που χρησιμοποιείται από πολυάριθμες αίθουσες σύνταξης για τη δημιουργία τυποποιημένων οπτικοποιήσεων.

Ωστόσο, αν ένα newsroom θέλει να δημιουργήσει προσαρμοσμένες απεικονίσεις, τα πράγματα περιπλέκονται. Οι σύγχρονες εργαλειοθήκες βασίζονται συχνά στο Svelte ή το React, τα οποία είναι πλαίσια JavaScript που συνδυάζουν δεδομένα και οπτικά στοιχεία και εν συνεχεία τα παρουσιάζουν ως διαδραστικά στοιχεία στη σελίδα. Ακόμα και τα στατικά γραφικά – αυτά που είτε δεν αλλάζουν είτε δεν κινούνται – συχνά εξάγονται από το Adobe Illustrator με το ai2html, ένα εργαλείο μετάφρασης κειμένου και προβολής του σε διαφορετικά μεγέθη οθόνης που ανέπτυξαν οι New York Times. Παρά, λοιπόν, την κοινή πεποίθηση ότι τα τμήματα γραφικών επικεντρώνονται κυρίως στον οπτικό σχεδιασμό, στην πραγματικότητα ασχολούνται με πολύ περισσότερες διεργασίες.

ΠΡΑΚΤΙΚΗ ΑΣΚΗΣΗ: Μάθετε τα βασικά της ανάπτυξης διαδραστικών ιστοσελίδων με Svelte ή πώς να χρησιμοποιείτε το ai2html στο Adobe Illustrator.

Ο κόσμος της δημοσιογραφίας δεδομένων μπορεί να φαντάζει δυσπρόσιτος για κάποιον που κάνει τα πρώτα του βήματα, ωστόσο, το γεγονός ότι περικλείει ένα τόσο ευρύ φάσμα εργαλείων και προσεγγίσεων, σημαίνει ότι υπάρχουν και αμέτρητες οδοί για να ξεκινήσετε το ταξίδι σας.