Wie ich es aufgesaugt habe und auf Code gespannt bin

Foto von Jeff Jackowski / CC BY-NC-SA

Mein erster Versuch zum Codieren kam früh. In der Mittelschule waren ein Freund und ich davon besessen, digitale Papierpuppen zu schaffen - Hunderte von Drag-and-Drop-Outfits, die zu einer einzigen, problematischen Waifish-Figur passen. Ich würde stundenlang mit dem Zeichnen von pixelierten Kleidern in Microsoft Paint verbringen, die JPEG-Dateien auf meine nackte Angelfire-Site hochladen und das HTML so lange anpassen, bis es funktioniert hat. Jedes Mal, wenn ich ein neues Image erfolgreich portiert habe, würde ich etwas Nervenkitzel bekommen. Ich habe ein Ding gebaut! Das Projekt war nur zu meiner eigenen Unterhaltung, aber wenn ich besonders stolz auf ein Ensemble aus Halfter und Glocken sein würde, würde ich die URL in meiner Abwesenheitsnachricht auf AIM setzen, dem Vorläufer von Twitter "this ====>" . ”

Ich brauchte mehr als 15 Jahre, um meine Zehen wieder in die Programmierung zu tauchen. Und ich weiß warum. Jedes Mal, wenn ich zuvor versucht habe, „Code lernen zu lernen“, musste ich eine Fertigkeit entwickeln, von der ich abstrakt glaubte, dass sie nützlich wäre. Das letzte Mal, als ich es probierte, war während meiner ersten Jahre als Fakten-Checker bei Wired, als ich versuchte, mir Python in der Pause beizubringen, nachdem wir die neueste Ausgabe an die Drucker ausgeliefert hatten. Ich habe einen Teil des Online-Kurses absolviert, bevor ich ihn aufgegeben habe. Ich konnte die Dummy-Übungsbeispiele nicht mit allem verbinden, was ich in meiner Arbeit erlebt habe.

Dieses Mal habe ich bei Stanfords John S. Knight Journalism Fellowship ein echtes Projekt, bei dem man hacken muss - und es hat den Unterschied gemacht. Während meines ersten Quartals fragte ich mich, wie Journalisten aus den Erfolgen und Misserfolgen des wissenschaftlichen Publizierens lernen könnten. Das hat mich veranlasst, über die wissenschaftliche Literatur nicht als Thema zu denken, über das ich berichten sollte, sondern als potenzielles journalistisches Instrument. Die Wissenschaftler haben Schwierigkeiten, mit den Tausenden von jährlich veröffentlichten Veröffentlichungen Schritt zu halten. Daher experimentieren sie mit KI-gesteuerten Suchmaschinen, um die wichtigsten Informationen für sie zu finden. Warum können Journalisten nicht etwas auf dem riesigen Datenstapel aufbauen, der ihren eigenen Ermittlungszwecken dient?

Die ganze Python, die ich in diesem Viertel in mein Gehirn gestopft habe, diente dazu, zu verstehen, was das sein könnte. Hier habe ich angefangen: Nahezu jede wissenschaftliche Veröffentlichung enthält einen Abschnitt, in dem die persönlichen und finanziellen Interessen der Forscher an ihren Themen dargestellt werden. Ich möchte sehen, ob es möglich ist, eine Datenbank mit diesen Konflikten zu erstellen und den Text für Verbindungen zu ermitteln. Wissenschaftler geben möglicherweise nicht immer alles preis, was sie sollten, aber wenn Sie Journalisten die Suche nach öffentlichen Offenlegungen erleichtern möchten, könnte dies eine Möglichkeit sein, Leads zu identifizieren und voreingenommene Quellen zu vermeiden.

Wenn Sie vor sich selbst kichern: Ja, ich weiß, das ist enorm schwierig. Aber ich entschied mich, erneut zu programmieren, weil ich wusste, dass ich ein Minimum an technischen Kenntnissen haben musste, um zu verstehen, was machbar ist. Und in dem Prozess, in dem ich erkannte, was nicht möglich ist, habe ich so viel mehr gelernt, um meinen Journalismus zu unterstützen.

Ich habe mich mit zwei auf Datenjournalismus ausgerichteten Kursen befasst - von den unglaublichen Serdar Tumgoren und Cheryl Phillips -, die mich in die Grundlagen der Unix-Shell-, Python- und API-Schnittstelle einführten. Beide Kurse haben mir ein Gefühl für die Qualität und die Formatierung der Daten vermittelt, die Journalisten für kugelsichere Untersuchungen benötigen. Vor diesem Hintergrund konnte ich mich an Forscher wenden, die die Verarbeitung natürlicher Sprache verwenden. Er wies mich auf die vorhandenen APIs und Mining-Schnittstellen hin, die meine Arbeit unterstützen könnten, und half mir bei der Behebung der vielen Hindernisse auf dem Weg.

Während ich meine aufgedunsenen Python-Fähigkeiten verwende, um mit Open-Science-APIs herumzuspielen, entdecke ich mehr, als ich jemals wusste, wie diese Datenbanken aufgebaut sind. Um nur die gewünschten Metadaten aus PubMed Central, der öffentlichen Quelle für NIH-finanzierte Forschung, herauszuholen, musste ich deren inhärente Organisation verstehen. Dabei habe ich neue Suchparameter gefunden, von denen ich nie wusste, dass sie existieren. Und während ich mich mit jedem Teil des Problems beschäftige - zuerst die Papiere sammeln, um sie zu analysieren, dann den benötigten Text heraussuchen und dann durchsuchbar organisieren -, lerne ich diskrete Programmierfähigkeiten, die ich für die Zukunft anwenden kann Projekte.

Nichts davon würde aus der Ferne Spaß machen, wenn ich kein Projekt habe, für das ich eine Leidenschaft habe. Googling Stack Overflow war wie der Versuch, eine Sprache durch Lesen des Wörterbuchs zu lernen, bis ich aus einem bestimmten Grund googelte. Und ich würde auf keinen Fall so viel Zeit damit verbringen, auf Fehlermeldungen zu starren, wenn ich mir nicht den Goldschatz (oder ein Dossier von Dokumenten) am Ende des Regenbogens vorstellen könnte. Für jetzt sind Interessenkonflikte meine digitalen Papierpuppen.

Sie geben mir sogar den gleichen Erfolg, den ich in der Mittelschule gemacht habe. Meine Mitmenschen haben sich an die Signale gewöhnt: Nachdem ich lautlos gearbeitet habe, den Kopf nach unten in meinen Laptop gelegt, werde ich mich in meinem Sessel zurücklehnen, meine Arme heben und triumphierend flüstern: "Yesssss!" Was auch immer passiert ist, war wahrscheinlich das kleinste , der marginalste Schritt in meinem aktuellen Projekt. Aber es brachte mich so viel näher an eine Wissensquelle, die es auf der Welt noch nicht gibt. Ich kann mir nichts Aufregenderes vorstellen.

Eine Fußnote: Wenn Sie kein Projekt zum Testen haben, ist das in Ordnung. Für jeden Journalisten ist Codierung nicht unbedingt erforderlich - zumindest noch nicht -, aber die Früchte des Codes anderer Journalisten können absolut Bestandteil des Toolkits eines jeden Reporters sein. In meinen Kursen in diesem Quartal wurde ein umfassender Überblick über Open Source-Tools gegeben, die die harte Arbeit des Verfolgens und Abbringens wertvoller Quellen übernehmen, ohne dass eine Programmierung erforderlich ist. Sie müssen nicht in Stanford sein, um sich über einige dieser Abkürzungen zu informieren. Wenn Sie wie ich sind, wussten Sie nicht, dass eine dieser Anwendungen vorhanden war, und Sie hätten nicht einmal daran gedacht, danach zu suchen. Sobald ich von ihnen erfuhr, konnte ich mir einfach Anwendungen aus meinem Beat vorstellen. Vielleicht wirst du auch.