Eine neuronale Datenwissenschaft: wie und warum

Der grobe Leitfaden für die Datenwissenschaft über Neuronen

Ein Gehirn, das Datenwissenschaft leistet. Credit: Brain von Matt Wasser aus dem Noun Project

Still und heimlich nimmt eine neue Art von Neurowissenschaftler Gestalt an. Aus den unzähligen Reihen der Theoretiker sind Teams von Neurowissenschaftlern hervorgegangen, die wissenschaftliche Erkenntnisse über die neuronale Aktivität und die spärlichen Störgeräusche von Hunderten von Neuronen liefern. Nicht die Erstellung von Methoden zur Analyse von Daten, obwohl alle dies auch tun. Nicht das Sammeln dieser Daten erfordert dafür eine andere, gewaltige Fähigkeit. Aber Neurowissenschaftler nutzen die gesamte Bandbreite moderner Computertechniken für diese Daten, um wissenschaftliche Fragen zum Gehirn zu beantworten. Eine neuronale Datenwissenschaft ist entstanden.

Es stellte sich heraus, dass ich einer von ihnen bin, dieser Clan von Wissenschaftlern für neuronale Daten. Zufällig. Soweit ich das beurteilen kann, werden alle wissenschaftlichen Bereiche so geboren: aus Versehen. Forscher folgen ihren Nasen, fangen an, neue Dinge zu tun, und stellen plötzlich fest, dass auf Partys eine kleine Menge von ihnen in der Küche ist (weil dort die Getränke sind, im Kühlschrank - Wissenschaftler sind schlau). Hier ist ein kleines Manifest für die Wissenschaft neuronaler Daten: Warum und wie entsteht sie?

Das Warum ist dasselbe wie in allen Bereichen der Wissenschaft, in denen eine Datenwissenschaft verbreitet wurde: Die Datenmenge gerät außer Kontrolle. Für die Wissenschaft, viele Neuronen aufzuzeichnen, hat diese Datenflut eine Art wissenschaftliche Begründung. Gehirne arbeiten, indem sie Nachrichten zwischen Neuronen austauschen. Die meisten dieser Botschaften haben die Form winziger Elektrizitätsimpulse: Spitzen, wir nennen sie. Vielen erscheint es logisch, dass wir, wenn wir verstehen wollen, wie Gehirne funktionieren (und wenn sie nicht funktionieren), alle Nachrichten erfassen müssen, die zwischen allen Neuronen ausgetauscht werden. Und das bedeutet, dass so viele Spitzen wie möglich von Neuronen aufgezeichnet werden.

Ein Baby-Zebrafisch-Gehirn hat ungefähr 130.000 Neuronen und mindestens 1 Million Verbindungen zwischen ihnen; Ein Hummelhirn hat ungefähr eine Million Neuronen. Sie können sehen, wie dies sehr schnell außer Kontrolle geraten würde. Momentan zeichnen wir mit dem Standard-Kit irgendwo zwischen zehn und ein paar hundert Neuronen gleichzeitig auf. An den Grenzen sind Menschen, die einige Tausend und sogar einige Zehntausende aufzeichnen (obwohl diese Aufzeichnungen die Aktivität von Neuronen mit einer Geschwindigkeit erfassen, die viel langsamer ist, als die Neuronen ihre Spitzen senden könnten).

Wir nennen dieses Wahnsinnssystem Neurowissenschaft: Neurowissenschaft zum Studium von Neuronen; Systeme, die es wagen, von mehr als einem Neuron gleichzeitig aufzuzeichnen. Und die Daten sind unglaublich komplex. Was wir haben, sind Zehntausende von gleichzeitig aufgezeichneten Zeitreihen, von denen jede den Strom von Spitzenereignissen (tatsächliche Spitzen oder ein indirektes Maß davon) von einem Neuron enthält. Per Definition sind sie nicht stationär, ihre Statistiken ändern sich mit der Zeit. Ihre Aktivitätsraten reichten über viele Größenordnungen, von der mönchisch-stillen Betrachtung bis zum „Schlagzeug im Windkanal“. Und ihre Aktivitätsmuster reichen von uhrähnlicher Regelmäßigkeit über Stottern und Stottern bis hin zu abwechselnden Anfällen von Manie und Erschöpfung.

Nun heirate das mit dem Verhalten des Tieres, von dem du die Neuronen aufgezeichnet hast. Dieses Verhalten besteht aus Hunderten von Auswahlversuchen. oder Armbewegungen; oder Routen durch eine Umgebung. Oder die Bewegung eines Sinnesorgans oder die gesamte Haltung der Muskulatur. Wiederholen Sie dies für mehrere Tiere. Möglicherweise mehrere Hirnregionen. Und manchmal ganze Gehirne.

Wir haben keine Grundwahrheit. Es gibt keine richtige Antwort. Es gibt keine Trainingsetiketten für die Daten, außer für das Verhalten. Wir wissen nicht, wie Gehirne das Verhalten codieren. Wir können also Dinge mit Verhaltensbezeichnungen tun, aber wir wissen fast immer, dass dies nicht die Antwort ist. Sie sind nur Hinweise auf die "Antwort".

Die Systemneurowissenschaft ist dann ein reichhaltiger Spielplatz für diejenigen, die ihr Wissen über die Neurowissenschaften mit ihrem Know-how für die Analyse von Daten verbinden können. Eine neuronale Datenwissenschaft wird geboren.

Wie ist es - oder könnte es getan werden? Hier ist eine grobe Anleitung. Das Ziel des Wissenschaftlers für neuronale Daten besteht darin, wissenschaftliche Fragen zu Daten aus den Systemneurowissenschaften zu stellen. zu fragen: Wie arbeiten all diese Neuronen zusammen, um ihr Ding zu machen?

Es gibt ungefähr drei Möglichkeiten, wie wir diese Frage beantworten können. Wir können diese drei Wege erkennen, indem wir die Korrespondenz zwischen etablierten Problemklassen im maschinellen Lernen und rechnerischen Herausforderungen in den Systemneurowissenschaften untersuchen. Betrachten wir zunächst, womit wir arbeiten müssen.

Wir haben einige Daten von n Neuronen, die wir im Laufe der Zeit gesammelt haben. Wir werden diese in eine Matrix zusammenfassen, die wir als X bezeichnen - so viele Spalten wie Neuronen und so viele Zeilen wie Zeitpunkte, die wir aufgezeichnet haben (wo es liegt, wie lange ein „Zeitpunkt“ dauert: wir könnten Machen Sie es kurz und lassen Sie jeden Eintrag eine 1 für einen Spike aufzeichnen, andernfalls 0. Oder wir machen es lang und jeder Eintrag zeichnet die Anzahl der Spikes während dieser verstrichenen Zeit auf. In dieser Zeit hat sich auf der Welt einiges getan - einschließlich dessen, was der Körper getan hat. Lassen Sie uns all das in eine Matrix zusammenfassen, die wir als S bezeichnen - so viele Spalten, wie es Features auf der Welt gibt, die uns interessieren, und so viele Zeilen wie Zeitpunkte, die wir für diese Features aufgezeichnet haben.

Beim maschinellen Lernen werden traditionell drei Klassen von Modellen über den Zustand der Welt und die verfügbaren Daten erstellt: generativ, diskriminativ und dicht. Als grobe Richtlinie zeigt diese Tabelle, wie jede Klasse einer grundlegenden Frage in den Systemneurowissenschaften entspricht:

1 / Dichtemodelle P (X): Sind die Spikes strukturiert? Klingt langweilig. Tatsächlich ist dies jedoch der Schlüssel für große Bereiche der neurowissenschaftlichen Forschung, in denen wir die Wirkung von etwas (einem Medikament, einem Verhalten, einem Schlaf) auf das Gehirn untersuchen möchten. Worin fragen wir: Wie hat sich die Struktur der neuronalen Aktivität verändert?

Mit der Aufzeichnung einer Reihe von Neuronen können wir dies auf drei Arten beantworten.

Zunächst können wir den Spike-Train jedes Neurons quantifizieren, indem wir die Statistik jeder Spalte von X wie die Spike-Rate messen. Und dann fragen Sie: Was ist das Modell P (X) für diese Statistiken? Wir können diese Statistiken gruppieren, um "Typen" von Neuronen zu finden; Oder passen Sie Modelle einfach an ihre gesamte Gelenkverteilung an. In beiden Fällen haben wir ein Modell der Datenstruktur bei der Granularität einzelner Neuronen.

Zweitens können wir generative Modelle der Aktivität der gesamten Bevölkerung erstellen, indem wir die Zeilen von X verwenden - die Vektoren der Moment-zu-Moment-Aktivität der gesamten Bevölkerung. Solche Modelle zielen normalerweise darauf ab zu verstehen, wie viel von der Struktur von X aus nur wenigen Einschränkungen wiederhergestellt werden kann, ob es sich dabei um die Verteilung von wie vielen Vektoren mit wie vielen Spitzen handelt; oder die paarweisen Korrelationen zwischen Neuronen; oder Kombinationen davon. Diese sind besonders nützlich, um herauszufinden, ob die Aktivität der Bevölkerung eine besondere Sauce enthält, oder ob es sich um etwas anderes handelt als die kollektive Aktivität einer Reihe unabhängiger oder langweilig einfacher Neuronen.

Drittens können wir die Position einnehmen, dass die neuronale Aktivität in X eine hochdimensionale Realisierung eines niedrigdimensionalen Raums ist, in dem die Anzahl der Dimensionen D << n ist. Typischerweise meinen wir damit: Einige Neuronen in X sind korreliert, sodass wir nicht das gesamte X verwenden müssen, um die Population zu verstehen. Stattdessen können wir sie durch eine viel einfachere Darstellung ersetzen. Wir könnten die Zeitreihen direkt gruppieren, um X in eine Menge von N kleineren Matrizen X_1 bis X_N zu zerlegen, von denen jede (relativ) starke Korrelationen aufweist, und so unabhängig behandelt werden können. Oder wir verwenden einen Ansatz zur Dimensionsreduktion wie die Hauptkomponentenanalyse, um eine kleine Reihe von Zeitreihen zu erhalten, die jeweils eine dominante Form der Variation der Aktivität der Population über die Zeit beschreiben.

Wir können mehr als das. Das oben Gesagte geht davon aus, dass wir die Dimensionsreduktion verwenden möchten, um Neuronen zu kollabieren - das heißt, wir wenden die Reduktion auf die Spalten von X an. Genauso einfach können wir die Zeit reduzieren, indem wir die Dimensionsreduktion auf die Zeilen von X anwenden. Anstatt zu fragen, ob neuronale Aktivität redundant ist Dies fragt, ob verschiedene Zeitpunkte ähnliche Muster neuronaler Aktivität aufweisen. Wenn es nur eine Handvoll davon gibt, ist die Dynamik der aufgezeichneten Neuronen eindeutig sehr einfach.

Auch hier können wir dynamische Systemansätze einbringen. Hier versuchen wir, einfache Modelle an die Änderungen in X über die Zeit anzupassen (dh von einer Zeile zur nächsten zu mappen) und diese Modelle zu verwenden, um die Arten von Dynamik zu quantifizieren, die X enthält - unter Verwendung von Begriffen wie „Attraktor“, „Separatrix“, „ Sattelknoten “,„ Mistgabel-Gabelung “und„ der Arsenal-Zusammenbruch “(nur einer davon ist keine wirkliche Sache). Man könnte plausibel argumentieren, dass die so angepassten dynamischen Modelle alle Dichtemodelle P (X) sind, da sie die Struktur der Daten beschreiben.

Zur Hölle, wir könnten sogar versuchen, ein komplettes dynamisches Modell eines neuronalen Schaltkreises, ein Bündel von Differentialgleichungen, die jedes Neuron beschreiben, an X anzupassen, so dass unser Modell P (X) jedes Mal dann abgetastet wird, wenn wir das Modell unter verschiedenen Anfangsbedingungen ausführen .

Mit diesen Dichtemodellen können wir sie getrennt an die neuronale Aktivität anpassen, die wir in einer Reihe verschiedener Zustände (S1, S2,…, Sm) aufgezeichnet haben, und Fragen beantworten wie: Wie ändert sich die Struktur einer Population von Neuronen zwischen Schlafen und aufwachen? Oder während der Entwicklung des Tieres? Oder während des Lernens einer Aufgabe (wobei S1 Versuch 1 und S2 Versuch 2 sein könnte; oder S1 Sitzung 1 und S2 Sitzung 2 ist oder viele Kombinationen davon). Wir können auch fragen: Wie viele Dimensionen umfasst die Neuronenaktivität? Unterscheiden sich die Abmessungen zwischen den verschiedenen Regionen der Kortikalis? Und hat jemand meine Schlüssel gesehen?

2 / Generative Modelle P (X | S): Was verursacht eine Spitze? Jetzt reden wir. Dinge wie linear-nichtlineare Modelle oder verallgemeinerte lineare Modelle. Typischerweise werden diese Modelle auf einzelne Neuronen in jeder Spalte von X angewendet. Mit ihnen passen wir ein Modell an, das den Zustand der Welt S als Eingabe verwendet und eine Reihe neuronaler Aktivitäten ausgibt, die der Aktivität des Neurons so genau wie möglich entspricht. Indem wir dann die Gewichtung überprüfen, die jedem Merkmal von S bei der Reproduktion der Aktivität des Neurons gegeben wurde, können wir herausfinden, worauf dieses Neuron einen Einfluss zu haben scheint.

Wir möchten vielleicht ein Modell wählen, das eine gewisse Flexibilität in Bezug auf den „Zustand der Welt“ aufweist. Wir können die Aktivität des Neurons in der Vergangenheit als Feature einbeziehen und sehen, ob es wichtig ist, was es in der Vergangenheit getan hat. Für einige Arten von Neuronen lautet die Antwort ja. Das Platzen kann einem Neuron eine Menge abverlangen und es muss sich für eine kleine Pause hinlegen, bevor es wieder gehen kann. Wir können auch breiter denken und den Rest der Bevölkerung - den Rest von X - als Teil des Zustands der Welt betrachten, während das Neuron feuert. Immerhin beeinflussen die Neuronen gelegentlich das Feuern des anderen, oder ich glaube es. Es besteht also eine geringe Wahrscheinlichkeit, dass die Reaktion eines Neurons im visuellen Kortex nicht nur durch die Ausrichtung einer Kante in der Außenwelt bestimmt wird, sondern auch davon abhängt, was die 10000 kortikalen Neuronen, die sich mit ihm verbinden, ebenfalls tun. Was wir dann lernen, sind die ungefähr einflussreichsten Neuronen in der Bevölkerung.

Wir müssen diese generativen Modelle nicht auf einzelne Neuronen anwenden. Wir können sie gleichermaßen auf unsere Dichtemodelle anwenden; wir können fragen, was jeder Cluster oder jede Dimension für die Welt codiert. Oder, wie manche Leute hier, können wir das Dichtemodell selbst als den Zustand der Welt verwenden und uns fragen, welche Merkmale dieses Modells stromabwärts gelegene Neuronen verdammt noch mal ausmachen.

Die Arten von Fragen, die wir mit diesen generativen Modellen beantworten können, liegen auf der Hand: Welche Merkmalskombination sagt die Antwort eines Neurons am besten voraus? Gibt es Neuronen, die nur für eine Sache selektiv sind? Wie beeinflussen sich Neuronen gegenseitig?

3 / Unterscheidungsmodelle P (S | X): Welche Informationen enthalten Spikes? Dies ist eine Kernfrage der Systemneurowissenschaften, da sie die Herausforderung für alle Neuronen darstellt, die sich stromabwärts von unserer aufgezeichneten Population befinden - alle Neuronen, die Eingaben von den Neuronen erhalten, die wir von unserer Matrix X aufgezeichnet und in diese gestopft haben. Für diese stromabwärts gelegenen Neuronen müssen wir ableiten, was Sie müssen über die Außenwelt Bescheid wissen, die ausschließlich auf Spikes basiert.

Hier können wir Standardklassifizierer verwenden, die Eingaben auf beschriftete Ausgaben abbilden. Wir können die Zeilen von X als Eingabe verwenden, wobei jede eine Momentaufnahme der Aktivität der Population ist, und versuchen, eines, einige oder alle der Features in den entsprechenden Zeilen von S vorherzusagen. Möglicherweise mit einer gewissen Zeitverzögerung, also verwenden wir die Zeile X_t bis prognostizieren Sie den Zustand S_t-n, der in der Vergangenheit n Schritte betrug, wenn wir daran interessiert sind, wie Populationen Zustände codieren, die in das Gehirn eingegeben werden; oder wir können Zeile X_t verwenden, um den Zustand S_t + n vorherzusagen, der in n Schritten in der Zukunft liegt, wenn wir daran interessiert sind, wie Populationen eine Wirkung des Gehirns auf die Welt codieren. Wie die Aktivität im motorischen Kortex, die gerade stattfindet, bevor ich jeden Buchstaben eintippe.

In beiden Fällen nehmen wir einige (aber nicht alle, da wir keine Überanpassung vornehmen) Zeilen von X und trainieren den Klassifizierer, um die bestmögliche Zuordnung von X zu dem entsprechenden Block von S zu finden. Dann testen wir den Klassifizierer, wie gut er kann prognostizieren Sie den Rest von S aus dem entsprechenden Rest von X. Wenn Sie außerordentlich viel Glück haben, könnten Ihr X und S so lang sein, dass Sie sie in Gruppen unterteilen, testen und validieren können. Bewahren Sie die letzte in einer verschlossenen Box auf.

Wir könnten natürlich einen so mächtigen Klassifikator verwenden, wie wir möchten. Von der logistischen Regression über Bayes'sche Ansätze bis hin zur Verwendung eines neuronalen Netzwerks mit 23 Schichten. Es kommt vielmehr darauf an, was Sie von der Antwort erwarten und welchen Kompromiss Sie zwischen Interpretierbarkeit und Leistung eingehen. Meine Schriften an anderer Stelle haben deutlich gemacht, welche Seite dieses Kompromisses ich favorisiere. Aber ich bin froh, dass ich mich geirrt habe.

Kodierungsmodelle von Neuronen sind aufschlussreich, berühren jedoch einige alte und tiefe philosophische Probleme. Das Testen der Codierung unter Verwendung eines Unterscheidungsmodells setzt voraus, dass etwas stromabwärts versucht, S aus neuronaler Aktivität zu decodieren. Damit sind zwei Probleme verbunden. Neuronen dekodieren nicht; Neuronen nehmen Spitzen als Eingabe auf und geben ihre eigenen Spitzen aus. Vielmehr werden sie von einem Satz Spikes in einen anderen Satz Spikes umcodiert: vielleicht weniger oder langsamer; vielleicht mehr oder schneller; vielleicht von einem stetigen Strom in eine Schwingung. Daher fragen diskriminative Modelle genauer, welche Informationen unsere Neuronen neu codieren. Aber selbst wenn wir diese Ansicht vertreten, gibt es ein tieferes Problem.

Mit sehr wenigen Ausnahmen gibt es kein „nachgeschaltetes“ Neuron. Die Neuronen, die wir in X aufgezeichnet haben, sind Teil des komplex verdrahteten Gehirns, das voller endloser Schleifen ist. ihre Ausgabe beeinflusst ihre eigene Eingabe. Schlimmer noch, einige der Neuronen in X sind den anderen nachgeordnet: einige von ihnen werden direkt in die anderen eingegeben. Denn wie oben erwähnt, beeinflussen sich die Neuronen gegenseitig.

Ein grobes, vielleicht nützliches Manifest für eine neuronale Datenwissenschaft. Es ist unvollständig; Ohne Zweifel stimmt etwas oben nicht (Antworten auf eine Postkarte an die übliche Adresse). Das Obige ist ein Versuch, die Arbeit einer Gruppe von Labors mit sehr unterschiedlichen Interessen zusammenzufassen, aber ein gemeinsames Bestreben, solche Modelle auf große Mengen neuronaler Daten anzuwenden, um tiefgreifende Fragen zur Funktionsweise des Gehirns zu beantworten. Viele davon sind Datenlabors, Teams, die experimentelle Daten analysieren, um ihre eigenen Fragen zu beantworten. um nur einige zu nennen - Johnathan Pillow; Christian Machens; Konrad Kording; Kanaka Rajan; John Cunningham; Adrienne Fairhall; Philip Berens; Cian O’Donnell; Il Memming Park; Jakob Macke; Gasper Tkacik; Oliver Marre. Ähm, ich. Andere sind experimentelle Labors mit starken datentechnischen Neigungen: Anne Churchland; Mark Churchland; Nicole Rust; Krishna Shenoy; Carlos Brody; viele andere entschuldige ich mich dafür, dass ich nicht namentlich genannt habe.

Es gibt Konferenzen, auf denen diese Art von Arbeit begrüßt, ja sogar gefördert wird. Eine Zeitschrift für Neuronale Datenwissenschaften ist auf dem Weg. Etwas baut. Komm rein, die Daten sind wunderschön *.

* Ja, ich musste mich auf Daten als Singular beziehen, um diesen Mistwitz zum Laufen zu bringen. Die Tatsache, dass ich diese Fußnote schreibe, um dies zu erläutern, gibt Ihnen einen Eindruck von der gewissenhaften Liebe zum Detail, die Wissenschaftler von neuronalen Daten erwarten.

Mehr wollen? Folgen Sie uns bei The Spike

Twitter: @markdhumphries