Eine neuronale Datenwissenschaft: wie und warum

Die grobe Anleitung zur Datenwissenschaft an Neuronen

Ein Gehirn, das Datenwissenschaft betreibt. Bildnachweis: Brain von Matt Wasser vom Noun Project

Leise und heimlich nimmt eine neue Art von Neurowissenschaftler Gestalt an. Aus den unzähligen Reihen der Theoretiker sind Teams von Neurowissenschaftlern hervorgegangen, die Wissenschaft mit Daten zur neuronalen Aktivität und zu den spärlichen Splittern von Hunderten von Neuronen betreiben. Nicht die Erstellung von Methoden zur Datenanalyse, obwohl dies auch alle tun. Nicht das Sammeln dieser Daten, denn das erfordert eine andere, beeindruckende Fähigkeit. Aber Neurowissenschaftler nutzen die gesamte Bandbreite moderner Computertechniken für diese Daten, um wissenschaftliche Fragen zum Gehirn zu beantworten. Eine neuronale Datenwissenschaft ist entstanden.

Es stellt sich heraus, dass ich einer von ihnen bin, dieser Clan neuronaler Datenwissenschaftler. Versehentlich. Soweit ich das beurteilen kann, werden so alle wissenschaftlichen Bereiche geboren: aus Versehen. Forscher folgen ihren Nasen, beginnen neue Dinge zu tun und stellen plötzlich fest, dass auf Partys eine kleine Menge von ihnen in der Küche ist (weil dort die Getränke sind, im Kühlschrank - Wissenschaftler sind schlau). Hier ist ein kleines Manifest für die neuronale Datenwissenschaft: Warum sie auftaucht und wie wir uns daran machen könnten.

Das Warum ist dasselbe wie in allen Bereichen der Wissenschaft, die eine Datenwissenschaft ausgespuckt haben: Die Datenmenge gerät außer Kontrolle. Für die Wissenschaft der Aufzeichnung vieler Neuronen hat diese Datenflut eine Art wissenschaftliche Begründung. Das Gehirn arbeitet, indem es Nachrichten zwischen Neuronen weiterleitet. Die meisten dieser Nachrichten haben die Form winziger Elektrizitätsimpulse: Spitzen nennen wir sie. Für viele scheint es logisch, dass wir, wenn wir verstehen wollen, wie Gehirne funktionieren (und wenn sie nicht funktionieren), alle Nachrichten erfassen müssen, die zwischen allen Neuronen übertragen werden. Und das bedeutet, so viele Spitzen von so vielen Neuronen wie möglich aufzuzeichnen.

Ein Baby-Zebrafisch-Gehirn hat ungefähr 130.000 Neuronen und mindestens 1 Million Verbindungen zwischen ihnen; Ein Hummelhirn hat ungefähr eine Million Neuronen. Sie können sehen, wie dies sehr schnell außer Kontrolle geraten würde. Momentan zeichnen wir mit dem Standard-Kit gleichzeitig zwischen zehn und einigen hundert Neuronen auf. An den Grenzen stehen Menschen, die einige Tausend und sogar einige Zehntausende aufzeichnen (obwohl diese Aufzeichnungen die Aktivität von Neuronen mit einer Geschwindigkeit erfassen, die viel langsamer ist, als die Neuronen ihre Spitzen senden könnten).

Wir nennen dieses Wahnsinnssystem Neurowissenschaften: Neurowissenschaften für das Studium von Neuronen; Systeme, um es zu wagen, von mehr als einem Neuron gleichzeitig aufzuzeichnen. Und die Daten sind unglaublich komplex. Was wir haben, sind Zehntausende gleichzeitig aufgezeichneter Zeitreihen, jeweils der Strom von Spitzenereignissen (tatsächliche Spitzen oder ein indirektes Maß davon) von einem Neuron. Per Definition sind sie nicht stationär, ihre Statistiken ändern sich im Laufe der Zeit. Ihre Aktivitätsraten erstreckten sich über viele Größenordnungen, von mönchhafter stiller Kontemplation bis hin zu „Schlagzeug in einem Windkanal“. Und ihre Aktivitätsmuster reichen von uhrähnlicher Regelmäßigkeit über Stottern und Stottern bis hin zum Wechsel zwischen Manie und Erschöpfung.

Heirate das jetzt mit dem Verhalten des Tieres, von dem du die Neuronen aufgenommen hast. Bei diesem Verhalten handelt es sich um Hunderte von Auswahlversuchen. oder Armbewegungen; oder Routen durch eine Umgebung genommen. Oder die Bewegung eines Sinnesorgans oder die gesamte Haltung der Muskulatur. Wiederholen Sie dies für mehrere Tiere. Möglicherweise mehrere Gehirnregionen. Und manchmal ganze Gehirne.

Wir haben keine Grundwahrheit. Es gibt keine richtige Antwort; Es gibt keine Trainingsetiketten für die Daten, außer für das Verhalten. Wir wissen nicht, wie Gehirne Verhalten codieren. Wir können also Dinge mit Verhaltensbezeichnungen tun, aber wir wissen fast immer, dass dies nicht die Antwort ist. Sie sind nur Hinweise auf die „Antwort“.

Die Systemneurowissenschaften sind dann ein reichhaltiger Spielplatz für diejenigen, die ihr Wissen über Neurowissenschaften mit ihrem Know-how für die Analyse von Daten verbinden können. Eine neuronale Datenwissenschaft wird geboren.

Wie wird es gemacht - oder könnte es gemacht werden? Hier ist eine grobe Anleitung. Das Ziel des Wissenschaftlers für neuronale Daten besteht darin, wissenschaftliche Fragen zu Daten aus den Systemneurowissenschaften zu stellen. zu fragen: Wie arbeiten all diese Neuronen zusammen, um ihr Ding zu machen?

Es gibt ungefähr drei Möglichkeiten, wie wir diese Frage beantworten können. Wir können diese drei Möglichkeiten erkennen, indem wir die Korrespondenz zwischen etablierten Problemklassen beim maschinellen Lernen und rechnerischen Herausforderungen in den Systemneurowissenschaften betrachten. Schauen wir uns zunächst an, womit wir arbeiten müssen.

Wir haben einige Daten von n Neuronen, die wir im Laufe der Zeit gesammelt haben. Wir werden diese in eine Matrix zusammenfassen, die wir X nennen - so viele Spalten wie Neuronen und so viele Zeilen wie Zeitpunkte, die wir aufgezeichnet haben (wo es an uns liegt, wie lange ein „Zeitpunkt“ dauert: wir könnten Machen Sie es kurz und lassen Sie einfach jeden Eintrag eine 1 für eine Spitze und andernfalls eine 0 aufzeichnen. Oder wir machen es lang und jeder Eintrag zeichnet die Anzahl der Spitzen während dieser verstrichenen Zeit auf. In dieser Zeit ist auf der Welt etwas passiert - einschließlich dessen, was der Körper getan hat. Lassen Sie uns all das in einer Matrix zusammenfassen, die wir S nennen - so viele Spalten, wie es Features auf der Welt gibt, die uns wichtig sind, und so viele Zeilen wie Zeitpunkte, die wir für diese Features aufgezeichnet haben.

Beim maschinellen Lernen werden traditionell drei Klassen von Modellen über den Zustand der Welt und die verfügbaren Daten erstellt: generativ, diskriminativ und Dichte. Als grobe Richtlinie zeigt diese Tabelle, wie jede Klasse einer grundlegenden Frage in den Systemneurowissenschaften entspricht:

1 / Dichtemodelle P (X): Gibt es eine Struktur in den Spitzen? Klingt langweilig. Tatsächlich ist dies jedoch der Schlüssel zu großen Teilen der neurowissenschaftlichen Forschung, in denen wir die Wirkung von etwas (einer Droge, einem Verhalten, einem Schlaf) auf das Gehirn wissen wollen. in dem wir fragen: Wie hat sich die Struktur der neuronalen Aktivität verändert?

Mit einer Aufzeichnung einer Reihe von Neuronen können wir dies auf drei Arten beantworten.

Erstens können wir den Spike-Zug jedes Neurons quantifizieren, indem wir die Statistik jeder X-Spalte wie die Spike-Rate messen. Und dann fragen Sie: Was ist das Modell P (X) für diese Statistiken? Wir können diese Statistiken gruppieren, um „Arten“ von Neuronen zu finden. oder passen Sie Modelle einfach an ihre gesamte gemeinsame Verteilung an. In beiden Fällen haben wir ein Modell der Datenstruktur für die Granularität einzelner Neuronen.

Zweitens können wir generative Modelle der Aktivität der gesamten Bevölkerung erstellen, indem wir die Zeilen von X verwenden - die Vektoren der Moment-zu-Moment-Aktivität der gesamten Bevölkerung. Solche Modelle zielen typischerweise darauf ab zu verstehen, wie viel von der Struktur von X aus nur wenigen Einschränkungen wiederhergestellt werden kann, ob es sich um die Verteilung der Anzahl von Vektoren mit wie vielen Spitzen handelt; oder die paarweisen Korrelationen zwischen Neuronen; oder Kombinationen davon. Diese sind besonders nützlich, um herauszufinden, ob die Aktivität der Bevölkerung eine spezielle Soße enthält, wenn es sich um mehr als die kollektive Aktivität einer Reihe unabhängiger oder langweilig einfacher Neuronen handelt.

Drittens können wir die Position einnehmen, dass die neuronale Aktivität in X eine hochdimensionale Realisierung eines niedrigdimensionalen Raums ist, wobei die Anzahl der Dimensionen D << n ist. In der Regel meinen wir damit: Einige Neuronen in X sind korreliert, sodass wir nicht das gesamte X verwenden müssen, um die Population zu verstehen. Stattdessen können wir sie durch eine viel einfachere Darstellung ersetzen. Wir könnten die Zeitreihen direkt gruppieren und so X in eine Menge von N kleineren Matrizen X_1 bis X_N zerlegen, von denen jede (relativ) starke Korrelationen enthält und daher unabhängig behandelt werden kann. Oder wir verwenden einen Ansatz zur Dimensionsreduktion wie die Hauptkomponentenanalyse, um eine kleine Reihe von Zeitreihen zu erhalten, die jeweils eine dominante Form der Variation der Aktivität der Bevölkerung im Zeitverlauf beschreiben.

Wir können mehr als das tun. Das Obige geht davon aus, dass wir die Dimensionsreduktion verwenden möchten, um Neuronen zu kollabieren - dass wir die Spalten von X reduzieren. Wir könnten aber genauso leicht die Zeit reduzieren, indem wir die Dimensionsreduktion auf die Zeilen von X anwenden. Anstatt zu fragen, ob die neuronale Aktivität redundant ist Dies fragt, ob verschiedene Momente ähnliche Muster neuronaler Aktivität aufweisen. Wenn es nur eine Handvoll davon gibt, ist die Dynamik der aufgezeichneten Neuronen eindeutig sehr einfach.

Auch hier können wir dynamische Systemansätze einbringen. Hier versuchen wir, einfache Modelle an die Änderungen in X im Laufe der Zeit anzupassen (dh von einer Zeile zur nächsten abzubilden) und diese Modelle zu verwenden, um die Arten von Dynamik zu quantifizieren, die X enthält - unter Verwendung von Begriffen wie "Attraktor", "Separatrix", " Sattelknoten “,„ Mistgabelgabelung “und„ Der Zusammenbruch des Arsenals “(nur einer davon ist keine echte Sache). Man könnte plausibel argumentieren, dass die so angepassten dynamischen Modelle alle Dichtemodelle P (X) sind, da sie die Struktur der Daten beschreiben.

Zur Hölle, wir könnten sogar versuchen, ein ganzes dynamisches Modell eines neuronalen Schaltkreises, eine Reihe von Differentialgleichungen, die jedes Neuron beschreiben, an X anzupassen, so dass unser Modell P (X) jedes Mal abgetastet wird, wenn wir das Modell unter verschiedenen Anfangsbedingungen ausführen .

Mit diesen Dichtemodellen können wir sie separat an die neuronale Aktivität anpassen, die wir in einer Reihe verschiedener Zustände (S1, S2,…, Sm) aufgezeichnet haben, und Fragen beantworten wie: Wie ändert sich die Struktur einer Population von Neuronen zwischen Schlaf und Schlaf? aufwachen? Oder während der Entwicklung des Tieres? Oder im Verlauf des Lernens einer Aufgabe (wobei S1 Versuch 1 und S2 Versuch 2 sein kann oder S1 Sitzung 1 und S2 Sitzung 2 ist oder viele Kombinationen davon). Wir können auch fragen: Wie viele Dimensionen umfasst die Neuronenaktivität? Unterscheiden sich die Dimensionen zwischen verschiedenen Regionen des Kortex? Und hat jemand meine Schlüssel gesehen?

2 / Generative Modelle P (X | S): Was verursacht eine Spitze? Jetzt reden wir. Dinge wie linear-nichtlineare Modelle oder verallgemeinerte lineare Modelle. Typischerweise werden diese Modelle auf einzelne Neuronen in jeder Spalte von X angewendet. Mit ihnen passen wir ein Modell an, das den Zustand der Welt S als Eingabe verwendet und eine neuronale Aktivitätsreihe ausspuckt, die der Aktivität des Neurons so genau wie möglich entspricht. Indem wir dann die Gewichtung untersuchen, die jedem Merkmal von S bei der Reproduktion der Aktivität des Neurons gegeben wurde, können wir herausfinden, worüber dieses Neuron anscheinend verdammt ist.

Wir möchten vielleicht ein Modell wählen, das eine gewisse Flexibilität in Bezug auf den „Zustand der Welt“ aufweist. Wir können die eigene Aktivität des Neurons in der Vergangenheit als Merkmal einbeziehen und prüfen, ob es sich um das kümmert, was es in der Vergangenheit getan hat. Für einige Arten von Neuronen lautet die Antwort ja. Das Platzen kann einem Neuron viel abnehmen, und es muss sich für eine kleine Pause hinlegen, bevor es wieder gehen kann. Wir können auch breiter denken und den Rest der Bevölkerung - den Rest von X - als Teil des Zustands der Welt S einbeziehen, während das Neuron feuert. Schließlich beeinflussen Neuronen gelegentlich das Feuern der anderen, oder so muss ich glauben. Es besteht also eine winzige Chance, dass die Reaktion eines Neurons im visuellen Kortex nicht nur von der Ausrichtung einer Kante in der Außenwelt abhängt, sondern auch davon abhängt, was die 10000 kortikalen Neuronen, die sich mit ihm verbinden, ebenfalls tun. Was wir dann lernen, sind die ungefähr einflussreichsten Neuronen in der Bevölkerung.

Wir müssen diese generativen Modelle nicht auf einzelne Neuronen anwenden. Wir können sie auch auf unsere Dichtemodelle anwenden. Wir können fragen, was jeder Cluster oder jede Dimension über die Welt codiert. Oder, wie einige Leute hier, können wir das Dichtemodell selbst als den Zustand der Welt verwenden und fragen, welche Merkmale dieses Modells stromabwärts von Neuronen eine Rolle spielen.

Die Arten von Fragen, die wir mit diesen generativen Modellen beantworten können, liegen auf der Hand: Welche Kombination von Merkmalen sagt die Antwort eines Neurons am besten voraus? Gibt es Neuronen, die nur für eine Sache selektiv sind? Wie beeinflussen sich Neuronen gegenseitig?

3 / Diskriminierende Modelle P (S | X): Welche Informationen tragen Spikes? Dies ist eine Kernfrage in den Systemneurowissenschaften, da dies die Herausforderung ist, der sich alle Neuronen gegenübersehen, die unserer aufgezeichneten Population nachgeschaltet sind - alle Neuronen, die Eingaben von den Neuronen erhalten, die wir aufgezeichnet und in unsere Matrix X gestopft haben. Für diese nachgeschalteten Neuronen muss daraus geschlossen werden, was Sie müssen über die Außenwelt Bescheid wissen, die ausschließlich auf Spitzen basiert.

Hier können wir Standardklassifikatoren verwenden, die Eingaben beschrifteten Ausgaben zuordnen. Wir können die Zeilen von X als Eingabe verwenden, jeweils eine Momentaufnahme der Aktivität der Bevölkerung, und versuchen, ein, einige oder alle Merkmale in den entsprechenden Zeilen von S vorherzusagen. Möglicherweise mit einer gewissen Zeitverzögerung, also verwenden wir Zeile X_t bis Vorhersage des Zustands S_t-n, der in der Vergangenheit n Schritte war, wenn wir daran interessiert sind, wie Populationen Zustände codieren, die in das Gehirn eingegeben werden; oder wir können Zeile X_t verwenden, um den Zustand S_t + n vorherzusagen, der n Schritte in der Zukunft ist, wenn wir daran interessiert sind, wie Populationen für eine Wirkung des Gehirns auf die Welt kodieren. Wie die Aktivität im motorischen Kortex, die stattfindet, bevor ich gerade jeden Buchstaben eingebe.

In beiden Fällen nehmen wir einige (aber nicht alle, da wir nicht überpassen) Zeilen von X und trainieren den Klassifizierer, um die bestmögliche Zuordnung von X zu dem entsprechenden Block von S zu finden. Dann testen wir den Klassifizierer, wie gut er kann Sagen Sie den Rest von S aus dem entsprechenden Rest von X voraus. Wenn Sie außerordentlich viel Glück haben, können Ihr X und S so lang sein, dass Sie sie in Zug-, Test- und Validierungssätze unterteilen können. Bewahren Sie den letzten in einer verschlossenen Box auf.

Wir könnten natürlich einen so mächtigen Klassifikator verwenden, wie wir möchten. Von der logistischen Regression über Bayes'sche Ansätze bis hin zur Verwendung eines 23-lagigen neuronalen Netzwerks. Es hängt vielmehr davon ab, was Sie von der Antwort erwarten und welchen Kompromiss zwischen Interpretierbarkeit und Leistung Sie kennen. Meine Schriften an anderer Stelle haben deutlich gemacht, welche Seite dieses Kompromisses ich favorisiere. Aber ich bin froh, dass ich mich geirrt habe.

Kodierungsmodelle von Neuronen sind aufschlussreich, berühren jedoch einige alte und tiefe philosophische Probleme. Das Testen der Codierung unter Verwendung eines Unterscheidungsmodells setzt voraus, dass etwas stromabwärts versucht, S von der neuronalen Aktivität zu decodieren. Hierbei gibt es zwei Probleme. Neuronen dekodieren nicht; Neuronen nehmen Spitzen als Eingabe auf und geben ihre eigenen Spitzen aus. Vielmehr codieren sie von einem Satz von Spitzen in einen anderen Satz von Spitzen um: vielleicht weniger oder langsamer; vielleicht mehr oder schneller; vielleicht von einem stetigen Strom in eine Schwingung. Diskriminierende Modelle fragen also genauer, welche Informationen unsere Neuronen neu codieren. Aber selbst wenn wir diese Ansicht vertreten, gibt es ein tieferes Problem.

Mit sehr wenigen Ausnahmen gibt es kein "Downstream" -Neuron. Die Neuronen, die wir in X aufgezeichnet haben, sind Teil des kompliziert verdrahteten Gehirns voller Endlosschleifen. Ihre Ausgabe wirkt sich auf ihre eigene Eingabe aus. Schlimmer noch, einige der Neuronen in X sind den anderen nachgeschaltet: Einige von ihnen geben direkt in die anderen ein. Denn wie oben erwähnt, beeinflussen sich Neuronen gegenseitig.

Ein grobes, vielleicht nützliches Manifest für eine neuronale Datenwissenschaft. Es ist unvollständig; zweifellos stimmt etwas oben nicht (Antworten auf einer Postkarte an die übliche Adresse). Das Obige ist ein Versuch, die Arbeit einer Gruppe von Labors mit sehr unterschiedlichen Interessen zusammenzufassen, aber ein gemeinsames Bestreben, diese Art von Modell für große Mengen neuronaler Daten zu verwenden, um tiefe Fragen zur Funktionsweise des Gehirns zu beantworten. Viele davon sind Datenlabors, Teams, die experimentelle Daten analysieren, um ihre eigenen Fragen zu beantworten. um nur einige zu nennen - Johnathan Pillow; Christian Machens; Konrad Kording; Kanaka Rajan; John Cunningham; Adrienne Fairhall; Philip Berens; Cian O'Donnell; Il Memming Park; Jakob Macke; Gasper Tkacik; Oliver Marre. Ähm, ich. Andere sind experimentelle Labore mit starken datenwissenschaftlichen Neigungen: Anne Churchland; Mark Churchland; Nicole Rust; Krishna Shenoy; Carlos Brody; Viele andere entschuldige ich dafür, dass ich sie nicht benannt habe.

Es gibt Konferenzen, auf denen diese Art von Arbeit begrüßt oder sogar gefördert wird. Eine Zeitschrift für neuronale Datenwissenschaft ist auf dem Weg. Es baut sich etwas auf. Komm rein, die Daten sind reizend *.

* Ja, ich musste Daten als Singular bezeichnen, um diesen Mist zum Laufen zu bringen. Die Tatsache, dass ich diese Fußnote schreibe, um dies zu erklären, gibt Ihnen einen Eindruck von der anspruchsvollen Liebe zum Detail, die Wissenschaftler für neuronale Daten erwarten.

Mehr wollen? Folgen Sie uns bei The Spike

Twitter: @markdhumphries