Data Science Methodology

"Alle Modelle sind falsch, aber einige sind nützlich" - George Box, Statistiker "

Data Science heißt nicht umsonst Wissenschaft. Jede Wissenschaft folgt einer wissenschaftlichen Methode, die notwendig ist, um aus einer Theorie ein Ergebnis zu erhalten.

In diesem Artikel konzentrieren wir uns nicht auf Codierungs- oder Analysemethoden, sondern analysieren die richtige Methodik, um wertvolle Erkenntnisse zu gewinnen und den Prozess des Denkens und Visualisierens von Daten in beliebiger Größe.

Diese Methode ist in 10 Schritte unterteilt, mit deren Hilfe Sie Ihren Denkprozess vom Geschäftsverständnis über die Bereitstellung bis hin zum Feedback besser organisieren und visualisieren können.

Hier können wir die gesamte Methodik visualisieren:

Nun schauen wir uns jeden einzelnen an:

Geschäftsverständnis

Jedes Datenprojekt muss mit Business Understanding beginnen. Dieser Schritt ist erforderlich, damit die Datenanalyse für den Dateneigner wirklich relevant und wertschöpfend wird.

In diesem Schritt müssen wir die folgende Frage beantworten:

  • Welches Problem möchten Sie lösen?

Analytischer Ansatz

Hier werden wir das Problem im Kontext statistischer und maschineller Lerntechniken ausdrücken.

Die Frage, die beantwortet werden muss, ist:

  • Wie können wir Daten verwenden, um dieses Problem zu lösen?

Datenanforderungen

Jetzt müssen wir verstehen, welche Daten wir benötigen, um dieses Problem zu lösen. Es ist auch wichtig zu verstehen, wie die Daten eingestellt werden müssen (Format, Inhalt, Darstellung).

  • Welche Daten benötigen Sie, um die Frage zu beantworten?
  • Datensammlung

    Wir müssen verstehen, wo wir diese Daten bekommen, und wenn es nicht vorhanden ist, wie können wir beginnen, die Daten zu sammeln.

  • Woher kommen die Daten (alle Quellen angeben) und wie erhalten Sie sie?
  • Datenverständnis

    Das Verständnis, wie die Daten mit dem Problem zusammenhängen, ist für die Generierung von Erkenntnissen von entscheidender Bedeutung. Nehmen Sie sich Zeit, um zu analysieren, wie der Datensatz funktioniert und warum er auf diese Weise angezeigt wird.

  • Sind die erhobenen Daten repräsentativ für das festgestellte Problem?
  • Datenaufbereitung

    Sind alle Felder im Datensatz bereit, analysiert zu werden? Dieser Schritt ist wichtig, damit wir bei der Datenanalyse mit dem rechten Fuß beginnen können.

  • Welche zusätzliche Arbeit ist erforderlich, um die Daten zu manipulieren und mit ihnen zu arbeiten?
  • Modellieren

    Jetzt können wir anfangen, Modelle zu analysieren und zu erstellen, um die Fragen zu beantworten und die Geschäftserkenntnisse zu generieren.

    Die Frage, die beantwortet werden muss, ist:

    • Auf welche Weise können die Daten visualisiert werden, um die Antwort zu erhalten?

    Auswertung

    Das Testen des erstellten Modells ist genauso wichtig wie das Erstellen des Modells. Die Datenanalyse ist ein iterativer Zyklus. Wenn sich also herausstellt, dass das Modell nicht für die Lösung geeignet ist, müssen wir einige Schritte zurückgehen.

  • Beantwortet das Modell die ursprüngliche Frage wirklich oder muss es angepasst werden?
  • Einsatz

    Nachdem die Lösung erfolgreich evaluiert wurde, ist es Zeit, sie den Stakeholdern zu zeigen.

  • Sind die Stakeholder mit der Lösung einverstanden?
  • Feedback

    Wie bereits erläutert, sind Datenanalyse und Insights-Generierung iterative Prozesse. Daher sind regelmäßige Rückmeldungen erforderlich, um die Qualität der Insights zu gewährleisten.

  • Funktioniert die Lösung?
  • Fazit

    Zu wissen, warum Sie das tun, was Sie tun, ist genauso wichtig wie das, was Sie selbst tun. In der Datenwissenschaft angewandte wissenschaftliche Methoden haben das Potenzial, bessere Erkenntnisse zu generieren, die zufällig Datensätze durchsuchen, ohne das eigentliche Ziel des Geschäfts zu kennen.

    Das Verständnis aller Aspekte von Daten ist ein Muss für einen Datenwissenschaftler, der in Unternehmen große Auswirkungen haben möchte. Die hier vorgestellte Methodik beschreibt, wie man analytisches Denken mit dem richtigen Fuß beginnt.