Karriere

Wie man sich im Bereich Data Science weiterbilden kann?

img
@ geralt (CC0-Lizenz)/ pixabay.com

Data Science ist eine Wissenschaft, die für immer mehr Anwendungen im Zentrum steht. Es geht darum, Daten zu erfassen, zu verarbeiten und dann Schlussfolgerungen aus diesen Daten zu ziehen.

Die Aufgaben in diesem Bereich werden einfach deshalb immer umfangreicher, weil immer mehr Daten anfallen. Diese sind nur nützlich, wenn sie auch verarbeitet werden können. Daraus ergibt sich die Frage, wie man sich zum Data Scientist weiterbildet. Eine reine Online-Weiterbildung in Data Science ist eine Möglichkeit dafür.

Woher kommt Data Science?

Der Begriff ist noch relativ neu und wurde erst vor einigen Jahrzehnten geprägt. Die Tätigkeit eines heutigen Data Scientist führt aber Überlegungen weiter, die in die Frühzeit der Wissenschaften an sich zurückreichen.

Gegen Ende des 16. Jahrhunderts führte der dänische Astronom Tycho Brahe für die damalige Zeit sehr genaue und umfangreiche Messungen der Planetenbewegungen durch. Johannes Kepler nahm diese Messdaten als Grundlage und destillierte aus ihnen seine bis heute bekannten Keplerschen Gesetze. Kepler kann damit in Anspruch nehmen, schon im 17. Jahrhundert eine frühe Form von Data Science praktiziert zu haben. Dasselbe gilt für die Naturwissenschaftler, die ihre Theorien aufgrund von Messungen formulierten und nicht auf der Basis der Ansichten von Autoritäten.

Was ist Data Science heute?

Die Weiterentwicklung und die sich daraus ergebenden Unterschiede zeigen sich in verschiedenen Aspekten.

Heute fallen wesentlich mehr Daten zur Verarbeitung an. Es gibt Sensoren, die Messungen automatisch durchführen. Die Ergebnisse welcher Datenerhebung auch immer lassen sich in großem Umfang speichern und übertragen. Damit werden die Datenmengen zur Verarbeitung unvergleichlich umfangreicher als zu Zeiten der ausschließlichen Verwendung von Papier und Bleistift.

Die umfangreicheren Daten führen aber keineswegs zur Verzweiflung der Data Scientists, die in diesen Daten zu versinken drohten. Heute ist die Verarbeitung der Daten automatisiert. Computer waren ursprünglich Personen, die Rechnungen durchführten. Moderne Data Scientists verfügen über enorme Rechenleistung, die von Maschinen bereitgestellt wird. Die Aufgabe des Data Scientist besteht daraus, sich diese Rechenleistung zu Nutze zu machen.

Was für Fähigkeiten sind für die Erschließung dieser Rechenleistung notwendig?

Klassisches Programmieren ist erforderlich, um Rechenprozesse vom Computer ausführen zu lassen. Der Data Scientist muss Datenbanken handhaben können, denn in diesen wird ein Großteil der Daten bereitgehalten.

Heute am interessantesten sind die Bereiche der künstlichen Intelligenz. Der Computer wird so programmiert, dass er Aufgaben selbständig wahrnehmen kann, die mit Intelligenz in Verbindung gebracht werden. Diese Methoden erlauben dem Computer, selbständig Informationen aufzunehmen und als Grundlage für Entscheidungen zu verwenden. Eine Möglichkeit zur Realisierung einer solchen Datenverarbeitung ist ein simuliertes neuronales Netz. Es bildet den Aufbau des menschlichen Gehirns nach.

Heute stehen bereits solche Systeme zur Verfügung, die nichttriviale Anwendungen wie die Diagnose von Hautkrankheiten oder die Interpretation von Röntgenaufnahmen bewältigen können. In diesem Fachgebiet wird intensiv geforscht, was einen ständigen Fluss von neuen Resultaten zur Folge hat. Sowohl in der Forschung als auch in der Anwendung der Ergebnisse gibt es also für einen Data Scientist sehr viel zu tun.

Diese Resultate und Methoden sind nicht wie früher in ihrer Anwendung auf die Auswertung von naturwissenschaftlichen Messreihen beschränkt, auch wenn das weiter ein wichtiger Bereich bleibt. Heute umfassen die Berufsfelder für einen Data Scientist auch die Wirtschaft, Verwaltung, Politik, das Gesundheitswesen und vieles mehr. Überall wo Daten anfallen, sind Data Scientists gefragt.

Fachgebiete für die Weiterbildung zum Data Scientist

Ganz allgemein geht es also um das systematische Erfassen, Auswerten von Daten und Bereitstellen von Entscheidungsgrundlagen.
Zu den erforderlichen Grundlagen dafür gehört ein gewisser Hintergrund in Mathematik und Statistik. Für das Verständnis von Unterlagen, aber auch zur Kommunikation der Ergebnisse werden brauchbare Englischkenntnisse erwartet.
Bereits in vielen anderen quantitativen Fachgebieten ist Programmieren etabliert.

Im engeren Sinn umfasst Data Science dann Bereiche wie künstliche Intelligenz, Data Mining, neuronale Netzwerke und ihr Training sowie zahlreiche Ansätze, die für verschiedene Anwendungen bereits erschlossen wurden. Gerade in diesen Bereichen ist die Ausbildung eines Data Scientist nie ganz abgeschlossen, weil die Entwicklung dieser Fachgebiete sehr schnell voranschreitet.

Allgemeine Voraussetzungen

Die quantitativen Methoden sind wichtig, aber letztlich sind sie ein Mittel zum Zweck. Als Data Scientist braucht man zuerst Interesse am Fach, die Bereitschaft zum ständigen Weiterlernen und geistige Beweglichkeit. Erfolg als Data Scientist setzt Ausdauer und die Fähigkeit zum kritischen und selbständigen Denken voraus. Die technischen Details ergeben sich aus dieser Einstellung, weil sie als Notwendigkeit erkannt und deshalb erworben werden.

Gerade aus diesem Grund ist eine reine Online-Weiterbildung in Data Science nicht nur geeignet, sondern in vielen Fällen einem Präsenzstudium sogar überlegen. Das erfolgreiche Absolvieren einer Online-Weiterbildung mit Selbstdisziplin und Unabhängigkeit im Denken bestätigt genau die Eigenschaften, die ein Data Scientist aufweisen sollte.

STARTSEITE