Modul 1:
Der Data Scientist – Berufsbild mit Zukunft
Der Data Scientist – Profilanalyse, Anforderungen, Anwendungsfelder
- Big Data und Data Science
- Vom Datenanalyst zum Datenmanager – Profil und Anforderungen an den Data Scientist
- Anwendungsgebiete für Data Science im Unternehmen
- Von der explorativen bis zur präskriptiven Datenanalyse
- Vorstellung des Querschnittsthemas – Data Science und der Datenschutz
Data Science im Unternehmen – Das Potential datengetriebener Geschäftsmodelle
- Datengetriebene Geschäftsprozesse und Anwendungsfelder für Data Science
- Datengetriebenes Management – Mithilfe von Data Science die richtigen Entscheidungen treffen
- Unternehmensanalyse – Wie lassen sich Sweet Spots im eigenen Unternehmen finden?
- »Data-Driven Companies« – Best Practice Beispiele
Chancen und Risiken von Data Science – Ausblick und Exkurs
- Zwischen Back-Office und Management – Welche Verantwortung wird der Data Scientist zukünftig haben?
- Karrierechancen im Unternehmen
- Branchen- und Marktanalyse
- Praxisbeispiel: Data Science und Internet of Things (IoT)
Modul 2:
Datenhaltung & Data Governance
Analyse von Datenstrukturen
- Datenstrukturen: von strukturiert bis unstrukturiert (Datenbanktabellen, JSON, Blogs) – Analysemöglichkeiten
- Verfügbarkeit von Daten – Welche Daten existieren? Wer darf wann und wo darauf zugreifen?
- Von der Unternehmensdatenbank zu Open Data – Big Data Analytics Geschäftsmodelle und industriespezifische Anwendungsfälle
- Die 4 Vs von Big Data: Ab welchen Kriterien werden Big Data IT-Technologien benötigt?
Anwendungsoptionen für Datenhaltung
- Datenbankmanagementsysteme – klassisch und Big Data: RDBMS, JSON, noSQL, CAP Theorem
- Hadoop – Ein Zoo voller Werkzeuge (Apache Hadoop, Projekte, Treiber, Einsatz)
- Data Lake – Definition, Konzepte, Kundenbeispiele
- Überblick von Referenzarchitekturen von Technologieanbietern
- Cloud Computing und Anbieter – Mit welcher Cloud-Umgebung lassen Data Science Projekte sinnvoll starten?
- Iaas/Paas/Saas, Private/Hybrid/Public, Verbreitung in Deutschland, Anbieter
Data Security & Risk Management – Die Rolle des Data Scientists im Umfeld der Datensicherheit
- Datenschutz: Definitionen & Gesetze, Beispiele Datenschutzvorfälle, Sicht Bürger & Politik, Überwachung und Verschlüsselung
- Datensicherheit: Bedrohungsarten, Risikominimierung, Betrug & Cyber-Kriminalität
- Praxisübung: Connected Car – Datenhaltung, Governance und Analysen
Modul 3:
Datenakquisition & Datenintegration im Unternehmen
Datenakquise und Erstellung von Datenarchitekturen
- Unstrukturierte Daten analysieren und aufbereiten
- Das WWW als Datenlieferant – Ein Überblick über die technischen Hürden
- Überblick Datenschnittstellen
Datenintegration: Management und Weiterentwicklung des Datenbestands im Unternehmen
- Praktische Anwendung von Datenbankmanagementsystemen
- Data Warehouse Anbieter, Architektur und Trends
- Einführung in ETL-Prozesse (Extract – Transform – Load) und ETL-Tools
- Data Modeling mit ETL-Tools
- Praxisbeispiele: Best Practice der Datentransformation
Datenanalyse, -exploration und komplexe Datenabfragen
- Was ist möglich? Methoden zur Erkennung komplexer Zusammenhänge und Korrelation von Daten
- Technische Voraussetzungen
- Anwendungsbeispiele Click-Stream Analyse
- Anwendungsbeispiele Information Mining: Extrahieren von Informationen aus Rohdaten