Statistische Methoden sind ein wesentlicher Bestandteil der Datenwissenschaft, doch nur wenige Datenwissenschaftler verfügen über eine formale statistische Ausbildung. Kurse und Bücher zu grundlegenden Statistiken behandeln das Thema selten aus der Perspektive der Datenwissenschaft.. Die zweite Auflage dieses beliebten Leitfadens ergänzt umfassende Beispiele in Python, bietet praktische Anleitungen zur Anwendung statistischer Methoden in der Data Science, zeigt Ihnen, wie Sie deren Missbrauch vermeiden, und gibt Ihnen Ratschläge, was wichtig ist und was nicht.
Viele Data-Science-Ressourcen verwenden statistische Methoden, es fehlt ihnen jedoch eine tiefere statistische Perspektive. Wenn Sie mit den Programmiersprachen R oder Python vertraut sind und einige statistische Vorkenntnisse haben, schließt diese Kurzübersicht die Lücke in einem zugänglichen, lesbaren Format.
Mit diesem Buch lernen Sie:
Warum die explorative Datenanalyse ein wichtiger vorbereitender Schritt in der Datenwissenschaft ist
Wie Zufallsstichproben Verzerrungen reduzieren und einen qualitativ hochwertigeren Datensatz liefern können, selbst bei großen Datenmengen
Wie die Prinzipien des experimentellen Designs definitive Antworten auf Fragen liefern
So nutzen Sie Regression, um Ergebnisse abzuschätzen und Anomalien zu erkennen
Wichtige Klassifizierungstechniken zur Vorhersage, zu welchen Kategorien ein Datensatz gehört
Statistische maschinelle Lernmethoden, die aus Daten „lernen“
Unüberwachte Lernmethoden zur Extraktion von Bedeutung aus unbeschrifteten Daten
Über den Autor
Peter Bruce ist der Gründer und Chief Academic Officer des Institute for Statistics Education bei Statistics.com, das etwa 80 Kurse in Statistik und Analytik anbietet, von denen etwa die Hälfte auf Data Scientists abzielt.. Er hat mehrere Bücher in Statistik und Analytik verfasst oder mitverfasst, und er erwarb seinen Bachelor-Abschluss in Princeton sowie Master-Abschlüsse in Harvard und an der University of Maryland.
^
Andrew Bruce, Principal Research Scientist bei Amazon, verfügt über mehr als 30 Jahre Erfahrung in Statistik und Data Science in Wissenschaft, Regierung und Wirtschaft.. Der Mitautor von Applied Wavelet Analysis with S-PLUS erwarb seinen Bachelor-Abschluss in Princeton und seinen Doktortitel in Statistik an der University of Washington.
^
Peter Gedeck, Senior Data Scientist bei Collaborative Drug Discovery, spezialisiert sich auf die Entwicklung von maschinellen Lernalgorithmen zur Vorhersage biologischer und physikochemischer Eigenschaften von Arzneimittelkandidaten.. Mitautor von Data Mining for Business Analytics, er erwarb Doktortitel in Chemie von der Universität Erlangen-Nürnberg in Deutschland und in Mathematik von der Fernuniversität Hagen, Deutschland.