Dieses Buch beschreibt die wichtigen Ideen in einer Vielzahl von Bereichen wie Medizin, Biologie, Finanzen und Marketing in einem gemeinsamen konzeptionellen Rahmen.. Obwohl der Ansatz statistisch ist, liegt der Schwerpunkt auf Konzepten und nicht auf Mathematik.. Viele Beispiele werden gegeben, mit einem großzügigen Einsatz von Farbgrafiken.. Es eine wertvolle Ressource für Statistiker und alle, die sich für Data Mining in Wissenschaft oder Industrie interessieren.. Die Abdeckung des Buches ist breit, von überwachtem Lernen (Vorhersage) zum unüberwachten Lernen. Die vielen Themen umfassen neuronale Netze, Support-Vektor-Maschinen, Klassifikationsbäume und Boosting---die erste umfassende Behandlung dieses Themas in einem Buch.
Diese umfassende neue Ausgabe behandelt viele Themen, die in der Originalausgabe nicht behandelt wurden, darunter grafische Modelle, Random Forests, Ensemble-Methoden, Least Angle Regression & Pfadalgorithmen für den Lasso, nicht-negative Matrixfaktorisierung und spektrales Clustering.. Es gibt auch ein Kapitel über Methoden für „breite“ Daten (p größer als n), einschließlich Mehrfachtestung und False Discovery Rates.
Über den Autor
Trevor Hastie, Robert Tibshirani und Jerome Friedman sind Statistikprofessoren an der Stanford University.. Sie sind herausragende Forscher in diesem Bereich.: Hastie und Tibshirani entwickelten verallgemeinerte additive Modelle und schrieben ein beliebtes Buch mit diesem Titel.. Hastie entwickelte einen Großteil der statistischen Modellierungssoftware und -umgebung in R/S-PLUS mit und erfand Hauptkurven und -flächen.. Tibshirani schlug das Lasso vor und ist Mitautor des sehr erfolgreichen An Introduction to the Bootstrap.