Product details:
ISBN13: | 9783662679593 |
ISBN10: | 36626795911 |
Binding: | Paperback |
No. of pages: | 597 pages |
Size: | 240x168 mm |
Language: | German |
Illustrations: | 84 Illustrations, black & white; 40 Illustrations, color |
700 |
Category:
Mathematical Theory of computing
System analysis, system planning
Data management in computer systems
Computer programming in general
Database management softwares
Mathematical Theory of computing (charity campaign)
System analysis, system planning (charity campaign)
Data management in computer systems (charity campaign)
Computer programming in general (charity campaign)
Database management softwares (charity campaign)
Data Science Training - Supervised Learning
Ein praktischer Einstieg ins überwachte maschinelle Lernen
Edition number: 1. Aufl. 2024
Publisher: Springer Vieweg
Date of Publication: 7 January 2025
Number of Volumes: 1 pieces, Book
Normal price:
Publisher's listprice:
EUR 39.99
EUR 39.99
Your price:
13 637 (12 988 HUF + 5% VAT )
discount is: 20% (approx 3 409 HUF off)
Discount is valid until: 31 December 2024
The discount is only available for 'Alert of Favourite Topics' newsletter recipients.
Click here to subscribe.
Click here to subscribe.
Availability:
Not yet published.
Short description:
Dieses Lehrbuch erklärt auf narrative und direkte Weise die wichtigen Zusammenhänge zwischen Data Science, Künstlicher Intelligenz und anderen Disziplinen und Domänen wie Datenschutz und Ethik, mit Fokus auf überwachtes Lernen (Supervised Learning).Wir begleiten Anna und Karl während ihrer Traineephase in einer internationalen Versicherung. Schritt für Schritt reifen sie zu Data Scientists, indem sie sich intensiv mit der Titanic-Katastrophe auseinandersetzen. Anna kann Python programmieren, während Karl ein grafisches Werkzeug (KNIME Analytics Platform) benutzt. Bei ihren Untersuchungen stoßen sie auf interessante Fakten und Mythen. Mit Unterstützung von Max und Sophia verarbeiten sie historische Daten, um Vorhersagen zu erstellen (Predictive Analytics). Dabei benutzen sie Methoden und Algorithmen des maschinellen Lernens.Begleitende Zusatzmaterialien (KNIME Workflows, Jupyter Notebooks, Erklärvideos) stehen den Lernenden online zur Verfügung. Und wenn in diesem Buch Anna und Karl sich auf Themen des überwachten Lernens konzentrieren, werden wir künftig mit ihnen noch weitere Gebiete der Data Science entdecken.
Der Inhalt- Einführung, Datenschutz vs. Datensicherheit, Datenethik, Datenformate, Skalenniveaus, Datenqualität, Explorative Datenanalyse, CRISP-DM
- Klassifikation, k-Nearest Neighbor, Partitionierung & Sampling, Kreuzvalidierung, Feature Engineering, Overfitting, Gütemaße, Konfusionsmatrix, ROC, AURC
- Na?ve Bayes, Entscheidungsbäume, Pruning, Neuronale Netze, Multilayer Perzeptron, Support Vector Machine, Kernel-Trick, Logistische Regression, Regularisierung, Bias Variance Tradeoff, Ensemble Learning, Random Forest, Gradient Boosted Trees
- Regression vs. Korrelation, Methode der kleinsten Quadrate, Bestimmtheitsmaß, Fehlermaße, Lineare und polynomiale Regression, T-Test, Ridge, LASSO, Elastic-Net
- Mehrklassen-Klassifikation, Mikro- und Makro-Mittelwertbildung, Kreuzentropie, ungleiche Verteilungen, Equal Size Sampling, Bootstrapping, SMOTE
- Feature Selection, Genetische Algorithmen, Hyperparameteroptimierung
Der AutorStefan Selle ist seit 2007 Professor für Wirtschaftsinformatik an der Hochschule für Technik und Wirtschaft des Saarlandes und lehrt dort Daten- und Geschäftsprozessmanagement, Digitale Transformation, Software Engineering, Data Science und Künstliche Intelligenz.
- Einführung, Datenschutz vs. Datensicherheit, Datenethik, Datenformate, Skalenniveaus, Datenqualität, Explorative Datenanalyse, CRISP-DM
- Klassifikation, k-Nearest Neighbor, Partitionierung & Sampling, Kreuzvalidierung, Feature Engineering, Overfitting, Gütemaße, Konfusionsmatrix, ROC, AURC
- Na?ve Bayes, Entscheidungsbäume, Pruning, Neuronale Netze, Multilayer Perzeptron, Support Vector Machine, Kernel-Trick, Logistische Regression, Regularisierung, Bias Variance Tradeoff, Ensemble Learning, Random Forest, Gradient Boosted Trees
- Regression vs. Korrelation, Methode der kleinsten Quadrate, Bestimmtheitsmaß, Fehlermaße, Lineare und polynomiale Regression, T-Test, Ridge, LASSO, Elastic-Net
- Mehrklassen-Klassifikation, Mikro- und Makro-Mittelwertbildung, Kreuzentropie, ungleiche Verteilungen, Equal Size Sampling, Bootstrapping, SMOTE
- Feature Selection, Genetische Algorithmen, Hyperparameteroptimierung
Long description:
Dieses Lehrbuch erklärt auf narrative und direkte Weise die wichtigen Zusammenhänge zwischen Data Science, Künstlicher Intelligenz und anderen Disziplinen und Domänen wie Datenschutz und Ethik, mit Fokus auf überwachtes Lernen (Supervised Learning).
Wir begleiten Anna und Karl während ihrer Traineephase in einer internationalen Versicherung. Schritt für Schritt reifen sie zu Data Scientists, indem sie sich intensiv mit der Titanic-Katastrophe auseinandersetzen. Anna kann Python programmieren, während Karl ein grafisches Werkzeug (KNIME Analytics Platform) benutzt. Bei ihren Untersuchungen stoßen sie auf interessante Fakten und Mythen. Mit Unterstützung von Max und Sophia verarbeiten sie historische Daten, um Vorhersagen zu erstellen (Predictive Analytics). Dabei benutzen sie Methoden und Algorithmen des maschinellen Lernens.
Begleitende Zusatzmaterialien (KNIME Workflows, Jupyter Notebooks, Erklärvideos) stehen den Lernenden online zur Verfügung. Und wenn in diesemBuch Anna und Karl sich auf Themen des überwachten Lernens konzentrieren, werden wir künftig mit ihnen noch weitere Gebiete der Data Science entdecken.Table of Contents:
Einführung, Datenschutz vs. Datensicherheit, Informationsethik.- Datenanalyseprozess CRISP-DM, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment.- Datenqualität, Explorative Datenanalyse (EDA), Feature Engineering.- Naive Bayes und Entscheidungsbaum, Gütekriterien I, Overfitting, Kreuzvalidierung.- Bias vs. Varianz, Ensemble Learning (Random Forest, Gradient Boosted Trees).- Datentransformation und Normalisierung, Künstliche Neuronale Netzwerke.- Verteilungen und synthetische Daten, Hyperparameteroptimierung.- Regression vs. Korrelation, Interpolation vs. Extrapolation, Methode der kleinsten Quadrate.- Lineare und polynomiale (multiple) Regression, Gütekriterien II.- Regularisierung, LASSO, Ridge Regression, Elastic Net.- Logistische Regression, Regression vs. Klassifikation.- Ausblick.