Description du livre
Acquérir des connaissances sur les compétences essentielles en sciences des données d'une manière holistique à l'aide de l'ingénierie des données et des méthodes de calcul évolutives associées. Ce livre couvre les frameworks Python 3 les plus populaires pour le traitement local et distribué (en local et en nuage). En cours de route, vous serez initié à de nombreux frameworks open-source populaires, comme SciPy, scikitlearn, Numba, Apache Spark, etc. Le livre est structuré autour d'exemples, de sorte que vous comprendrez les concepts de base via des études de cas et du code Python 3.
Comme les projets de science des données deviennent de plus en plus grands et complexes, les connaissances et l'expérience en génie logiciel sont cruciales pour produire des solutions évolutives. Vous apprendrez comment créer des logiciels maintenables pour la science des données et comment documenter les pratiques d'ingénierie des données.
Ce livre est un bon point de départ pour les personnes qui veulent acquérir des compétences pratiques pour effectuer la science des données. Tout le code sera disponible sous forme de blocs-notes IPython et de programmes Python 3, qui vous permettront de reproduire toutes les analyses du livre et de les personnaliser pour votre propre usage. Vous bénéficierez également de sujets avancés tels que l'apprentissage machine, les systèmes de recommandation et la sécurité en science des données.
Practical Data Science avec Python vous permettra d'analyser les données, de formuler des questions appropriées et de produire des idées pratiques, trois étapes essentielles dans la plupart des projets de science des données.
Ce que vous apprendrez
Jouez le rôle d'un scientifique des données en effectuant des exercices de plus en plus difficiles avec Python 3.Travailler avec des techniques/technologies éprouvées dans le domaine des sciences des données.
Revoir les pratiques d'ingénierie logicielle évolutives afin d'accroître les capacités d'analyse de données dans le domaine des grandes données.
Appliquer la théorie des probabilités, l'inférence statistique et l'algèbre pour comprendre les pratiques de la science des données.
A qui s'adresse ce livre ?
Tous ceux qui souhaitent se lancer dans le domaine de la science des données à l'aide de Python 3.