La science des données n'est plus réservée aux "geeks" stéréotypés. Alors que le monde continue d'augmenter son activité en ligne, l'analyse des données est plus importante que jamais. Les données façonnent la façon dont nous gérons les entreprises, gérons les campagnes politiques et examinons les études scientifiques. Être capable d'examiner un ensemble de données et d'en extrapoler le sens est une compétence dont la demande augmente rapidement et que les livres de science des données peuvent vous aider.
En surface, cela peut sembler intimidant (surtout pour ceux d'entre nous qui n'ont pas eu à suivre un cours de mathématiques depuis le lycée). Mais, comme c'est le cas avec le codage, vous n'avez pas besoin d'exceller en mathématiques pour pouvoir travailler avec des données. C'est pourquoi cet article sur les livres de science des données a été divisé en deux parties: "Introduction aux compétences en science des données" vous donnera une base, tandis que "Science appliquée des données" vous donnera une image des nombreuses façons dont les données peuvent être appliquées et comment cela affecte le monde qui nous entoure.
Livres de science des données qui introduisent des compétences

Doing Data Science: Straight Talk from the Frontline par Cathy O'Neil et Rachel Schutt
Basé sur le cours d'introduction à la science des données de l'Université de Columbia, Doing Data Science est un excellent point de départ pour toute personne intéressée par le domaine. Data Scientists d'entreprises telles que Google etMicrosoft partage des algorithmes, des modèles et des études de cas qu'ils utilisent pour donner au lecteur une application plus pratique.
L'art de la science des données par Roger D. Peng et Elizabeth Matsui
Écrit par deux auteurs possédant une vaste expérience dans la gestion et la réalisation d'analyses de données, The Art of Data Science distille leurs connaissances sous une forme digeste. Ce livre s'en tient aux fondamentaux, ce qui le rend un peu basique pour les data scientists expérimentés, mais parfait pour les débutants.
La science des données pour les nuls par Lillian Pierson
Pour les lecteurs à la recherche d'une introduction couvrant l'étendue de la science des données, c'est le livre par lequel commencer. Plutôt que de couvrir des informations pédagogiques, Data Science for Dummies aborde les technologies, les langages de programmation et les méthodes mathématiques sur lesquels se concentrer.
Science des données appliquée
Le signal et le bruit: pourquoi tant de prédictions échouent, mais certaines échouent par Nate Silver
S'appuyant sur son expérience révolutionnaire dans la création d'un système de prédiction des performances de baseball, Nate Silver explore le monde de la prédiction et les façons dont nous pouvons extraire la vérité des données. Tout au long du livre, Silver examine les prévisionnistes de différents types - y compris la météo, le poker, le basket-ball et le marché boursier - pour évaluer leur façon de penser et de faire des prédictions. Il conclut finalement que les prévisionnistes les plus précis ont une maîtrise supérieure de la probabilité, et à la fin de ce livre, vous aurez la perspicacité nécessaire pour faire des prédictions plus solides et plus éclairées.

Statistiques nues parCharles Wheelan
Comment attraper les écoles qui trichent aux tests standardisés ? Comment Netflix sait-il quels films vous aimerez ? Dans Naked Statistics, Wheelan montre qu'avec les bonnes données et certains outils statistiques, nous pouvons avoir les réponses à ces questions et plus encore. Bien que certains d'entre nous voudront peut-être s'emballer à la mention des statistiques, Wheelan décompose les détails techniques et se concentre plutôt sur l'intuition humaine sous-jacente.
Automatiser ceci: comment les algorithmes sont venus gouverner notre monde par Christopher Steiner
De plus en plus, des tâches de haut niveau telles que l'interprétation juridique et l'analyse des politiques sont gérées par des algorithmes. Ce qui a commencé comme une logique informatique de base a maintenant dépassé notre idée de ce qu'un bot peut faire. Dans Automate This, Steiner raconte comment les algorithmes ont pris le dessus et commencent à toucher tous les aspects de nos vies. Il pose la question: à quoi ressemblerait le monde si les bots prenaient en charge le travail humain d'interprétation des données et d'automatisation de l'instinct humain ?
Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really by Seth Stephens-Davidowitz
Avec la quantité de données que le monde accumule quotidiennement, nous nous retrouvons souvent avec d'étonnantes données inexploitées à partir desquelles nous pouvons en apprendre davantage sur la psyché humaine. Ces données offrent un aperçu de nos plus grandes peurs et désirs, des décisions que nous prenons et des comportements qui nous animent. Everybody Lies examine les mégadonnées pour partager des informations sur l'économie, l'éthique, le sport, le sexe, le genre, etc. Les questions étudiées incluent: L'endroit où vous allez à l'école affecte-t-il votre réussite ?sont dans la vie ? Les parents favorisent-ils secrètement les enfants garçons par rapport aux filles ? Les films violents affectent-ils le taux de criminalité ?
Les armes de destruction des mathématiques: comment le Big Data augmente les inégalités et menace la démocratie par Cathy O'Neill
Vivant à l'ère des algorithmes, les décisions concernant nos vies sont de plus en plus prises par des modèles mathématiques plutôt que par des humains. L'espoir est que tout le monde soit jugé selon les mêmes règles sans parti pris, qu'il s'agisse du coût de l'assurance maladie ou de l'éligibilité à un prêt. Mais dans Weapons, O'Neill soutient que c'est le contraire qui est vrai. Elle met en lumière la manière dont les données et les algorithmes sont largement non réglementés et renforcent souvent la discrimination. Comme elle le dit, "bienvenue dans le côté obscur du big data".