20

无论你是一名数据科学家还是已经在这个行业工作了几十年,在工作或学习的同时做一些额外的阅读都是很理想的。我们收集了数据科学家应该读的五本书。

在我们列出书之前,先简单回顾一下:数据科学涉及对数据的分析,从产品开发到客户保留再到新的商业机会。

下面是数据科学家应该读的书。

《数据科学从零开始》,作者:Joel Grus

数据科学家应该读的书

这本书通过从零开始实现,涵盖了许多最基础的数据科学工具和算法。你需要一些编程技能和数学天赋来掌握数据科学核心的数学和统计学。

包括以下内容:

Python速成班

线性代数、统计和概率的基础知识——以及理解如何以及何时在数据科学中使用它们

数据的收集、探索和操作。

机器学习

这本书的新版本将于2019年6月出版。

Kole Nussbaumer Knaflic的《用数据讲故事:商业专业人士的数据可视化指南》

数据科学家应该读的书

对于数据科学行业的任何人来说,这都是一本至关重要的读物。这本书基本上是关于大量数据的组织和提取。这可以归结为如何去除不清晰和多余的数据,改进数据收集流程,以相关和实用的方式呈现数据,或数据可视化。它指导您应该如何处理收集到的有用数据以及如何处理这些数据。

书中涵盖的内容包括:

理解上下文和受众的重要性

确定适合您的情况的图表类型

识别并消除那些模糊的信息

将观众的注意力引向数据中最重要的部分

像设计师一样思考,利用数据可视化中的设计概念

利用讲故事的力量来帮助你的信息与你的听众产生共鸣

使用Scikit-Learn和TensorFlow的机器操作学习:概念、工具和技术,以建立智能系统的Aurelien Geron

数据科学家应该读的书

数据科学家使用机器学习——这是他们的基本技术之一。这是一种通过创建预测模型对数据进行深入分析的方法。这是一本很好的入门书,因为它假设你对机器学习几乎一无所知。这本书的目的是提供概念,直觉和工具,需要实现能够从数据学习的程序。这些技术涵盖了从最简单到最常用(例如线性回归)到一些深度学习技术的范围。该书使用实际的可生产的Python框架。

简单地说,Scikit学习是掌握机器学习的一个很好的入门点。TensorFlow更为复杂,它使用数据流图来训练和运行非常大的分布式神经网络。

《巨蟒》(Think Python),艾伦·唐尼(Allen Downey)著

数据科学家应该读的书

Python仍然是数据科学的主要语言。如果您开始使用Python,这是非常好的第一步。这个动手操作的指南将带您一步一步地学习这门重要的语言。您将从基本编程概念开始,最终学习函数、递归、数据结构和面向对象设计。每隔几章,这本书就把关键概念联系在一起,并包括相关的案例研究。它的目标是大学水平的学生,以及自学和需要学习编程基础的专业人士。

R代表数据科学:Hadley Wickham和Garrett Grolemund的数据导入、整理、转换、可视化和建模

数据科学家应该读的书

R是数据科学的另一种顶级编程语言。事实上,尽管R的初始基数较小,但它的增长速度与Python相似,Stack Overflow的一篇博客文章说。数据科学社区最近的一项民意调查发现,52.1%的程序员使用R, 52.6%的程序员使用Python。

这本书将向您介绍R、RStudio和the tidyverse,这是R包的集合,它们一起工作可以使数据科学快速而流畅。它适合没有编程经验的读者,谁想尽快获得R-fit。

你将学习以下内容:

将数据集转换为便于分析的形式

编程-学习强大的R工具,以更清晰和更容易地解决数据问题

探索-检查你的数据,生成假设,并快速测试它们

模型——提供一个低维度的总结,以捕获数据集中真实的“信号”

沟通-学习将文章、代码和结果整合在一起的减记技巧

相关文章
为您推荐
各种观点

报歉!评论已关闭.