图片
书籍:Statistics for Data Science and Analytics
作者:Peter C. Bruce, Peter Gedeck, Janet Dobbins
出版:Wiley
编辑:陈萍萍的公主@一点人工一点智能
书籍下载-《数据科学与分析统计学》

01 书籍介绍

本书是一本使用Python进行统计分析的综合指南,涵盖了数据科学中重要的主题,如预测、相关性和数据探索。作者不仅介绍了统计科学和大数据的基础知识,还概述了Python的数据结构和操作。书中展示了一系列统计技术及其在Python中的实现,包括假设检验、概率、探索性数据分析、分类变量、调查和抽样、A/B测试以及相关性分析。
文本介绍了二元分类——机器学习的一个基础组成部分,通过将其应用于保留数据来验证统计模型的有效性,以及通过易于理解的重采样和自助法(bootstrap)方法而非一系列复杂的“大杂烩”公式来进行概率和推断。回归分析既作为解释工具也作为预测工具进行了讲解。
本书编著者的经验来源于他们在Statistics.com设计和教授入门统计学和机器学习课程的经历。每一章节都包含了实用示例、底层概念的解释以及Python代码片段,帮助读者自行应用这些技术。
《数据科学与分析统计学》涉及的主题包括但不限于: 
· 整型、浮点型和字符串数据类型,数值运算,字符串操作,数据类型转换,以及列表、字典和集合等高级数据结构 
· 实验设计方法,如随机化、盲测和前后配对,以及处理二进制数据的比例和百分比计算 
· 数据科学中的重要Python包,如numpy、scipy、pandas、scikit-learn和statsmodels的使用技巧,以及如何最大化发挥它们的价值 
· 统计显著性与实践显著性的区别、随机数生成器、代码复用函数,以及二项式和正态概率分布本书由数据科学教育者编写并面向此类读者,是数据科学课程中推荐的入门统计学教材的理想选择,同样适用于希望转行进入数据科学领域的其他学生和专业人士。

02 作者简介

Peter C. Bruce是统计学教育研究所(现为Elder Research, Inc.的一部分)的创始人。他是重采样统计软件的开发者,同时也是多篇同行评审文章和几本书籍的作者或合著者。Peter Gedeck, PhD是Collaborative Drug Discovery公司研究信息团队的科学家,专注于开发用于预测药物候选物生物和物理化学性质的机器学习算法。Janet Dobbins是Data Community DC董事会主席,这是一个致力于通过高质量的社区驱动活动促进数据科学发展,支持教育、机会和职业发展的非营利501(c)(3)组织。她曾担任统计学教育研究所(​​Statistics.com​​)的业务发展和战略伙伴关系副总裁。布鲁斯和格德克是畅销书籍《商业分析中的机器学习》(Wiley出版社)和《数据科学家实用统计学》(O'Reilly出版社)的作者团队成员。

03 书籍大纲

图片


一点人工一点智能
4 声望5 粉丝