书籍:Web Data Mining with Python: Discover and extract information from the web using Python
作者:Dr. Ranjana Rajnish, Dr. Meenakshi Srivastava
出版:BPB Publications
编辑:陈萍萍的公主@一点人工一点智能
书籍下载-《使用Python进行Web数据挖掘:利用Python发现和提取网络信息》
01 书籍介绍
数据科学是全球增长最快的职业之一,预计到2026年将创造1150万个就业岗位。因此,具备这一技能的求职者将拥有大量机会。在数据科学领域中,从网络中挖掘信息是最受追捧的领域之一。如果你是一名有志于成为数据科学家,并希望学习不同的Web挖掘技术,那么这本书非常适合你。本书首先介绍了Web挖掘的关键概念及其分类学。接着探讨了Web抓取的基础知识、用途和组件,随后讨论了与抓取相关的法律问题、数据提取与预处理、动态网站抓取以及CAPTCHA。
书中还介绍了观点挖掘和Web结构挖掘的概念。此外,本书涵盖了Web图挖掘、Web信息提取、Web搜索和超链接、基于超链接的主题搜索(HITS)以及用于Web挖掘的分区算法。最后,本书将教你如何使用不同的挖掘技术来发现Web数据中的有趣使用模式。
通过阅读本书,你将掌握使用Python进行数据提取的艺术。你将学到:学习如何使用Python从任何网站抓取数据。了解观点挖掘和情感分析的概念。使用Web结构挖掘从网络中发现结构信息。学习如何使用Python收集和分析社交媒体数据。使用Web使用挖掘来预测用户的浏览行为。
本书适合任何想要学习Web挖掘的人。对于希望掌握Web挖掘的数据科学家、数据工程师和数据分析师来说,这本书非常有帮助。
02 作者简介
Dr. Ranjana Rajnish是阿米提大学信息技术学院的助理教授。她拥有超过25年的学术/研究经验,曾在U.P. 技术大学和阿米提大学担任计算机科学教师至学术主管等多个职务。她的教学和研究领域包括编程语言(如C、Python、Borne Shell)、软件工程、观点挖掘/情感分析以及医疗保健。她在国内外知名会议上发表了40多篇论文。
Dr. Meenakshi Srivastava自2005年起在阿米提大学信息技术学院担任助理教授。她拥有工程学博士学位,教学和研究领域包括Web挖掘、图像处理、商业智能和生物信息学。她拥有超过18年的教学经验,教授过多种编程语言,如C、C++、C#、JAVA、Python和R。她在国内外发表了40多篇论文。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。