《机器学习》作者Peter Flach:好莱坞也借AI上头条

非商业转载请注明作译者、出处,并保留本文的原始链接:http://www.ituring.com.cn/art...

访谈对象:

Peter Flach,布里斯托大学人工智能教授,拥有20多年的机器学习教研经验。在高度结构化的数据挖掘以及通过ROC分析来评估和改进机器学习模型方面,Flach是国际领先的研究人员。他著有Simply Logical: Intelligent Reasoning by Example,也是Machine Learning期刊的总编。曾担任2009年ACM知识发现与数据挖掘国际会议、2012年欧洲机器学习与数据挖掘国际会议的程序委员会共同主席。

图片描述

《机器学习》是迄今市面上内容最全面的机器学习教材之一,书中汇集了所有用于理解、挖掘和分析数据的先进方法,并且通过数百个精选实例和解说性插图,直观而准确地阐释了这些方法背后的原理,内容涵盖了机器学习的构成要素和机器学习任务、逻辑模型、几何模型、统计模型,以及矩阵分解、ROC分析等时下热点话题。

本书写作思路清楚,逻辑性强。作者首先介绍了机器学习的基础知识,然后提供了大量有价值的结论、对若干机器学习技术性能的洞见,以及许多核心算法的高层伪代码,巧妙地引领读者循序渐进地学习。

——Fernando Berzal,Computing Reviews

访谈内容:

点击查看英文版

电影《机器姬》里,蓝书软件公司CEO——Nathan Bateman利用世界范围内的数据搜索、信息处理来培育人工智能,成功创造了兼具人类外表和思维的机器人Ava。科幻电影有一定的前瞻性,所以机器学习的深入真的能让AI成为现实吗?人工智能是祸还是福?

图片描述

图片描述

任何形式的智能,无论人工创造的与否,都要通过经验、和周围环境的互动获得提高发展。的确,机器学习是人工智能领域里重要的一部分,但它还需要比如常识推理、计划等其他的能力。

人工智能的福祸取决于我们如何使用它,对它采取怎样的保障措施。在某些领域,人工智能技能已经取代了人类,所以我们(不能陷入无尽的恐慌之中)而要想办法确保这些人有其他的工作可做。机器人对抗人类、拥有自主追求的想法,目前来讲还不大可能,但人类确实需要考虑如何避免这种情况的发生。如果这只是个有趣的哲学问题就好了!

机器学习在大数据处理方面如何起作用?请给我们简单介绍下。

首先,你要问问自己,搜集到的数据有没有包含足够的信息解决问题。最好把问题简化到几乎可以动手就能解决的程度,然后看看利用这些数据构建的机器学习模型是否可以解决这个简单的问题。如果可以,你再进一步增加问题的难度;如果不可以,就需要搜集更多更好的数据!

语音识别技术是机器研究领域的一个重要方向。在2015年语音识别顶级会议interspeech上,关于鲁棒语音识别领域的识别模型主要基于深层神经网络。这是否意味着信号级别上的语音增强、降噪、过滤已经过时了?

深度学习在语音和图像识别方面非常成功。虽然很强大,但深度学习需要大量的数据支持和高密度地运算。这对人类来说还是个“黑匣子”,我们虽然可以利用它解决一些问题,却不知道如何构建。有些技术比如过滤很容易理解,我们也可以根据使用情况判断技术的重要性。就比如,许多人并不知道汽车的工作原理,却丝毫不影响他的驾车技术;但如果要驾车穿过撒哈拉大沙漠,他就必须了解汽车是如何工作的。

目前人们用来打开“黑匣子”的一个做法是,先训练深层神经网络得到良好的性能,然后根据深层神经的输出结果,训练浅层神经网络或者其他解释性技术,来理解“黑匣子”。

前段时间,AlphaGo和李世乭的围棋对弈很火。您是否可以从机器学习的角度给些建议,比如AlphaGo应对挑战时,如何进行搜索,获得应对走法?在无数的可选走法中,如何做到全局观把握?

在玩儿围棋或者Go这样的游戏时,电脑会通过一个包含所有可行走法的数据树,不仅包括自己的应对走法也充分考虑对手的走法。这个树的所有数据都是AlphaGo自己跟自己对抗时获得的,赛数惊人得大,就算我们一生都在玩围棋也无法完成。这样,它会形成两个深层网络:一个用来计算每种可行走法,一个用来计算每个棋盘位置。这种学习叫作强化学习。在《机器学习》里,我并没有涉及强化学习的内容。假如时间允许,我会考虑在第二版里加入这部分内容。

这次人机大战中机器的胜利会不会鼓励更多的人学习研究机器学习?

我开始系统研究机器的时候,并不是每个人都认为计算机科学是门真正的学科,更别说人工智能、机器学习这些不寻常的领域了。现在,好莱坞电影、人机对战等都加入了这些引人注意的元素,确实是件好事。却也不免充斥着大量的炒作,诱导人们产生不切实际的期望。以学术态度系统地研究机器,追求的是,事物间细微的差别而不是大肆的宣传。当然,越多人研究学习机器对机器学习的发展越好!

您能给机器学习方面的自学者提供些建议吗?他们首先需要做哪些方面的准备?

构思《机器学习》的时候,我有尝试考虑自学者的需要,但他们确实需要一些背景知识方面的准备:一点概率和统计方面的知识,懂点儿逻辑和线性代数。另外,最好还能玩转一些机器学习软件:Python的scikit-learn现在很受欢迎,R和Matlab也提供了很多机器学习库。这些准备让读者了解机器学习能做什么,然后我的书能帮助他们了解机器学习怎么工作。

-------------------------------------------------------------------------------------------------------------------------------

——更多访谈


更多精彩,加入图灵访谈微信!

图片描述


图灵访谈
对话国外知名技术作者,讲述国内码农精彩人生。你听得见他们,他们也听得见你。

对话国外知名技术作者,讲述国内码农精彩人生。你听得见他们,他们也听得见你。

3k 声望
1.2k 粉丝
0 条评论
推荐阅读
谷歌开发技术推广部中国市场负责人栾跃:接轨世界、推动创新(图灵访谈)
栾跃呼吁并鼓励中国的开发者们跟世界接轨、把中国的技术创新带向世界。另外,他还热心于组建开发者社区,推动技术分享。希望在互联网技术行业里,有更多的女性加入进来,写代码、做产品开发、做项目管理,等等。

图灵访谈2阅读 3k

最好用的 python 库合集
🎈 分词 - jieba优秀的中文分词库,依靠中文词库,利用词库确定汉子之间关联的概率,形成分词结果 {代码...} 🎈 词云库 - wordcloud对数据中出现频率较高的 关键词 生成的一幅图像,予以视觉上的突出 {代码...} 🎈 ...

tiny极客11阅读 2.9k评论 2

封面图
SegmentFault 思否宣布将接入百度「文心一言」,提升开发者获取知识的效率
作为中国领先的新一代开发者社区,我们以「凝聚集体智慧,推动技术进步」为使命,长期关注前沿技术发展及产业应用。2023 年 2 月 11 日,ChatGPT for SegmentFault 浏览器插件上线,SegmentFault 成为了国内首个...

SegmentFault思否11阅读 3.1k评论 1

数据结构与算法:二分查找
一、常见数据结构简单数据结构(必须理解和掌握)有序数据结构:栈、队列、链表。有序数据结构省空间(储存空间小)无序数据结构:集合、字典、散列表,无序数据结构省时间(读取时间快)复杂数据结构树、 堆图二...

白鲸鱼9阅读 5.4k

对 ChatGPT 做一次技术面试(ChatGPT 没能通过)
问:对一个系统的描述如下:系统中有大量注册用户,用户可以关注其他用户。用户可以发布消息,消息包含发布者、发布时间和可见性。消息的可见性可以是公开、不公开或仅对关注自己的用户可见。请设计这个系统的数...

捏造的信仰8阅读 1.6k评论 1

封面图
超详细的ChatGPT注册教程来了
最近一周,大家都在讨论ChatGPT,一些主流的技术社区更是将ChatGPT吹的神乎其技,那ChatGPT是什么呢?又能给我们带来哪些变化呢?。带着这些问题,我打算先注册并使用 ChatGPT,供想要体验 ChatGPT 的小伙伴们参考。

xiangzhihong4阅读 3k评论 3

使用 🧨 Diffusers 实现 ControlNet 高速推理
自从 Stable Diffusion 风靡全球以来,人们一直在寻求如何更好地控制生成过程的方法。ControlNet 提供了一个简单的迁移学习方法,能够允许用户在很大程度上自定义生成过程。通过 ControlNet,用户可以轻松地使用...

HuggingFace3阅读 1.3k

封面图

对话国外知名技术作者,讲述国内码农精彩人生。你听得见他们,他们也听得见你。

3k 声望
1.2k 粉丝
宣传栏