对未来“机器学习”的看法

————————机器学习小白一场机器学习技术分享后的感想

本周五(2019.03.23)去听了一个关于 “机器学习” 的技术分享
主讲人是 XX传媒技术部经理 刘总

这次技术分享给我最直观的感受就是:
机器学习极有可能是互联网的下一个增长点。无论是一名程序员、还是一名企业管理者,了解与掌握机器学习相关技术,对于未来个人与企业发展至关重要

一、为什么这么说?

摆在我们面前的就有一个成功的案例:头条

头条迅速崛起,超越众多资讯类软件,甚至超越 “网易新闻”,与“腾讯新闻”分庭抗礼

我认为其中有两条最重要的原因:

  • 脸皮够厚
    初期 通过网络爬虫,抓取了大量的媒体内容;甚至抓取了竞争对手大量 “媒体内容的评论”
    以此,迅速完成了媒体内容的积累
  • 针对不同类型的用户,个性化进行内容推荐
    推荐用户最喜欢看的内容是这个系统的最重要指标
    其相对于其他新闻资讯类软件 内容的质量高低、时效性反而不重要了

也许“头条”创立之初,其目标就不是成为一款新闻资讯类软件;而是成为“一款为用户提供其喜欢的内容、让用户恨不得二十四小时沉浸在其中的软件”。 我的父亲,就是每天沉浸在其推荐的,关于“天文宇宙”的内容中不能自拔,让我恨不得没收手机。

这里 针对不同类型的用户,个性化进行内容推荐 我认为是其成功的核心技术驱动力。
我觉得用专业一些的文字来表达应该是:

以用户特征、习惯、爱好等创建一个机器学习模型。根据不同用户的地区、使用习惯、性别等进行针对性的内容推荐

当然头条完成用户积累后,也在积极的进行内容自产

从其他互联网公司挖了很多编辑
(但稍微思考一下,就算有很多的编辑,每天才能产出多少内容呢?大量内容应该还是靠网络爬虫抓取吧。
但毕竟成功了,抓取内容应该也会进行合作付费,否则头条估计也活不到今天吧)。

以此思考 腾讯新闻、网易新闻们又该如何竞争?
  • 如果按照头条这样搞,反而会丢失自己作为一个新闻资讯类软件存在的必要性;
  • 如果不这样搞,放任头条做大,反而丢失了行业领先地位,收入降低反而是次要的;若在变革中持续找不到方向,甚至有可能在竞争中消失

关于我提出的这个问题,我觉的 腾讯新闻、网易新闻 们作为纯正的新闻资讯类软件是有其存在的必要性的:

  • 保证内容的时效性(毕竟看新闻的人们是希望了解国内外最新发生的各种事件和报道)

只能想到这一条了,毕竟是一名普通程序员,这些问题还是让企业大佬们去思考吧。
大佬们让干啥就干啥,挣钱养家,才是我这个苦逼程序员要做的...

回归“机器学习”主题

回到“机器学习”的主题,说 “头条” 也是想说明“机器学习”的重要性。
然后重复一遍我心里所想:

机器学习极有可能是互联网的下一个增长点。无论是一名程序员、还是一名企业管理者,了解与掌握机器学习相关技术,对于未来个人与企业发展至关重要

声明:

关于头条的所有看法,纯属自己的意淫,并与其他任何个人和组织没有任何关系,谢谢

另外,弱弱的问一句,我这样瞎说会不会有风险?
但说的都是我心中所想,还是想记下来,否则说不定哪天就忘了。

二、技术收获

机器学习如何工作?
  • 定义目标
  • 不断的优化

我的理解:
通过大量数据训练,结合概率计算,持续进行优化,最终不断提高机器预测的精确度

例如:

  • 预测一张图上画的是苹果,通过大量特征数据的训练,可以不断提高图片识别成功的概率;
  • 自动驾驶通过一个路口时,如果马上要变红灯了,路口附近又有一个骑车的人要通过

那应该是加速冲过去,还是停下来?这需要进行一个冲撞概率的计算

  • 最终不断优化,提高预测的精确度

001.jpeg

一个著名的数学公式

它的好处是,其处于0~1之间,不断的接近0与1

预测一张图上画的是苹果:通过大量特征数据的训练,使之预测准确率无限接近1

002.jpeg

一个点餐App推荐系统

图中是一个按地域,进行口味推荐的点餐App推荐系统

  • 第一层是国家的概念
  • 第二层是省的概念,例如:四川、山东、河北
  • 第三层是市的概念,例如:衡水市、唐山市、石家庄等

例如:

  • 衡水人打开App,看到的菜单是,经过整个衡水人民使用数据不断训练后,生成的推荐菜单
  • 另外,如果一个唐山人,看到App推荐的菜单后,没有食欲

系统还会进行模型回溯功能,进入河北省这一级,将整个河北省人民使用数据训练后生成的推荐菜单

003.jpeg

当然,这个模型还可以进行一些更改。

以用户特征、习惯、爱好等创建一个机器学习模型。根据不同用户的地区、使用习惯、性别等进行针对性的内容推荐

由此想到,知识付费类应用

喜马拉雅、网易公开课 等亦可以通过这种方式提升DAU与复购率

  • 根据用户喜好,不断的向用户推荐喜欢的免费内容,以增强用户粘性
  • 推荐免费内容的过程中,偶尔推荐其习惯的付费内容,以增加用户的复购率

三、程序员方向

其实到这里,我这篇文章已经结束了。
但和 一位大牛同事、好哥们 朱朱沟通,感觉他的观点,为未来程序员的成长指明了方向,我这里一字不差的粘了过来:

我感觉推荐系统就是机器学习的一个应用,机器学习还是需要大数据去训练去提取特征。大数据可以是个方向[奸笑],而大数据的发展离不开分布式计算,数据库的支持。

机器学习就是人工智能的一小部分,还有语音识别,机器人,计算机图形学的发展和自然语言处理
方向很多没必要只盯着机器学习

目前我们能搞的自然语言处理和图形学,机器人感觉也能搞,语音识别有难度😄,自然语言处理还不错,我第一家公司好多同事就弄这个的

大数据、分布式计算、数据库、自然语言处理、语音识别、计算机图形学、机器人 这些可能都是程序员的发展方向。
选择一个方向,深耕细作,够研究一辈子的了(选择一个方向,一直研究下去,没有大成也会有小成

迷茫中的程序员不要再迷茫下去了

选择一个喜欢的方向,始终保持积极的学习态度,持续提升技术水平,才是未来的程序员立足不败的根本...

四、畅想未来

我觉得进入这样一个时代是很有可能的

  • 靠太阳能发电,靠机器干活(电能转化为其他能量物质)
  • 人类不需要工作,进入共产主义,按需分配,每天只需要享受阳光、空气、就够了

哈,嗅到了自由的味道...

五、 最后

  • 感谢这些互联网的大厂,为我们提供了一个可以和这些大牛交流的平台
  • 感谢身边的同事、哥们提供的各种观点

========== THE END ==========

这篇文章编写修改,总共花了近四个小时,到昨晚两点多才基本完成,写文章不易


xiaxl
59 声望5 粉丝

不忘初心,方得始终...