对未来“机器学习”的看法
————————机器学习小白一场机器学习技术分享后的感想
本周五(2019.03.23)去听了一个关于 “机器学习” 的技术分享
主讲人是 XX传媒技术部经理 刘总
这次技术分享给我最直观的感受就是:机器学习极有可能是互联网的下一个增长点。无论是一名程序员、还是一名企业管理者,了解与掌握机器学习相关技术,对于未来个人与企业发展至关重要
。
一、为什么这么说?
摆在我们面前的就有一个成功的案例:头条
头条
迅速崛起,超越众多资讯类软件,甚至超越 “网易新闻”,与“腾讯新闻”分庭抗礼
我认为其中有两条最重要的原因:
- 脸皮够厚
初期通过网络爬虫,抓取了大量的媒体内容;甚至抓取了竞争对手大量 “媒体内容的评论”
以此,迅速完成了媒体内容的积累 - 针对不同类型的用户,个性化进行内容推荐
推荐用户最喜欢看的内容
是这个系统的最重要指标
其相对于其他新闻资讯类软件内容的质量高低、时效性
反而不重要了
也许“头条”创立之初,其目标就不是成为一款新闻资讯类软件;而是成为“一款为用户提供其喜欢的内容、让用户恨不得二十四小时沉浸在其中的软件”。
我的父亲,就是每天沉浸在其推荐的,关于“天文宇宙”的内容中不能自拔,让我恨不得没收手机。
这里 针对不同类型的用户,个性化进行内容推荐
我认为是其成功的核心技术驱动力。
我觉得用专业一些的文字来表达应该是:
以用户特征、习惯、爱好等创建一个机器学习模型。根据不同用户的地区、使用习惯、性别等进行针对性的内容推荐
。
当然头条完成用户积累后,也在积极的进行内容自产
从其他互联网公司挖了很多编辑
(但稍微思考一下,就算有很多的编辑,每天才能产出多少内容呢?大量内容应该还是靠网络爬虫抓取吧。
但毕竟成功了,抓取内容应该也会进行合作付费,否则头条估计也活不到今天吧)。
以此思考 腾讯新闻、网易新闻们又该如何竞争?
- 如果按照头条这样搞,反而会丢失自己作为一个新闻资讯类软件存在的必要性;
- 如果不这样搞,放任头条做大,反而丢失了行业领先地位,收入降低反而是次要的;
若在变革中持续找不到方向,甚至有可能在竞争中消失
;
关于我提出的这个问题,我觉的 腾讯新闻、网易新闻 们作为纯正的新闻资讯类软件是有其存在的必要性的:
- 保证内容的时效性(毕竟看新闻的人们是希望了解国内外最新发生的各种事件和报道)
只能想到这一条了,毕竟是一名普通程序员,这些问题还是让企业大佬们去思考吧。
大佬们让干啥就干啥,挣钱养家,才是我这个苦逼程序员要做的...
回归“机器学习”主题
回到“机器学习”的主题,说 “头条” 也是想说明“机器学习”的重要性。
然后重复一遍我心里所想:
机器学习极有可能是互联网的下一个增长点。无论是一名程序员、还是一名企业管理者,了解与掌握机器学习相关技术,对于未来个人与企业发展至关重要
。
声明:
关于头条的所有看法,纯属自己的意淫,并与其他任何个人和组织没有任何关系,谢谢
。
另外,弱弱的问一句,我这样瞎说会不会有风险?
但说的都是我心中所想,还是想记下来,否则说不定哪天就忘了。
二、技术收获
机器学习如何工作?
- 定义目标
- 不断的优化
我的理解:
通过大量数据训练,结合概率计算,持续进行优化,最终不断提高机器预测的精确度
例如:
- 预测一张图上画的是苹果,通过大量特征数据的训练,可以不断提高图片识别成功的概率;
- 自动驾驶通过一个路口时,如果马上要变红灯了,路口附近又有一个骑车的人要通过
那应该是加速冲过去,还是停下来?这需要进行一个冲撞概率的计算
- 最终不断优化,提高预测的精确度
一个著名的数学公式
它的好处是,其处于0~1之间,不断的接近0与1
预测一张图上画的是苹果:通过大量特征数据的训练,使之预测准确率无限接近1
一个点餐App推荐系统
图中是一个按地域,进行口味推荐的点餐App推荐系统
- 第一层是国家的概念
- 第二层是省的概念,例如:四川、山东、河北
- 第三层是市的概念,例如:衡水市、唐山市、石家庄等
例如:
- 衡水人打开App,看到的菜单是,经过整个衡水人民使用数据不断训练后,生成的推荐菜单
- 另外,如果一个唐山人,看到App推荐的菜单后,没有食欲
系统还会进行模型回溯功能,进入河北省这一级,将整个河北省人民使用数据训练后生成的推荐菜单
当然,这个模型还可以进行一些更改。
以用户特征、习惯、爱好等创建一个机器学习模型。根据不同用户的地区、使用习惯、性别等进行针对性的内容推荐
。
由此想到,知识付费类应用
喜马拉雅、网易公开课 等亦可以通过这种方式提升DAU与复购率
- 根据用户喜好,不断的向用户推荐喜欢的免费内容,以增强用户粘性
- 推荐免费内容的过程中,偶尔推荐其习惯的付费内容,以增加用户的复购率
三、程序员方向
其实到这里,我这篇文章已经结束了。
但和 一位大牛同事、好哥们 朱朱
沟通,感觉他的观点,为未来程序员的成长指明了方向,我这里一字不差的粘了过来:
我感觉推荐系统就是机器学习的一个应用,机器学习还是需要大数据去训练去提取特征。大数据可以是个方向[奸笑],而大数据的发展离不开分布式计算,数据库的支持。
机器学习就是人工智能的一小部分,还有语音识别,机器人,计算机图形学的发展和自然语言处理
方向很多没必要只盯着机器学习
目前我们能搞的自然语言处理和图形学,机器人感觉也能搞,语音识别有难度😄,自然语言处理还不错,我第一家公司好多同事就弄这个的
大数据、分布式计算、数据库、自然语言处理、语音识别、计算机图形学、机器人
这些可能都是程序员的发展方向。
选择一个方向,深耕细作,够研究一辈子的了(选择一个方向,一直研究下去,没有大成也会有小成
)
迷茫中的程序员不要再迷茫下去了
选择一个喜欢的方向,始终保持积极的学习态度,持续提升技术水平
,才是未来的程序员立足不败的根本...
四、畅想未来
我觉得进入这样一个时代是很有可能的
- 靠太阳能发电,靠机器干活(电能转化为其他能量物质)
- 人类不需要工作,进入共产主义,按需分配,每天只需要享受阳光、空气、就够了
哈,嗅到了自由的味道...
五、 最后
- 感谢这些互联网的大厂,为我们提供了一个可以和这些大牛交流的平台
- 感谢身边的同事、哥们提供的各种观点
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。