SF
caiyongji
caiyongji
注册登录
关注博客
注册登录
主页
关于
RSS
深度!程序员生涯的垃圾时间(上)
caiyongji
9 月 15 日
阅读 3 分钟
294
很多程序员对互联网行业中广泛讨论的“35岁危机”表示不满,似乎所有的程序员都有着35岁的职业保质期。然而,随着AI技术的兴起,这场翻天覆地的技术革命正以更加残酷且直接的方式渗透到各行各业。程序员的核心价值正在被自动化和智能工具所取代。程序员不再面临传统意义上的35岁年龄危机,而是面临着职业生涯的终结危机。
GPT最佳实践:五分钟打造你自己的GPT
caiyongji
2023-11-10
阅读 2 分钟
500
前几天OpenAI的My GPTs栏目还是灰色的,就在今天已经开放使用了。有幸第一时间体验了一把生成自己的GPT,效果着实惊艳!!!我打造的GPT模型我会放到文章末尾,大家感兴趣也可以自己体验一下。
如何对抗信息茧房?
caiyongji
2021-07-29
阅读 2 分钟
4.2k
首先声明:本文表达观点,提供一种思考问题的角度,并非严谨的论述论证。为了直击问题本质,高效陈述观点,行文过程中出现的不严谨之处皆是作者表述方式问题,与观点本身无关。无论作者表述多么拙劣,都希望读者可以考虑观点的合理行,对其进行深度的思考。所有“另当别论的个例”皆另当别论,不在本文简洁表述的范围内。
机器学习(六):通俗易懂无监督学习K-Means聚类算法及代码实践
caiyongji
2021-03-20
阅读 4 分钟
5.6k
贴标签是需要花钱的。 所以人们研究处理无标签数据集的方法。(笔者狭隘了) 面对无标签的数据集,我们期望从数据中找出一定的规律。一种最简单也最快速的聚类算法应运而生---K-Means。 它的核心思想很简单:物以类聚。
机器学习(五):通俗易懂决策树与随机森林及代码实践
caiyongji
2021-02-25
阅读 5 分钟
4.6k
与SVM一样,决策树是通用的机器学习算法。随机森林,顾名思义,将决策树分类器集成到一起就形成了更强大的机器学习算法。它们都是很基础但很强大的机器学习工具,虽然我们现在有更先进的算法工具来训练模型,但决策树与随机森林因其简单灵活依然广受喜爱,建议大家学习。
机器学习(四):通俗理解支持向量机SVM及代码实践
caiyongji
2021-02-15
阅读 5 分钟
5.1k
上一篇文章我们介绍了使用逻辑回归来处理分类问题,本文我们讲一个更强大的分类模型。本文依旧侧重代码实践,你会发现我们解决问题的手段越来越丰富,问题处理起来越来越简单。
机器学习(三):理解逻辑回归及二分类、多分类代码实践
caiyongji
2021-02-01
阅读 7 分钟
7.6k
本文是机器学习系列的第三篇,算上前置机器学习系列是第八篇。本文的概念相对简单,主要侧重于代码实践。 上一篇文章说到,我们可以用线性回归做预测,但显然现实生活中不止有预测的问题还有分类的问题。我们可以从预测值的类型上简单区分:连续变量的预测为回归,离散变量的预测为分类。
机器学习(二):理解线性回归与梯度下降并做简单预测
caiyongji
2021-01-19
阅读 5 分钟
2.9k
预测从瞎猜开始按上一篇文章所说,机器学习是应用数学方法在数据中发现规律的过程。既然数学是对现实世界的解释,那么我们回归现实世界,做一些对照的想象。 想象我们面前有一块塑料泡沫做的白板,白板上分布排列着数枚蓝色的图钉,隐约地它们似乎存在着某种规律,我们试着找出规律。白板上的图钉(数据)如上图所示,我...
机器学习(一):5分钟理解机器学习并上手实践
caiyongji
2021-01-16
阅读 5 分钟
2.8k
现在市面上的机器学习教程大多先学习数学基础,然后学机器学习的数学算法,再建立机器学习的数学模型,再学习深度学习,再学习工程化,再考虑落地。这其中每个环节都在快速发展,唯独落地特别困难。我们花费大量时间成本去学习以上内容,成本无疑是特别昂贵的。所以我们不如先“盲人摸象”、“不求甚解”地探索下机器学习,...
2021,新世界!
caiyongji
2020-12-31
阅读 4 分钟
2.2k
如果我们不能击败它,就必须与之共存。随便聊聊。文末有红包🧧现金💰书籍📖赠送。 新冠病毒正在彻底改变世界,人类与之斗争,没有人敢断言结果。我们做职业规划、人生规划时,要重新考虑风险。中国崛起IMF预计,中国是2020年全球唯一一个经济正增长的主要经济体。 中国在悠悠的历史长河中,一直不是以民主为核心的。我们受...
前置机器学习(五):30分钟掌握常用Matplotlib用法
caiyongji
2020-12-25
阅读 9 分钟
2.9k
我们在前面的文章讲过NumPy的用法,这里我们就不展开讨论NumPy的相关知识了。 Matplotlib具有很强的工具属性,也就是说它只是为我所用的,我们不必花太多的精力去精进它。我们只需要知道它可以做那些事,可以绘制哪些图形,有一个印象就足够了。我们在实际使用中用什么拿什么,我们用到了自然就熟练了,用不到的功能也就...
防卒指南:996+健身≈猝死
caiyongji
2020-12-19
阅读 2 分钟
3.3k
我试着在中文语境下找一些资料来佐证我标题的观点,“运动能锻炼身体的原理”。可惜只能搜到各种健身指南、健身技巧。显然,健身市场很红火, 这些关键字都被买断了。我只能做一些不那么严谨的论证。
机器学习速查表(cheatsheet)资源汇总分享
caiyongji
2020-12-18
阅读 4 分钟
3.9k
本文收集整理了机器学习相关速查表(Machine Learning Cheatsheet),包含机器学习、Python、Numpy、Pandas、Matplotlib、线性代数、微积分、统计学、概率论等相关速查表。我已经建立了开源项目MachineLearningCheatsheets,我将持续更新机器学习相关的各种cheatsheet,欢迎star。
前置机器学习(四):一文掌握Pandas用法
caiyongji
2020-12-13
阅读 16 分钟
2.7k
Pandas建立在NumPy之上,更多NumPy相关的知识点可以参考我之前写的文章前置机器学习(三):30分钟掌握常用NumPy用法。 Pandas特别适合处理表格数据,如SQL表格、EXCEL表格。有序或无序的时间序列。具有行和列标签的任意矩阵数据。
前置机器学习(三):30分钟掌握常用NumPy用法
caiyongji
2020-12-06
阅读 8 分钟
2.1k
我们首先巩固一下Python的基础知识。Python有6种标准数据类型:Number(数字),String(字符串),List(列表),Tuple(元组),Set(集合),Dictionary(字典)。 其中: 不可变数据:Number(数字)、String(字符串)、Tuple(元组)。 可变数据:List(列表)、Dictionary(字典)、Set(集合)。
戒烟、写作、赚美金:我的2020
caiyongji
2020-12-03
阅读 2 分钟
2.5k
我在外企工作。 从疫情开始的远程办公,到后来A\B周(一周远程,一周办公室),再到后来的每周远程一天,算上疫情的延长假,我可能在办公室办公100多天。 然后我的作息就不规律了,总见不到人,也有点抑郁。
前置机器学习(二):30分钟掌握常用Jupyter Notebook用法
caiyongji
2020-12-02
阅读 4 分钟
2.6k
相较于Pycharm执行py文件来说,Jupyter Notebook可保存执行过程,添加图表、注释等富文本说明的功能,使其对机器学习的开发者格外友好。
前置机器学习(一):数学符号及希腊字母
caiyongji
2020-11-29
阅读 1 分钟
3.6k
本文列出了常用的机器学习数学符号(Mathematical notations),包含代数、微积分、线性代数、概率论、集合论、统计学以及希腊字母。
2020年,关于面试的根本性思考
caiyongji
2020-05-06
阅读 3 分钟
2.5k
先说说我的经历,毕业在一家500强企业做国内项目,然后在同一家公司做对日项目,后来跳槽到一家韩国公司做对韩项目,然后跳到一家美国公司做国际项目,从此过上了965的幸福生活……后来结识了一些行业顶尖的朋友,时间充裕后又申请了谷歌的某个组织者,偶尔组织一些人工智能的分享活动。 其实从毕业以来我就很少加班,7年...
天下苦谷歌网盘久矣!
caiyongji
2020-04-17
阅读 2 分钟
3.4k
1. 背景 本文仅介绍谷歌网盘,请勿胡乱联想。 现在是2020年4月16日。 昨天晚上我买的硬盘到了,我打算将Google Drive上的所有文件备份到本地,算是一种灾备方案。万一谷歌倒闭了呢,毕竟这公司也不大。 2. 谷歌网盘 Google Drive,即谷歌网盘,是谷歌推出的网盘服务,用户有15GB的免费空间。你的文档、照片、Gmail的邮件...
趁着疫情在家学点什么?
caiyongji
2020-01-31
阅读 2 分钟
3k
瘟疫属于天灾,个人在灾害面前显得很渺小。我们能做的就是保护好自己,照顾好家人,出门戴口罩,回家就洗手、手腕。当然,武汉某些部门的不作为在某种程度上可以说是“人祸”,网上声讨的文章已经铺天盖地了,作为技术号我就不多说了。
机器学习导图系列(5):机器学习模型及神经网络模型
caiyongji
2019-04-11
阅读 2 分钟
2.8k
机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中有些具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多...
机器学习导图系列(4):算法(含61公式)
caiyongji
2019-04-10
阅读 2 分钟
3.2k
机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中有些具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多...
机器学习导图系列(3):过程
caiyongji
2019-04-09
阅读 1 分钟
2.1k
机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中有些具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多...
机器学习导图系列(2):概念
caiyongji
2019-04-08
阅读 2 分钟
2k
机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多功夫...
机器学习导图系列(1):数据处理
caiyongji
2019-04-07
阅读 2 分钟
2.4k
机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多功夫...
如何正确的提问题
caiyongji
2018-07-19
阅读 1 分钟
2.4k
我们需要走捷径,因为我们的生命是有限的。 我们一生能做的事情不多,越是精英越会觉得时间不够用。我们不可能花费大量的时间来回答别人的问题,更何况提问的人自己甚至都没思考。
你的知识死角不能否定你的技术能力
caiyongji
2018-05-27
阅读 2 分钟
2.6k
有些人通过我账号资料里的微信加我,然后问我一些所谓“怎么办”的问题,不是我不告诉你,而是我确实不知道。我确实有很高的title,也确实有很多的技术积累,但我并没有达到知识的“百宝盒”的水平。 换个角度重新说这句话“这么简单的问题你都不知道,你配得上你的title吗?”
实例:使用puppeteer headless方式抓取JS网页
caiyongji
2018-05-09
阅读 5 分钟
7.1k
google chrome团队出品的puppeteer 是依赖nodejs和chromium的自动化测试库,它的最大优点就是可以处理网页中的动态内容,如JavaScript,能够更好的模拟用户。 有些网站的反爬虫手段是将部分内容隐藏于某些javascript/ajax请求中,致使直接获取a标签的方式不奏效。甚至有些网站会设置隐藏元素“陷阱”,对用户不可见,脚本...
给老婆的一篇文章
caiyongji
2018-04-26
阅读 15 分钟
1.9k
查询出某游戏用户回流信息,当用户连续两天登陆,则判定为2日回流,如果间隔一天登陆,则判定为3日回流,如果间隔5天登陆,则判定为7日回流。用户数据间隔时间短为14天(固定)。
1
(current)
2
下一页
1
(current)
下一页