GPT最佳实践:五分钟打造你自己的GPT

2023-11-10
阅读 2 分钟
267
前几天OpenAI的My GPTs栏目还是灰色的,就在今天已经开放使用了。有幸第一时间体验了一把生成自己的GPT,效果着实惊艳!!!我打造的GPT模型我会放到文章末尾,大家感兴趣也可以自己体验一下。
封面图

如何对抗信息茧房?

2021-07-29
阅读 2 分钟
3.8k
首先声明:本文表达观点,提供一种思考问题的角度,并非严谨的论述论证。为了直击问题本质,高效陈述观点,行文过程中出现的不严谨之处皆是作者表述方式问题,与观点本身无关。无论作者表述多么拙劣,都希望读者可以考虑观点的合理行,对其进行深度的思考。所有“另当别论的个例”皆另当别论,不在本文简洁表述的范围内。

机器学习(六):通俗易懂无监督学习K-Means聚类算法及代码实践

2021-03-20
阅读 4 分钟
5.2k
贴标签是需要花钱的。 所以人们研究处理无标签数据集的方法。(笔者狭隘了) 面对无标签的数据集,我们期望从数据中找出一定的规律。一种最简单也最快速的聚类算法应运而生---K-Means。 它的核心思想很简单:物以类聚。

机器学习(五):通俗易懂决策树与随机森林及代码实践

2021-02-25
阅读 5 分钟
4.2k
与SVM一样,决策树是通用的机器学习算法。随机森林,顾名思义,将决策树分类器集成到一起就形成了更强大的机器学习算法。它们都是很基础但很强大的机器学习工具,虽然我们现在有更先进的算法工具来训练模型,但决策树与随机森林因其简单灵活依然广受喜爱,建议大家学习。

机器学习(四):通俗理解支持向量机SVM及代码实践

2021-02-15
阅读 5 分钟
4k
上一篇文章我们介绍了使用逻辑回归来处理分类问题,本文我们讲一个更强大的分类模型。本文依旧侧重代码实践,你会发现我们解决问题的手段越来越丰富,问题处理起来越来越简单。

机器学习(三):理解逻辑回归及二分类、多分类代码实践

2021-02-01
阅读 7 分钟
7k
本文是机器学习系列的第三篇,算上前置机器学习系列是第八篇。本文的概念相对简单,主要侧重于代码实践。 上一篇文章说到,我们可以用线性回归做预测,但显然现实生活中不止有预测的问题还有分类的问题。我们可以从预测值的类型上简单区分:连续变量的预测为回归,离散变量的预测为分类。
封面图

机器学习(二):理解线性回归与梯度下降并做简单预测

2021-01-19
阅读 5 分钟
2.7k
预测从瞎猜开始按上一篇文章所说,机器学习是应用数学方法在数据中发现规律的过程。既然数学是对现实世界的解释,那么我们回归现实世界,做一些对照的想象。 想象我们面前有一块塑料泡沫做的白板,白板上分布排列着数枚蓝色的图钉,隐约地它们似乎存在着某种规律,我们试着找出规律。白板上的图钉(数据)如上图所示,我...

机器学习(一):5分钟理解机器学习并上手实践

2021-01-16
阅读 5 分钟
2.6k
现在市面上的机器学习教程大多先学习数学基础,然后学机器学习的数学算法,再建立机器学习的数学模型,再学习深度学习,再学习工程化,再考虑落地。这其中每个环节都在快速发展,唯独落地特别困难。我们花费大量时间成本去学习以上内容,成本无疑是特别昂贵的。所以我们不如先“盲人摸象”、“不求甚解”地探索下机器学习,...

2021,新世界!

2020-12-31
阅读 4 分钟
2k
如果我们不能击败它,就必须与之共存。随便聊聊。文末有红包🧧现金💰书籍📖赠送。 新冠病毒正在彻底改变世界,人类与之斗争,没有人敢断言结果。我们做职业规划、人生规划时,要重新考虑风险。中国崛起IMF预计,中国是2020年全球唯一一个经济正增长的主要经济体。 中国在悠悠的历史长河中,一直不是以民主为核心的。我们受...

前置机器学习(五):30分钟掌握常用Matplotlib用法

2020-12-25
阅读 9 分钟
2.7k
我们在前面的文章讲过NumPy的用法,这里我们就不展开讨论NumPy的相关知识了。 Matplotlib具有很强的工具属性,也就是说它只是为我所用的,我们不必花太多的精力去精进它。我们只需要知道它可以做那些事,可以绘制哪些图形,有一个印象就足够了。我们在实际使用中用什么拿什么,我们用到了自然就熟练了,用不到的功能也就...

防卒指南:996+健身≈猝死

2020-12-19
阅读 2 分钟
3.1k
我试着在中文语境下找一些资料来佐证我标题的观点,“运动能锻炼身体的原理”。可惜只能搜到各种健身指南、健身技巧。显然,健身市场很红火, 这些关键字都被买断了。我只能做一些不那么严谨的论证。

机器学习速查表(cheatsheet)资源汇总分享

2020-12-18
阅读 4 分钟
3.5k
本文收集整理了机器学习相关速查表(Machine Learning Cheatsheet),包含机器学习、Python、Numpy、Pandas、Matplotlib、线性代数、微积分、统计学、概率论等相关速查表。我已经建立了开源项目MachineLearningCheatsheets,我将持续更新机器学习相关的各种cheatsheet,欢迎star。

前置机器学习(四):一文掌握Pandas用法

2020-12-13
阅读 16 分钟
2.5k
Pandas建立在NumPy之上,更多NumPy相关的知识点可以参考我之前写的文章前置机器学习(三):30分钟掌握常用NumPy用法。 Pandas特别适合处理表格数据,如SQL表格、EXCEL表格。有序或无序的时间序列。具有行和列标签的任意矩阵数据。

前置机器学习(三):30分钟掌握常用NumPy用法

2020-12-06
阅读 8 分钟
2k
我们首先巩固一下Python的基础知识。Python有6种标准数据类型:Number(数字),String(字符串),List(列表),Tuple(元组),Set(集合),Dictionary(字典)。 其中: 不可变数据:Number(数字)、String(字符串)、Tuple(元组)。 可变数据:List(列表)、Dictionary(字典)、Set(集合)。

戒烟、写作、赚美金:我的2020

2020-12-03
阅读 2 分钟
2.4k
我在外企工作。 从疫情开始的远程办公,到后来A\B周(一周远程,一周办公室),再到后来的每周远程一天,算上疫情的延长假,我可能在办公室办公100多天。 然后我的作息就不规律了,总见不到人,也有点抑郁。

前置机器学习(二):30分钟掌握常用Jupyter Notebook用法

2020-12-02
阅读 4 分钟
2.4k
相较于Pycharm执行py文件来说,Jupyter Notebook可保存执行过程,添加图表、注释等富文本说明的功能,使其对机器学习的开发者格外友好。

前置机器学习(一):数学符号及希腊字母

2020-11-29
阅读 1 分钟
3.3k
本文列出了常用的机器学习数学符号(Mathematical notations),包含代数、微积分、线性代数、概率论、集合论、统计学以及希腊字母。

2020年,关于面试的根本性思考

2020-05-06
阅读 3 分钟
2.4k
先说说我的经历,毕业在一家500强企业做国内项目,然后在同一家公司做对日项目,后来跳槽到一家韩国公司做对韩项目,然后跳到一家美国公司做国际项目,从此过上了965的幸福生活……后来结识了一些行业顶尖的朋友,时间充裕后又申请了谷歌的某个组织者,偶尔组织一些人工智能的分享活动。 其实从毕业以来我就很少加班,7年...

天下苦谷歌网盘久矣!

2020-04-17
阅读 2 分钟
3.3k
1. 背景 本文仅介绍谷歌网盘,请勿胡乱联想。 现在是2020年4月16日。 昨天晚上我买的硬盘到了,我打算将Google Drive上的所有文件备份到本地,算是一种灾备方案。万一谷歌倒闭了呢,毕竟这公司也不大。 2. 谷歌网盘 Google Drive,即谷歌网盘,是谷歌推出的网盘服务,用户有15GB的免费空间。你的文档、照片、Gmail的邮件...

趁着疫情在家学点什么?

2020-01-31
阅读 2 分钟
2.9k
瘟疫属于天灾,个人在灾害面前显得很渺小。我们能做的就是保护好自己,照顾好家人,出门戴口罩,回家就洗手、手腕。当然,武汉某些部门的不作为在某种程度上可以说是“人祸”,网上声讨的文章已经铺天盖地了,作为技术号我就不多说了。

机器学习导图系列(5):机器学习模型及神经网络模型

2019-04-11
阅读 2 分钟
2.6k
机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中有些具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多...

机器学习导图系列(4):算法(含61公式)

2019-04-10
阅读 2 分钟
3k
机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中有些具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多...

机器学习导图系列(3):过程

2019-04-09
阅读 1 分钟
2.1k
机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中有些具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多...

机器学习导图系列(2):概念

2019-04-08
阅读 2 分钟
1.9k
机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多功夫...

机器学习导图系列(1):数据处理

2019-04-07
阅读 2 分钟
2.2k
机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多功夫...

如何正确的提问题

2018-07-19
阅读 1 分钟
2.3k
我们需要走捷径,因为我们的生命是有限的。 我们一生能做的事情不多,越是精英越会觉得时间不够用。我们不可能花费大量的时间来回答别人的问题,更何况提问的人自己甚至都没思考。

你的知识死角不能否定你的技术能力

2018-05-27
阅读 2 分钟
2.6k
有些人通过我账号资料里的微信加我,然后问我一些所谓“怎么办”的问题,不是我不告诉你,而是我确实不知道。我确实有很高的title,也确实有很多的技术积累,但我并没有达到知识的“百宝盒”的水平。 换个角度重新说这句话“这么简单的问题你都不知道,你配得上你的title吗?”

实例:使用puppeteer headless方式抓取JS网页

2018-05-09
阅读 5 分钟
6.9k
google chrome团队出品的puppeteer 是依赖nodejs和chromium的自动化测试库,它的最大优点就是可以处理网页中的动态内容,如JavaScript,能够更好的模拟用户。 有些网站的反爬虫手段是将部分内容隐藏于某些javascript/ajax请求中,致使直接获取a标签的方式不奏效。甚至有些网站会设置隐藏元素“陷阱”,对用户不可见,脚本...

给老婆的一篇文章

2018-04-26
阅读 15 分钟
1.8k
查询出某游戏用户回流信息,当用户连续两天登陆,则判定为2日回流,如果间隔一天登陆,则判定为3日回流,如果间隔5天登陆,则判定为7日回流。用户数据间隔时间短为14天(固定)。

机器学习:选对时机直线超车

2018-03-02
阅读 1 分钟
1.5k
俗话说“一张白纸好作画”。有时候经验反倒是一个笼子,错过新的/更强大的解决方案。思维模型的固化会让你很难接受另一种编程模型。 举个现实例子:公司现在要开展一个全新的项目,并且在前期调研时发现xxx语言特性完美适配项目架构,作为公司高管你会选择让月薪3万的程序员学习新语言之后接手这个项目还是招聘3个月薪5千...