找到约 3918 条结果
  • Pandas之:Pandas高级教程以铁达尼号真实数据为例
    简介今天我们会讲解一下Pandas的高级教程,包括读写文件、选取子集和图形表示等。读写文件数据处理的一个关键步骤就是读取文件进行分析,然后将分析处理结果再次写入文件。Pandas支持多种文件格式的读取和写入: {代码...} 接下来我们会以Pandas官网提供的Titanic.csv为例来讲解Pandas的使用。Titanic.csv提供了800多个...
    2021-06-07
  • Tensorflow快餐教程(1) - 30行代码搞定手写识别
    去年买了几本讲tensorflow的书,结果今年看的时候发现有些样例代码所用的API已经过时了。看来自己维护一个保持更新的Tensorflow的教程还是有意义的。这是写这一系列的初心。快餐教程系列希望能够尽可能降低门槛,少讲,讲透。为了让大家在一开始就看到一个美好的场景,而不是停留在漫长的基础知识积累上,参考网上的一些...
    2018-04-24
  • 拓端tecdat|在R语言和Stan中估计截断泊松分布
    这是一个非常简化的例子。我产生了1,000个计数观察值,平均值为1.3。然后,如果只观察到两个或更高的那个,我将原始分布与我得到的分布进行比较。 
    2020-03-22
  • 拓端tecdat|R语言用多重插补法估算相对风险
    原文链接:[链接]在这里,我将用R中的一个小模拟示例进行说明。首先,我们使用X1和X2双变量法线和Y模拟大型数据集,其中Y遵循给定X1和X2的逻辑模型。首先,我们模拟一个非常大的完整数据集: {代码...} 接下来,我们估计将X1从1更改为0的影响的边际风险比: {代码...} 接下来,我们使用Sullivan _等人_考虑的一种机制,...
    2020-03-23
  • Text classification with TensorFlow Hub: Movie reviews
    This notebook classifies movie reviews as positive or negative using the text of the review. This is an example of binary—or two-class—classification, an important and widely applicable kind of machine learning problem.
    2021-07-31
  • Sentence-BERT
    背景:BERT和RoBERTa在文本语义相似度等句子对的回归任务上,已经达到了SOTA的结果。但是,它们都需要把两个句子同时喂到网络中,这样会导致巨大的计算开销。论文作者提出了Sentence-BERT(SBERT)网络结构,该网络结构利用孪生网络和三胞胎网络结构生成具有语义意义的句子embedding向量。可以完成一些特定的任务,如相似...
    2021-12-15
  • 输出hystrix指标到dropwizard metrics
    对于分布式应用来说,不可避免地要与系统周边的服务打交道,这个时候,需要对外部的服务调用进行监控,这里我们利用hystrix进行监控,并将其整合到dropwizard的metrics,方便统一输出到statsd。
    2017-04-08
  • python爬取拉勾网
    又到了一年一度的招聘热季,大量的工作向我们招手,今天我和大家一起看看拉勾网中各公司对于python人才的需求。 import jieba import numpy as np import pandas as pd import matplotlib.pyplot as plt from pyecharts import Geo from wordcloud import WordCloud import re import matplotlib from imageio import im...
    2020-07-13
  • Python用RNN循环神经网络:LSTM长期记忆、GRU门循环单元、回归和ARIMA对COVID-19新冠疫情人数时间序列预测
    原文链接:[链接]该数据根据世界各国提供的新病例数据提供。获取时间序列数据 {代码...} 探索数据此表中的数据以累积的形式呈现,为了找出每天的新病例,我们需要减去这些值 {代码...}  这些数据是根据国家和地区报告新病例的数据,但我们只想预测国家的新病例,因此我们使用 groupby 根据国家对它们进行分组 总结数据执...
    2022-06-02
  • 关于codahale的HistogramMetric
    均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值.其主要缺点是易受数据极端值的影响,对于偏态分布的数据,均值的代表性较差.作为均值变形的调和平均数和几何平均数,是适用于特殊数据的代表值,调和平均数主要用于不能直接计算均值的数据,几何平均数则主要用于计算比率数据的平均数,这两...
    2017-02-28
  • web 缓存服务器 HTTP2 性能测试: nuster vs nginx
    简单的用 h2load测试了nuster和nginx的http/2下的缓存性能,结果显示RPS(每秒请求数)nuster差不多是nginx的3倍 [链接] data size CONN nuster nginx 12(hello world) 1000 338924 110419 测试环境 服务器 两台linux服务器:一台测试服务器server129, 一台缓存服务器server130. Server port app 10.0.0.129 wrk 10.0.0....
    2018-06-13
  • MTHM002 方法统计学
    除非您提交了缓解案例,否则逾期工作将被打0%(零)的分数缓解委员会接受的。请问我,你的私人导师或哈里森枢纽,如果你需要建议。这是一门单独的课程,请注意学院和大学关于合作和剽窃的指导方针,可从Fac获得-ulty网站。这意味着,你必须独自完成这项任务与任何其他人讨论,Methods for Stochastics and Finance MTHM0...
    2023-11-13
  • R语言代做编程辅导M3/4S7 2015 - Project 2(附答案)
    The density of a finite mixture distribution has the form p(x) = KXi =1 πifi(x; θi) where fi(:) are the K component densities, and πj are mixing proportions. For fixed K, the EM algorithm (see lecture slides) can be used to estimate the parameters, θi, πi, for i = 1; : : : K, from an iid sample. ...
    2023-07-11
  • titanic 特征工程
    从姓名中提取乘客的称呼,归纳为六类。将['Capt', 'Col', 'Major', 'Dr', 'Rev']映射为Officer,这些都是工作人员;将['Don', 'Sir', 'the Countess', 'Dona', 'Lady']映射为Royalty,the Countess是伯爵夫人,这几类称呼都是尊称,表明了这些乘客的社会地位很高还有贵族;将['Mme', 'Ms', 'Mrs']映射为Miss,这些称呼只能...
    2019-04-02
  • 拓端tecdat|stata如何处理结构方程模型(SEM)中具有缺失值的协变量
    本周我正和一位朋友讨论如何在结构方程模型(SEM)软件中处理具有缺失值的协变量。我的朋友认为某些包中某些SEM的实现能够使用所谓的“完全信息最大可能性”自动适应协变量中的缺失。在下文中,我将描述我后来探索Stata的sem命令如何处理协变量中的缺失。
    2020-03-23
  • JoJoGAN 实践
    JoJoGAN: One Shot Face Stylization. 只用一张人脸图片,就能学习其风格,然后迁移到其他图片。训练时长只用 1~2 min 即可。
    2022-02-08
  • Kmeans聚类算法
    Kmeans是最流行的,以及最简单的用于挖掘数据潜在结构的机器学习算法之一。Kmeans的目标很简单:根据数据的均值,将数据划分为若干个簇。假定每个簇的均值可以很好地代表簇内的每一个观察值。
    2017-10-31