一文读懂深度学习:从神经元到BERT
阿里妹导读:自然语言处理领域的殿堂标志 BERT 并非横空出世,背后有它的发展原理。今天,蚂蚁金服财富对话算法团队整理对比了深度学习模型在自然语言处理领域的发展历程。从简易的神经元到当前最复杂的BERT模型,深入浅出地介绍了深度学习在 NLP 领域进展,并结合工业界给出了未来的 NLP 的应用方向,相信读完这篇文章...
LSTM(长短期记忆网络)
在上篇文章一文看尽RNN(循环神经网络)中,我们对RNN模型做了总结。由于RNN也有梯度消失的问题,因此很难处理长序列的数据,大牛们对RNN做了改进,得到了RNN的特例LSTM(Long Short-Term Memory),它可以避免常规RNN的梯度消失,因此在工业界得到了广泛的应用。下面我们就对LSTM模型做一个总结。
2020-03-20
没有绿幕,AI也能完美视频抠图,发丝毕现,毫无违和感 | CVPR
在阳台上给小姐姐拍个视频:再把她P到喷泉广场:需要几步?现在,无需绿幕,AI 就能搞定这件事。就像这样,随便用手机给小姐姐拍张照片,再在同一地点拍张不带人像的背景图。深度神经网络就能自动分析出 alpha 遮罩和前景色,把小姐姐的发丝都抠得根根分明。视频也是如此。让憋着笑的同事在实验室白板前表演一段广播体操...
2020-04-08
【视频】ARIMA时间序列模型原理和R语言ARIMAX预测实现案例
ARIMA是可以拟合时间序列数据的模型,根据自身的过去值(即自身的滞后和滞后的预测误差)“解释” 给定的时间序列,因此可以使用方程式预测未来价值。任何具有模式且不是随机白噪声的“非季节性"时间序列都可以使用ARIMA模型进行建模。
2023-06-13
别再卷数据了,LLM也怕「过劳死」!CMU等揭秘灾难性过度训练
新智元 新智元 新智元报道 编辑:KingHZ【新智元导读】颠覆LLM预训练认知:预训练token数越多,模型越难调!CMU、斯坦福、哈佛、普林斯顿等四大名校提出灾难性过度训练。如果训练数据越多那么LLM越好。这到底对不对?不对!这就是「灾难性过度训练」现象。图1:经过高强度预训练的语言模型,可能出现「灾难性过度训练...
2025-05-03
CycleGan实现图像转换
1873年的一个春日,在阿让特伊的塞纳河畔,莫奈用纤细的笔触和明亮的调色板记录下了眼前塞纳河畔美丽的田园风光。我们不免想象如果当时有相机的话,会留下一张怎样的照片呢。在一个凉爽的夏日傍晚,面对卡西斯港口的美丽景色,我们拿起相机时是否又会想象莫奈会如何来记录眼前的此番景象呢。尽管我们没有看到莫奈画作的...
2019-09-18
KDD 2019论文解读:多分类下的模型可解释性
日前,由阿里巴巴研究型实习生张雪舟、蚂蚁金服高级算法专家娄寅撰写的论文《Axiomatic Interpretability for Multiclass Additive Models》入选全球数据挖掘顶级会议KDD 2019,本文为该论文的详细解读。论文地址:[链接]
2019-08-26
R语言MCMC-GARCH、风险价值VaR模型股价波动分析上证指数时间序列
随着金融市场全球化的发展,金融产品逐渐受到越来越多的关注,而金融产品的风险度量成为投资者最关心的问题。金融风险是指由于经济活动的不确定性、市场环境的变化、决策的失误等因素的影响,导致实际回报与预期回报出现偏离的可能性。
2023-03-03
小学数学题,大模型集体不及格!达摩院推出新基准VCBench
闭源模型中Gemini2.0-Flash(49.77%)、Qwen-VL-Max(47.03%)、Claude-3.7-Sonnet(46.63%)的综合表现最佳,但仍未突破50%准确率。
2025-05-22
KDD 2019论文解读:多分类下的模型可解释性
日前,由阿里巴巴研究型实习生张雪舟、蚂蚁金服高级算法专家娄寅撰写的论文《Axiomatic Interpretability for Multiclass Additive Models》入选全球数据挖掘顶级会议KDD 2019,本文为该论文的详细解读。论文地址:[链接]
1亿图文对!格灵深瞳开源RealSyn数据集,CLIP多任务性能刷新SOTA
所有的图像和句子都基于冗余进行了严格过滤,在确保数据质量的同时,引入基于簇的语义平衡采样策略,构建了可满足多样工作需求的三种规模大小的数据集:15M、30M、100M。
2025-04-27
【视频讲解】Xgboost、ARIMA 和 Prophet对国际牛肉市场市场份额数据、比特币价格时间序列预测-CSDN博客
原文链接:[链接] 本文将通过视频讲解,展示如何用Xgboost、ARIMA 和 Prophet对国际牛肉市场市场份额数据时间序列预测,并结合一个Python# ARIMA、XGBOOST、PROPHET和LSTM预测比特币价格实例的代码数据,为读者提供一套完整的实践数据分析流程。
2024-08-05
极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR:多元化投资组合预测风险测度分析|附代码数据
使用 Anderson-Darling 检验对 10 只股票的组合数据进行正态性检验,并使用 Block Maxima 和 Peak-Over-Threshold 的 EVT 方法估计 VaR/CvaR。最后,使用条件异向性 (GARCH) 处理的广义自回归来预测未来 20 天后指数的未来值。本文将确定计算风险因素的不同方法对模型结果的影响。
2024-07-16
CVPR2024论文解读|对齐人类审美!MPS让图像生成评估更“懂你”
导读当人类从不同角度评估不同类型的图像时,偏好结果会有所不同。因此,为了学习多维的人类偏好,我们提出人类多元偏好模型(MPS),这是第一个评估文本生成图像的多维评分模型。MPS在3个公开数据集上表现出色,同时也在4个偏好维度上优于现有的评分方法,使其成为评估和改进文生图模型的核心指标。该模型和数据集已经...
2024-07-19
极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR:多元化投资组合预测风险测度分析|附代码数据
使用 Anderson-Darling 检验对 10 只股票的组合数据进行正态性检验,并使用 Block Maxima 和 Peak-Over-Threshold 的 EVT 方法估计 VaR/CvaR。最后,使用条件异向性 (GARCH) 处理的广义自回归来预测未来 20 天后指数的未来值。本文将确定计算风险因素的不同方法对模型结果的影响。
2023-01-18
极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR:多元化投资组合预测风险测度分析|附代码数据
使用 Anderson-Darling 检验对 10 只股票的组合数据进行正态性检验,并使用 Block Maxima 和 Peak-Over-Threshold 的 EVT 方法估计 VaR/CvaR。最后,使用条件异向性 (GARCH) 处理的广义自回归来预测未来 20 天后指数的未来值。本文将确定计算风险因素的不同方法对模型结果的影响。
2023-04-11
字节跳动 AI Lab 提出多模态模型:X-VLM,学习视觉和语言多粒度对齐
视觉语言预训练提高了许多下游视觉语言任务的性能,例如:图文检索、基于图片的问答或推理。有朋友要问了,除了在公开的学术任务上使用更大的模型/更多的数据/技巧把指标刷得很高,多模态预训练模型有什么实际应用呢?
2022-06-17