[译]量化投资教程:投资组合优化与R实践

2016-02-13
阅读 17 分钟
12.8k
最近,我在研究投资组合优化的问题,主要针对的是股票持仓的组合优化,我们会在这个分析过程中发现一些有意思的现象,并一步一步优化、检验我们的风控模型。本文将有四个部分分别阐述具体步骤。

[译]大数据分析平台搭建教程:基于Apache Zeppelin Notebook和R的交互式数据科学

2016-02-12
阅读 5 分钟
25.2k
这篇文章的目的是帮助您开始使用 Apache Zeppelin Notebook,它可以满足您用R做数据科学的需求。Zeppelin 是一个提供交互数据分析且基于Web的笔记本。方便你做出可数据驱动的、可交互且可协作的精美文档,并且支持多种语言,包括 Scala(使用 Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等等。

[译] 数据可视化教程:基于Google Sheets 和 RStudio Shiny 建立实时仪表盘

2016-02-11
阅读 14 分钟
19.7k
对于物联网应用,收集分布式日志数据到一个中央服务器并做数据可视化是一项十分常见的工作,这通常需要部署和维护自己的服务器、数据库和可视化界面。我对系统管理任务毫无乐趣,所以我找到了一种方法使用谷歌表作为数据库和ShinyApps.io作为可视化平台。上传数据到Google docs是相对简单的,但用shiny连接到Google docs却...

[译]快速上手:在R中使用XGBoost算法

2016-02-07
阅读 5 分钟
45.6k
介绍 你知道 XGBoost 算法是一种现在在数据科学竞赛的获胜方案很流行的算法吗? 那么,他比传统的随机森林和神经网络算法强在哪里呢?广义上来说,它在效率,准确性,可行性都更有优势(接下来我们将会详细讨论)。 在最近的几年中,模型预测已经变得越来越快速和准确了。我记得我曾花费数个小时在为某个模型构建特征工程...

[原]打造数据产品的快速原型:Shiny的Docker之旅

2015-10-19
阅读 3 分钟
14.3k
Shiny是R中的一种Web开发框架,使得R的使用者不必太了解css、js只需要了解一些html的知识就可以快速完成web开发,且shiny包集成了bootstrap、jquery、ajax等特性,极大解放了作为统计语言的R的生产力。使得非传统程序员的R使用者不必依赖于前端、后端工程师就可以自己依照业务完成一些简单的数据可视化工作,快速验证想...