报表工具对比选型系列用例——多源分片报表

2020-08-17
阅读 9 分钟
965
润乾报表、帆软报表、Smartbi、永洪 BI、亿信 BI 这几款国内产品都把中国复杂报表作为宣传点。我们以常见的多源分片为报表为用例,来对比评测这些产品的处理能力(由于时间和知识限制,个别很偏的功能点可能会有遗漏)。

批量自动建模有什么意义?

2020-08-17
阅读 2 分钟
1.1k
目前,由于数据挖掘技术的门槛较高,实现起来复杂度较大,因此一般一个数据挖掘项目通常就是建立一个模型,这个模型要尽量有更广泛的应用范围。这样做其实会导致模型的适应能力下降,而多个模型适用效果就远远好于一个模型。

为什么业务知识会严重影响建模效果?

2020-08-10
阅读 2 分钟
901
我们知道一个完整的数据挖掘项目通常包含以下流程(1)业务理解、(2)数据理解、(3)数据准备、(4)数据预处理和建模、(5)模型评估、(6)模型部署应用。而要完成一个数据挖掘任务,必须要具备两方面的技能,技术能力和业务知识。技术能力主要包括数据统计分析能力,算法能力,计算机能力等,业务知识体现的则是对...

业内的人工智能培训课有多大用?

2020-08-05
阅读 2 分钟
1.1k
随着人工智能技术的火热,各种 AI 培训也应运而生,翻阅各种社交网站和 APP,几乎每天都能刷到 Python、人工智能相关的文章,点进去很大一部分都是培训机构给自家 AI 课程打的广告。那么业内人工智能的培训课程靠谱吗,学了之后又有多大作用?

为什么我基于开源包建的模型效果不好?

2020-07-29
阅读 2 分钟
963
以最流行的 Scikit-learn 为例,提供了包括回归 (Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering) 等方法的开源包,使用者可以灵活的实现各种建模操作。但是也有人发现了,同样的开源包不同的人建出的模型效果是不一样的,甚至大相径庭。为什么大牛就能建出高质量模型,而我基于开...

程序数据集上的多维分析

2020-07-24
阅读 6 分钟
988
当数据源不是来自文件和 SQL,而是由程序现计算出来的,这种情况在许多 BI 系统中都会出现,BI 系统自己管理数据模型,把数据库挡在后面,不会直接开放 SQL,更不会提供文件让你直接访问,访问数据都要通过程序接口(比如 JavaAPI 或 Webservice)——这样一来,想要对这些程序接口返回的结果集做多维分析看似就有些困难了...

给一句 SQL 就能做多维分析

2020-07-24
阅读 7 分钟
790
多维分析程序支持对任何数据库做 SQL 数据集多维分析,只需先把数据源配置好,然后程序猿啪啪几下敲下需要进行多维分析的 SQL 语句就可以,灵活便捷,去乾学院看个究竟:给一句 SQL 就能做多维分析!《把 Excel 透视表搬到 WEB 上》我们以 Excel 文件数据集为例,介绍了如何把 Excel 的数据透视表嵌入到俺的应用程序中。...

把 Excel 透视表搬到 WEB 上

2020-07-24
阅读 4 分钟
770
Excel 透视表 - 只要遇见就不曾忘记!根据原始数据勾勾选项拖拖拽拽,分析数据嗖一下就出来了,这么好用的东西怎么能移到 WEB 上呢?去乾学院看个究竟:把 Excel 透视表搬到 WEB 上!

如何才能导出和打印 Echarts 图形

2020-07-24
阅读 3 分钟
957
【摘要】Echarts,江湖人称一个纯 Javascript 的图表库,图形种类星罗棋布且个个颜值爆表,可以轻松驾驭 PC 和移动设备,与绝大部分浏览器都可称兄道弟,而且已然众多拥趸,还有不少报表对它采取了嫁接技术。这么棒的图标库如何能在报表工具里导出和打印呢?Echarts 图形是由 Javascript 亲自在前端网页上绘制的,需要从...

建模高手与初学者的差别在哪里?需要什么样的人来建模?

2020-07-24
阅读 2 分钟
724
我们知道,数据挖掘的基本流程包括:(1)业务理解、(2)数据理解、(3)数据准备、(4)数据预处理和建模、(5)模型评估、(6)模型部署应用。其中第 4 步,数据预处理和建模是整个流程的核心部分,其他的步骤都是围绕的该步骤进行的。建模高手和初学者的差距也往往在这里,建出一个模型很容易,快速高效的建出一个好...

完成一个预测建模项目一般需要多长时间?

2020-07-17
阅读 2 分钟
1.3k
为了回答这个问题,我们先来了解一下建模的流程,通常一个完整的数据挖掘项目包含以下流程(1)业务理解、(2)数据理解、(3)数据准备、(4)数据预处理和建模、(5)模型评估、(6)模型部署应用。这个流程的操作性很强,也是业界公认标准。

润乾报表 dashboard 分析

2020-07-13
阅读 10 分钟
1.1k
在《润乾报表多维分析功能漫游》一文中我们已经见识了润乾报表分析控件的妙处:可视化的拖拽模式,灵活的计算方式,脱离敲打复杂多变的查询语句,只需要动动鼠标就可以获取所需要的数据。除了多维分析外,润乾报表还有dashboard分析界面那就是仪表盘,简称DBD,即大屏和分析控件的结合。

有没有简单易用的数据挖掘工具?

2020-07-13
阅读 1 分钟
848
当前用于数据挖掘的工具软件主要有两类,早期都是有图形化界面的商用软件,比如 SAS 和 SPSS,此类工具历史悠久,性能稳定。图形化的操作界面基本以拖拽填写为主,配合少量脚本编程,使用较为方便。不过,此类工具的价格也比较高,一般只有大型企业在用。

做人工智能为什么经常要学 python?

2020-07-13
阅读 2 分钟
1.1k
当前,提到人工智能、数据科学几乎就一定会提到 Python,很多人工智能相关的课程实质上也都在大篇幅的讲 Python,有的初学者甚至认为人工智能和 Python 是划等号的,随着人工智能概念的火热几乎掀起了一股全民学 Python 的热潮。那么,作为一种计算机程序语言,Python 到底有何魅力,如此受到人工智能的喜爱。总结下来,...

数据挖掘建模需要什么样的数据?多大量?

2020-07-13
阅读 1 分钟
1k
所谓结构化数据,是指表现为二维形式的数据,一般特点是:数据以行(也称样本)为单位,一行数据表示一个实体的信息,每一行数据的属性(也称字段或列)是相同的。结构化数据可以来自于数据库,也可以来自于文本文件或 Excel。

数据挖掘是什么?能解决什么问题?

2020-07-13
阅读 2 分钟
890
傍晚小街路面上沁出微雨后的湿润,和煦的细风吹来,抬头看看天边的晚霞,嗯,明天又是一个好天气。走到水果摊旁,挑了个根蒂蜷缩、敲起来声音浊响的青绿西瓜,心里期待着享受这个好瓜。

制约数据挖掘业务的环节

2020-07-13
阅读 3 分钟
984
各行各业都对数据挖掘表现出极大兴趣,也纷纷展开了应用尝试,但成功案例并不多,这是为什么呢? 1. 数据质量差 玩数据就像挖金矿。如果含金量高,那么挖掘难度就小,出金率就高,如果含金量低,那么就会难度大效果差。数据质量问题通常表现在三个方面。 (1)数据量不足 要教一个牙牙学语的小朋友什么是苹果,只需要指...

润乾报表多维分析功能漫游

2020-07-13
阅读 9 分钟
889
【摘要】        你是否也在苦苦找寻一个处理大量数据特别迅速的报表工具?你是否还在为成千上万数据的复杂计算感到头晕?润乾报表的多维分析功能漫游为您提供有效的解决方案:润乾报表多维分析功能漫游!

润乾报表 dashboard 分析

2020-07-08
阅读 10 分钟
980
在《润乾报表多维分析功能漫游》一文中我们已经见识了润乾报表分析控件的妙处:可视化的拖拽模式,灵活的计算方式,脱离敲打复杂多变的查询语句,只需要动动鼠标就可以获取所需要的数据。除了多维分析外,润乾报表还有dashboard分析界面那就是仪表盘,简称DBD,即大屏和分析控件的结合。

数据挖掘 回归模型案例 _ 房价预测

2020-06-28
阅读 4 分钟
1.6k
简介: 回归预测是指预测的目标是连续型的变量,数据探索和预处理时与分类预测有哪些相同,哪些不同,让我们用房价预测作为案例来实战分析这些问题。

敏捷数据计算中间件

2020-06-28
阅读 7 分钟
824
【摘要】计算中间件是应用与数据之间,独立进行计算的可编程通用软件,常用以解决松耦合、高性能、特殊源计算、多源混算、复杂逻辑等问题。但传统计算中间件一般用硬编码实现,不仅开发效率低、维护难度大,而且在数据、算法与应用之间存在强耦合性,有时还会对数据库造成不必要的压力。如何用敏捷数据计算中间件解决此...

数据挖掘基本概念和过程

2020-06-28
阅读 6 分钟
1.2k
简介: 数据挖掘作为现在的热门词汇,那么什么是数据挖掘,它又是干什么的,它是怎么工作的,真的有那么神奇吗?这里我们用中学生能理解的语言告诉您这些问题的答案。视频播放地址:[链接]

数据挖掘分类模型案例 _titanic 幸存者预测

2020-06-28
阅读 4 分钟
1.3k
简介 titanic 幸存者预测案例是数据挖掘的入门案例,非常适合初学者来学习,这里我们就以此数据作为切入点来讲述数据挖掘的过程,感受数据挖掘的魅力。视频播放地址:[链接]

一键式智能建模软件介绍

2020-06-28
阅读 2 分钟
949
【下载附件】一键式智能建模软件介绍

工业传感器标准化采集案例

2020-06-28
阅读 2 分钟
1k
【摘要】工业设备生成的数据,通常由实时数据库进行初级采集。但实时数据过于原始,无法被信息管理系统、商业智能、数据挖掘等应用直接使用,一般需要进行标准化二次采集,形成规范一致的结构化数据服务于上层应用,及时了解机组健康状况,以此降低维护成本,提高经济效益!由于实时库的特殊性,导致其标准化采集算法异...

转置

2020-06-28
阅读 4 分钟
726
【摘要】    SQL 提供的静态转置功能 pivot 和 unpivot 适用范围很受限,要用 SQL 实现一些比较复杂的转置功能常常会遇到语句过于复杂的问题,而且也缺少一个标准的解决思路。而集算器的 SPL 语言,则因其语法的灵活和函数库的丰富,恰好可以弥补 SQL 这方面的不足。若想了解更多,请前往乾学院一探究竟:转置

集算器抓取 HTML 中的内容

2020-06-11
阅读 1 分钟
646
【摘要】 集算器提供 htmlparse() 函数,配合 position 工具,可准确抓取 HTML 中的内容。点击链接可了解更多:集算器抓取 HTML 中的内容! position 工具下载 集算器抓取 HTML 中的内容.pdf

Oracle 的 JDBC 写入有多慢?

2020-06-11
阅读 3 分钟
1.1k
使用TPCH生成的数据,选用其中的part表来做测试,数据记录为2000万行,9个字段。它生成的原始文本文件名为part.tbl,文件大小为2.4G。

Excel 集成集算器

2020-06-05
阅读 3 分钟
880
Excel 集成集算器 友乾营是专注数据技术的知识分享平台,这里,会不定期地发布独家技术专题视频、文档,便于独立思考学习;这里,鼓励对技术问题畅所欲言,在思维碰撞中相互学习、进行优势互补;另外,还会组织系列技术活动为技术人员创造更多的深层交流机会。 欢迎IT从业者或对数据相关技术感兴趣的人员入群交流、分享...

多层科目任意组合汇总表的性能优化

2020-06-05
阅读 3 分钟
999
在实际的报表开发过程中,当我们遇到问题,往往并不能一开始就想到最优的解决办法。我们可以试着先用最简单、最容易的办法实现,然后再一步步进行优化;对比每种方案的存在的缺陷及改进后所带来的性能提升,从而最终满足业务需求。本文中我们就采用了这种方式,逐步优化的步骤如下:1、多次遍历方案;2、一次遍历方案;3...