Trifacta 致力于简化数据整理即服务

Trifacta 获得投资以简化数据整理

Trifacta 是一个数据分析服务平台,最近获得了风险投资,旨在进一步简化数据分析师的数据整理工作。其目标是在更短的时间和更少的努力下完成数据的收集、清洗和整理。

数据整理的挑战

数据整理一直是每个大数据项目中最耗时和痛苦的部分。在当今时代,数据源不断演变,数据具有流动性和异构性,且属性不断变化。NoSQL 数据库虽然在存储方面尝试通过列式或文档式存储来解决这一问题,但在数据收集和语义应用方面仍然存在挑战。

Trifacta 的用户中心化方法

Trifacta 从用户中心化的角度出发,而非开发者角度,解决数据整理问题。业务分析师和数据科学家能够以视觉导向的方式清洗数据集。基于伯克利和斯坦福的研究,该平台旨在让员工和机器协作,从数据集中提取洞察。

自动化智能采样与可视化

通过自动化智能采样和可视化,分析师可以在更短的时间内发现有趣的模式。Trifacta 可以应用机器学习算法,建议如何重新组织信息并使其成形。分析师可以将数据集分组为逻辑信息部分,逐步进行标准化,并在工作过程中以用户友好的方式查看结果。最后一步是对整个数据集进行泛化,将半结构化数据集整理成形。

平台设计理念

该平台从用户体验出发,设计上允许数据分析师深入挖掘数据,而无需开发复杂的管道来清洗数据并将其导入数据仓库。

Trifacta 的前身与研究

Trifacta 的前身研究项目 DataWrangler 及其研究论文可以在线查阅,为 Trifacta 的未来发展提供了预览。目前,Trifacta 仍处于封闭测试阶段,仅通过邀请安排演示。

阅读 24
0 条评论