Trifacta 获得投资以简化数据整理
Trifacta 是一个数据分析服务平台,最近获得了风险投资,旨在进一步简化数据分析师的数据整理工作。其目标是在更短的时间和更少的努力下完成数据的收集、清洗和整理。
数据整理的挑战
数据整理一直是每个大数据项目中最耗时和痛苦的部分。在当今时代,数据源不断演变,数据具有流动性和异构性,且属性不断变化。NoSQL 数据库虽然在存储方面尝试通过列式或文档式存储来解决这一问题,但在数据收集和语义应用方面仍然存在挑战。
Trifacta 的用户中心化方法
Trifacta 从用户中心化的角度出发,而非开发者角度,解决数据整理问题。业务分析师和数据科学家能够以视觉导向的方式清洗数据集。基于伯克利和斯坦福的研究,该平台旨在让员工和机器协作,从数据集中提取洞察。
自动化智能采样与可视化
通过自动化智能采样和可视化,分析师可以在更短的时间内发现有趣的模式。Trifacta 可以应用机器学习算法,建议如何重新组织信息并使其成形。分析师可以将数据集分组为逻辑信息部分,逐步进行标准化,并在工作过程中以用户友好的方式查看结果。最后一步是对整个数据集进行泛化,将半结构化数据集整理成形。
平台设计理念
该平台从用户体验出发,设计上允许数据分析师深入挖掘数据,而无需开发复杂的管道来清洗数据并将其导入数据仓库。
Trifacta 的前身与研究
Trifacta 的前身研究项目 DataWrangler 及其研究论文可以在线查阅,为 Trifacta 的未来发展提供了预览。目前,Trifacta 仍处于封闭测试阶段,仅通过邀请安排演示。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。