TidyData 通过 “变量为列、观测为行” 的核心原则,大幅降低了数据清洗的复杂度,使我们能更专注于业务问题而非数据格式转换。
论文作者Hadley Wickham, 论文讨论数据处理中的一个小模块, 数据整理, 因为整洁的数据集易于操作、建模和可视化,并且具有特定的结构.
该篇论文, 非常建议阅读, 请查阅: Tidy Data
VSeed DSL 中的dataset配置就是 TidyData 格式的数据集.
核心特征如下:
因此SQL查询的结果, 可以直接传入VSeed的dataset配置中, 无需额外的数据处理, 即可快速进行分析与可视化.