2025 年 5 月,谷歌宣布不再在其服务器上存储位置数据,现在数据存储在设备上并以加密形式发送给谷歌,这意味着谷歌 Takeout 导出不再包含位置数据,仍可从设备导出数据,但只包含原始位置数据,“语义”位置数据已不可用。作者使用谷歌地图的位置历史功能多年,虽觉得谷歌掌握其数据有点 creepy,但也认为这是数据分析的宝库。谷歌允许通过Takeout以机器可读格式下载所有数据,包含多个 JSON 文件,如Records.json
、Semantic Location History
等。
- First look at the data:
Records.json
文件对作者账户来说近 1GB,包含 10 多年的位置数据,是手机发送给谷歌的每个“电话回家”位置数据包。较旧的数据包信息较少,较新的数据包包含更多本地处理的数据,如尝试猜测作者正在做的事情和附近的 Wi-Fi 网络列表。Semantic Location History
文件夹包含谷歌处理的数据,有“地点访问”和“活动片段”,如作者在办公室的记录和步行活动等。 - Adding Google Fit to the mix:作者还使用谷歌 Fit 追踪身体活动,其数据格式为 TCX,比位置历史数据更简洁,且 Fit 会使用手机内部加速度计和计步器更准确地追踪步行细节,与地图数据相比,在一些活动记录上存在差异。
- Processing it with Python:作者编写了一个简单的 Python 脚本,解析 JSON 数据,以多种有趣的方式聚合数据,并输出为可用于博客图表的 JSON 文件,可测量步行速度(平均约 3.90km/h)和不同时间的步行距离,发现地图和 Fit 在测量内部步行方面存在差异,且与生活中的不同阶段相关。
- Other Fun Things:作者发现一个从 Takeout 位置数据生成热图的应用,10 年的位置数据生成的热图显示出作者花费时间较多的地方是红色斑点,同时在主要区域之间有类似云的结构,这些是作者多次访问且靠近的地方,实际上是作者乘车经过的主要高速公路。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。