“离火车站越近,烤肉串越差” - 一项“研究”

这是一篇关于研究“离火车站越近,烤肉串越难吃”这一假设的文章,主要内容如下:

  • 引言:作者在 Reddit 上看到法国子版块的一个假设,决定进行一项非正式研究。作者假设研究区域为法国巴黎,因为原帖是法语且巴黎市中心密集的火车站和烤肉串店能提供大量样本数据。
  • 方法

    • 网络数据:使用 OSMnx 下载并保存巴黎的步行导航网络,将数据投影到 EPSG:32631,并获取火车站/地铁站入口数据。
    • 餐厅数据:选择 Google Places API 收集餐厅数据,但该 API 存在只能在点半径内搜索、自动补全无效、Google Cloud 仪表盘缓慢等问题。作者通过六边形布局在巴黎进行网格搜索,以获取 400 家烤肉串店的数据,并对数据进行裁剪和投影处理。
    • 路由和距离:使用 GeoPandas 的 sindex 构建空间索引,计算每个烤肉串店到最近火车站入口的距离。通过 NetworkX 进行网络分析,获取最短路径和距离。
  • 结果:通过 Pearson 相关性分析,数据表明离火车站越近烤肉串越难吃的假设可能成立,但相关性很弱。去除一些异常值后,相关性系数仅略有增加。排除地铁站后,相关性更差。
  • 讨论

    • Google 评论不是衡量烤肉串味道的客观标准,可能受到多种因素影响。
    • 旅游业可能对餐厅评价有影响。
    • Google 结果在一定程度上是准确的,但存在一些奇怪的异常值。
    • 最初假设过于具体,未考虑其他餐厅。
    • 未考虑评论数量对分析的影响。
    • 作者不愿意分享数据,鼓励他人进行类似探索。
  • 结论:尽管研究结果有些令人失望,但作者认为这很有趣,并表示将继续探索。同时,原帖中的一些反例似乎表明巴黎的特殊条件可能对餐厅有更大影响,期待第二部分内容。
阅读 7
0 条评论