主要观点:比较polars
和dplyr
的人体工程学,dplyr
的人体工程学使复杂转换表达精确、简洁和有表现力,polars
在一些方面有更复杂的人体工程学,如行操作的显式 API、列选择器、一致的窗口函数 API、列表列和嵌套框架等。
关键信息:
dplyr
的人体工程学特点:一致(函数名、隐喻、返回新数据框)、可组合(抽象层次合适的函数、一致的返回类型)、以人为本(合适的抽象层次、有用的函数和助手)。polars
和dplyr
的基本功能相似,如主要动词(列选择、创建/修改列等)、主动词设计(方便引用列、有可选参数、一致的输入输出设计)、链式操作(方法链)。polars
的高级操作,如行操作的显式 API、列选择器(在select
、with_columns
、group_by
和agg
中的应用)、一致的窗口函数 API、列表列和嵌套框架的创建与操作。
重要细节:dplyr
通过非标准评估方便引用列,polars
用pl.col()
;dplyr
核心函数可链式操作,列级函数通常嵌套,polars
列级操作也可链式且更易读;polars
的列选择器功能强大,可基于多种条件选择列;窗口函数dplyr
用group_by()
+mutate()
,polars
用with_columns()
并定义窗口;polars
可创建列表列和嵌套框架,也可进行反操作。通过虚构数据展示了这些功能的应用,还提到了关于学习数据集的 Twitter 民意调查及polars
在处理嵌套数据结构方面的优势,如处理来自 API 的嵌套数据等。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。