scala中dataframe怎么做提取一列到set?

dataframe中有2列叫"ID"和"topicNo"
保存的都是INT类型
我现在想把topicNo是某一个值(比如:2)的ID都提取出来
并保存到集合set中
要怎么写?
谢谢🙏

阅读 1.7k
1 个回答

gpt给的可以试试

可以使用pandas的DataFrame自带的筛选功能来实现该功能,然后使用python基础类型set来保存提取出来的ID值,具体的代码如下:# 导入pandas库
import pandas as pd

定义DataFrame数据

df = pd.DataFrame({'ID': [1, 2, 3, 1, 5], 'topicNo': [2, 3, 2, 4, 2]})

使用条件筛选进行筛选

id_set = set(df[df['topicNo'] == 2]['ID'])

输出结果

print(id_set)
以上代码中,我们定义了一个包含ID和topicNo两个列的DataFrame,然后使用df['topicNo'] == 2的条件筛选出topicNo等于2的行,接着set(df[df['topicNo'] == 2]['ID'])语句将只筛选出来的ID值保存到集合id_set中。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题