我现在有一个行数很多的数据集，需要用这些数据集做分类算法，数据实在太多需要采样数据集部分如下：比如说我想每取10行放到一个新的文件中，就是取这个数据集的第1行，第11行，第21行。。。直到文本最后，放到一个新的文件中，用Python如何实现呢？希望的结果如下：

Python如何将文本每隔N行取一条放到一个新的文本文件中？

发布于
2016-06-07

我现在有一个行数很多的数据集，需要用这些数据集做分类算法，数据实在太多需要采样
数据集部分如下：
图片描述
比如说我想每取10行放到一个新的文件中，就是取这个数据集的第1行，第11行，第21行。。。直到文本最后，放到一个新的文件中，用Python如何实现呢？

希望的结果如下：
图片描述

python 文本处理

阅读 30.2k

3 个回答

moling3650

✓ 已被采纳

with open('file.txt') as reader, open('newfile.txt', 'w') as writer:
    for index, line in enumerate(reader):
        if index % 10 == 0:
            writer.write(line)

mylu2012

511

发布于
2016-06-07

新手上路，请多包涵

一行行读，读一行行号加一。如果行号对n取余等于1。将这行写入新文件

morriaty_the_murderer

36421218

发布于
2016-06-11

# 先得知道文件有多少行，linux下 `wc -l filename`，或者
line_count = sum(1 for i in open(filename))
# 然后pandas
pd.read_csv(filename, skiprows=(i for i in range(line_count) if i % 9 == 0))

# 如果文件不大，可以一次性读入内存 
pd.read_csv(filename)[::10]

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

Python如何将文本每隔N行取一条放到一个新的文本文件中？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

如何使用 python 代码实现迅雷磁力链接资源的下载？

如何实现一个深拷贝函数？

请问，FastAPI如何获取到前端上传的二进制文件并且返回？

浏览器能请求到数据怎么换了api工具或是爬虫都没数据了呢？

Python 成员变量在多个子类实例间共享，如何避免？