如何拆分文件并保留每个部分的第一行？

给定： 一个带有“特殊”第一行（例如，字段名称）的大文本数据文件（例如 CSV 格式）。

需要： coreutils split -l 命令的等效项，但附加要求原始文件的标题行出现在每个结果片段的开头。

我猜一些 split 和 head 的混合物会起作用吗？

原文由 Arkady 发布，翻译遵循 CC BY-SA 4.0 许可协议

阅读 456

这是 robhruska 的 脚本清理了一下：

 tail -n +2 file.txt | split -l 4 - split_
for file in split_*
do
    head -n 1 file.txt > tmp_file
    cat "$file" >> tmp_file
    mv -f tmp_file "$file"
done

我删除了 wc ， cut ， ls 和 echo 在那些不必要的地方。我更改了一些文件名以使它们更有意义。我把它分成多行只是为了更容易阅读。

如果您想变得花哨，可以使用 mktemp 或 tempfile 创建一个临时文件名，而不是使用硬编码的文件名。

编辑

使用 GNU split 可以这样做：

 split_filter () { { head -n 1 file.txt; cat; } > "$FILE"; }; export -f split_filter; tail -n +2 file.txt | split --lines=4 --filter=split_filter - split_

为便于阅读而拆分：

 split_filter () { { head -n 1 file.txt; cat; } > "$FILE"; }
export -f split_filter
tail -n +2 file.txt | split --lines=4 --filter=split_filter - split_

当指定 --filter 时， split 为每个输出文件运行命令（在这种情况下是一个函数，必须导出）并设置变量 FILE ，命令的环境，文件名。

过滤器脚本或函数可以对输出内容甚至文件名进行任何它想要的操作。后者的一个示例可能是输出到变量目录中的固定文件名：例如 > "$FILE/data.dat" 。

原文由 Dennis Williamson 发布，翻译遵循 CC BY-SA 4.0 许可协议

如何拆分文件并保留每个部分的第一行？

你尚未登录，登录后可以

求救，我现在想批量给500多台线上linux服务器下发脚本有什么好用的图形化工具推荐嘛？

为什么在 aws 新开 ec2 机器不显示价格？

linux 如何在执行一段命令前执行一个自定义脚本?

linux中使用vim打开文件的脚本问题？

ubuntu里sudo用户打开的程序里没法使用fcitx输入法怎么办?

如何部署WGCLOUD的agent?

怎么设置 aws ec2 t2.micro 免费流量用完之后，就自动断网，避免花钱？

Stack Overflow 翻译