场景一个100多万条的csv文件, 读取, 每行要处理, 处理时间平均每行250ms±. 方案一: 每读一行, 处理一行, 处理好了, 读下一行. 方案二: 一次读取出来, 放入内存, 然后遍历处理每一行. 后来, 发现一个java进程不够跑, 想多开几个, 发现开了3个的时候, Linux会自动给我杀死1-2个. 请问, 这种场景, 应该哪种方案更合理些? 原理又是什么呢?

使用 Scanner 读取文件流， nextLine() 获取文件行，封装处理逻辑到任务（ task ）放到线程池中处理。大文件、高行数的文件最好使用流的方式处理，避免一次吃掉太多内存; 线程池复用线程，节约资源。

开一个线程去读，放到缓存中，可以批量放入，达到一定阈值暂停放入。开多个线程去缓存中拿数据，然后去处理。

两个java进程同时读取一个文件(持续时间较长)会影响磁盘效率吗?

Nisus

200106985

发布于
2018-08-04

场景

一个100多万条的csv文件, 读取, 每行要处理, 处理时间平均每行250ms±.

方案一: 每读一行, 处理一行, 处理好了, 读下一行.
方案二: 一次读取出来, 放入内存, 然后遍历处理每一行.

后来, 发现一个java进程不够跑, 想多开几个, 发现开了3个的时候, Linux会自动给我杀死1-2个.

请问, 这种场景, 应该哪种方案更合理些? 原理又是什么呢?

java io 输入流

阅读 4.6k

2 个回答

得票最新

krun

6.9k1726

发布于
2018-08-04

✓ 已被采纳

使用 Scanner 读取文件流，nextLine() 获取文件行，封装处理逻辑到任务（task）放到线程池中处理。

大文件、高行数的文件最好使用流的方式处理，避免一次吃掉太多内存;
线程池复用线程，节约资源。

一粒麦子

233

发布于
2018-08-04

开一个线程去读，放到缓存中，可以批量放入，达到一定阈值暂停放入。
开多个线程去缓存中拿数据，然后去处理。

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

两个java进程同时读取一个文件(持续时间较长)会影响磁盘效率吗?

场景

你尚未登录，登录后可以

Java 开发 URL 匹配问题？

诺依框架自动生成代码前端Vue3提交数据，后端Java没收到问题出在哪里？

WSL里的Ubuntu系统开发Spring Boot报错Project build error: Non-readable POM ？

请问是否有什么方案实现不同用户之间本地数据库的同步呢？

MyBatis Plus 如何对敏感字段加解密（使用哪种加密方式）？

一个类实现接口并且继承父类使用Spring aop 失效?

idea 中有很多个 yml配置文件 , 如果想查找 a.b.c.d.e属性有什么好的办法吗?

两个java进程同时读取一个文件(持续时间较长)会影响磁盘效率吗?

场景

你尚未登录，登录后可以

Java 开发 URL 匹配问题？

诺依框架自动生成代码前端Vue3提交数据，后端Java没收到问题出在哪里？

WSL里的Ubuntu系统开发Spring Boot报错Project build error: Non-readable POM ？

请问是否有什么方案实现不同用户之间本地数据库的同步呢？

MyBatis Plus 如何对敏感字段加解密（使用哪种加密方式）？

一个类实现接口并且继承父类 使用Spring aop 失效?

idea 中 有很多个 yml配置文件 , 如果想查找 a.b.c.d.e属性 有什么好的办法吗?

一个类实现接口并且继承父类使用Spring aop 失效?

idea 中有很多个 yml配置文件 , 如果想查找 a.b.c.d.e属性有什么好的办法吗?