使用 Java 8 Stream 解析 .csv 文件

新手上路,请多包涵

我有一个 .csv 文件,其中包含 500 多家公司的数据。文件中的每一行都引用一个特定的公司数据集。我需要解析这个文件并从每个文件中推断数据以调用 4 个不同的 Web 服务。

.csv 文件的第一行包含列名称。我正在尝试编写一个采用字符串参数的方法,这与 .csv 文件中的列标题有关。

基于此参数,我希望该方法使用 Java 8 的 Stream 功能解析文件,并返回从每一行/公司的列标题中获取的数据列表。

我觉得我让它变得比需要的更复杂,但想不出更有效的方法来实现我的目标。

任何想法或想法将不胜感激。

通过 stackoverflow 搜索,我发现了以下类似但不完全相同的帖子。 使用新的 Java 8 Streams API 解析 CSV 文件以获取唯一行

    public static List<String> getData(String titleToSearchFor) throws IOException{
    Path path = Paths.get("arbitoryPath");
    int titleIndex;
    String retrievedData = null;
    List<String> listOfData = null;

    if(Files.exists(path)){
        try(Stream<String> lines = Files.lines(path)){
            List<String> columns = lines
                    .findFirst()
                    .map((line) -> Arrays.asList(line.split(",")))
                    .get();

            titleIndex = columns.indexOf(titleToSearchFor);

            List<List<String>> values = lines
                    .skip(1)
                    .map(line -> Arrays.asList(line.split(",")))
                    .filter(list -> list.get(titleIndex) != null)
                    .collect(Collectors.toList());

            String[] line = (String[]) values.stream().flatMap(l -> l.stream()).collect(Collectors.collectingAndThen(
                    Collectors.toList(),
                    list -> list.toArray()));
            String value = line[titleIndex];
            if(value != null && value.trim().length() > 0){
                retrievedData = value;
            }
            listOfData.add(retrievedData);
        }
    }
    return listOfTitles;
}

谢谢

原文由 Michael Heneghan 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 713
1 个回答

您不应该重新发明轮子并使用通用的 csv 解析器库。例如,您可以只使用 Apache Commons CSV

它将为您处理很多事情并且更具可读性。还有 OpenCSV ,它更强大并且带有基于注释的数据类映射。

  try (Reader reader = Files.newBufferedReader(Paths.get("file.csv"));
            CSVParser csvParser = new CSVParser(reader, CSVFormat.DEFAULT
                    .withFirstRecordAsHeader()
        ) {
            for (CSVRecord csvRecord : csvParser) {
                // Access
                String name = csvRecord.get("MyColumn");
                // (..)
          }

编辑:无论如何,如果你真的想自己做,看看 这个 例子。

原文由 ixeption 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题