我有一个 .csv 文件,其中包含 500 多家公司的数据。文件中的每一行都引用一个特定的公司数据集。我需要解析这个文件并从每个文件中推断数据以调用 4 个不同的 Web 服务。
.csv 文件的第一行包含列名称。我正在尝试编写一个采用字符串参数的方法,这与 .csv 文件中的列标题有关。
基于此参数,我希望该方法使用 Java 8 的 Stream 功能解析文件,并返回从每一行/公司的列标题中获取的数据列表。
我觉得我让它变得比需要的更复杂,但想不出更有效的方法来实现我的目标。
任何想法或想法将不胜感激。
通过 stackoverflow 搜索,我发现了以下类似但不完全相同的帖子。 使用新的 Java 8 Streams API 解析 CSV 文件以获取唯一行
public static List<String> getData(String titleToSearchFor) throws IOException{
Path path = Paths.get("arbitoryPath");
int titleIndex;
String retrievedData = null;
List<String> listOfData = null;
if(Files.exists(path)){
try(Stream<String> lines = Files.lines(path)){
List<String> columns = lines
.findFirst()
.map((line) -> Arrays.asList(line.split(",")))
.get();
titleIndex = columns.indexOf(titleToSearchFor);
List<List<String>> values = lines
.skip(1)
.map(line -> Arrays.asList(line.split(",")))
.filter(list -> list.get(titleIndex) != null)
.collect(Collectors.toList());
String[] line = (String[]) values.stream().flatMap(l -> l.stream()).collect(Collectors.collectingAndThen(
Collectors.toList(),
list -> list.toArray()));
String value = line[titleIndex];
if(value != null && value.trim().length() > 0){
retrievedData = value;
}
listOfData.add(retrievedData);
}
}
return listOfTitles;
}
谢谢
原文由 Michael Heneghan 发布,翻译遵循 CC BY-SA 4.0 许可协议
您不应该重新发明轮子并使用通用的 csv 解析器库。例如,您可以只使用 Apache Commons CSV 。
它将为您处理很多事情并且更具可读性。还有 OpenCSV ,它更强大并且带有基于注释的数据类映射。
编辑:无论如何,如果你真的想自己做,看看 这个 例子。