如何从文件内容创建Java字符串?

我现在一直在使用下面的习语。 它似乎是最广泛的,至少在我访问的网站上。

有没有更好的/不同的方式来读取文件到Java中的字符串?

private String readFile(String file) throws IOException {
    BufferedReader reader = new BufferedReader(new FileReader (file));
    String         line = null;
    StringBuilder  stringBuilder = new StringBuilder();
    String         ls = System.getProperty("line.separator");

    try {
        while((line = reader.readLine()) != null) {
            stringBuilder.append(line);
            stringBuilder.append(ls);
        }

        return stringBuilder.toString();
    } finally {
        reader.close();
    }
}

阅读文件中的所有文本

下面是一个紧凑而强大的Java 7成语,包含在一个实用程序方法中:

static String readFile(String path, Charset encoding) 
  throws IOException 
{
  byte[] encoded = Files.readAllBytes(Paths.get(path));
  return new String(encoded, encoding);
}

从文件中读取文本行

Java 7添加了一种便捷方法来将文件读取为文本行,表示为List<String> 。 这种方法是“有损”的,因为行分隔符从每行的末尾剥离。

List<String> lines = Files.readAllLines(Paths.get(path), encoding);

在Java 8中, BufferedReader添加了一个新方法lines()来产生一个Stream<String> 。 如果在读取文件时遇到IOException ,它将被包装在UncheckedIOException ,因为Stream不接受抛出检查异常的lambdas。

try (BufferedReader r = Files.newBufferedReader(path, encoding)) {
  r.lines().forEach(System.out::println);
}

还有一个Files.lines()方法,它做了非常类似的事情,直接返回Stream<String> 。 但我不喜欢它。 Stream需要close()调用; 这在API上很少记录,我怀疑很多人甚至没有注意到Streamclose()方法。 所以你的代码看起来非常相似,就像这样:

try (Stream<String> lines = Files.lines(path, encoding)) {
  lines.forEach(System.out::println);
}

不同之处在于你将一个Stream分配给一个变量,我试着避免这种做法,这样我就不会不小心尝试两次调用流。

内存利用率

第一种保存换行符的方法可以临时需要几倍于文件大小的内存,因为在短时间内原始文件内容(一个字节数组)和解码字符(即使经过编码也是16位如文件中的8位)一次驻留在内存中。 将文件应用到您认为相对于可用内存较小的文件是最安全的。

第二种方法,即读取行,通常具有更高的内存效率,因为用于解码的输入字节缓冲区不需要包含整个文件。 但是,它仍然不适用于相对于可用内存而言非常大的文件。

为了阅读大文件,你需要为你的程序设计一个不同的设计,从一个流中读取一段文本,处理它,然后转向下一个,重新使用同一个固定大小的内存块。 这里“大”取决于计算机规格。 如今,这个门槛可能是几千兆字节的RAM。 如果您的输入“记录”碰巧是单独的行,则使用Stream<String>的第三种方法是执行此操作的一种方法。 (使用BufferedReaderreadLine()方法是与此方法等效的过程。)

字符编码

原始文章中的示例中缺少的一件事是字符编码。 有些特殊情况下平台的默认设置是你想要的,但它们很少,你应该能够证明你的选择是正确的。

StandardCharsets类为所有Java运行时所需的编码定义了一些常量:

String content = readFile("test.txt", StandardCharsets.UTF_8);

平台默认可从Charset类本身获得:

String content = readFile("test.txt", Charset.defaultCharset());

注意:这个答案在很大程度上取代了我的Java 6版本。 Java 7的实用程序安全地简化了代码,并且使用映射字节缓冲区的旧答案阻止了已读取的文件被删除,直到映射的缓冲区被垃圾收集。 您可以通过此答案上的“编辑”链接查看旧版本。


Commons FileUtils.readFileToString

public static String readFileToString(File file)
                       throws IOException

使用VM的默认编码将文件的内容读入字符串。 该文件始终关闭。

参数:

  • file - 要读取的文件不能为空
  • 返回:文件内容,不能为空

    抛出: IOException - 如果发生I / O错误

    从以下版本开始:Commons IO 1.3.1

    该类使用(间接)的代码是:

    Apache License 2.0下的IOUtils.java。

    public static long copyLarge(InputStream input, OutputStream output)
           throws IOException {
       byte[] buffer = new byte[DEFAULT_BUFFER_SIZE];
       long count = 0;
       int n = 0;
       while (-1 != (n = input.read(buffer))) {
           output.write(buffer, 0, n);
           count += n;
       }
       return count;
    }
    

    它与Ritche_W使用的非常相似。


    从这个页面可以看到一个非常精简

    Scanner scanner = new Scanner( new File("poem.txt") );
    String text = scanner.useDelimiter("A").next();
    scanner.close(); // Put this call in a finally block
    

    要么

    Scanner scanner = new Scanner( new File("poem.txt"), "UTF-8" );
    String text = scanner.useDelimiter("A").next();
    scanner.close(); // Put this call in a finally block
    

    如果你想设置字符集

    链接地址: http://www.djcxy.com/p/5943.html

    上一篇: How do I create a Java string from the contents of a file?

    下一篇: WPF global exception handler