Java NIO 基础（一）

Java NIO 教程

NIO是什么？

它是Java1.4之后出现的IO API，与传统IO和网络API不同，具有非阻塞的特点。

在BIO中我们使用字节流和字符流。NIO中我们使用channel和buffer。数据总是从一个channel中读取到buffer中，或者从buffer中写入到channel中。

NIO的意思是一个线程可以让一个channel将数据读取到buffer中，与此同时，这个线程还可以做其他的事情，线程可以等到数据全部进入buffer之后再处理数据，从buffer中写入线程也是一样的。

selector：选择器是一个NIO当中的概念，指的是一个对象，能监视多个channel发生的事件（如连接建立，数据到达等）。因此，一个单线程可以监视多个channel的数据。

Java NIO 总览

Java NIO的三个核心基础组件，

Channels
Buffers
Selectors

其余的诸如Pipe，FileLcok都是在使用以上三个核心组件时帮助更好使用的工具类。

Channels和Buffers的关系

所有的IO操作在NIO中都是以Channel开始的。一个Channel就像一个流。从Channel中，数据可以被读取到buffer里，也可以从buffer里写到Channel中。

基本的Channel实现有以下这些：

FileChannel
DatagramChannel
SocketChannel
ServerSocketChannel

涵盖了UDP,TCP以及文件的IO操作。

核心的buffer实现有这些

ByteBuffer
CharBuffer
DoubleBuffer
FloatBuffer
IntBuffer
LongBuffer
ShortBuffer

涵盖了所有的基本数据类型（4类8种，除了Boolean）。也有其他的buffer如MappedByteBuffer，此处不讲。

selectors

selector允许一个线程来监视多个Channel，这在当你的应用建立了多个连接，但是每个连接吞吐量都较小的时候是可行的。例如：一个聊天服务器。图为一个线程使用selector处理三个channel。

要使用一个Selector，你要先注册这个selector的Channels。然后你调用selector的select()方法。这个方法会阻塞，直到它注册的channels当中有一个准备好了的事件发生了。当select()方法返回的时候，线程可以处理这些事件，如新的连接的到来，数据收到了等。

NIO Channels

NIO channel和流很近似但是也有一些不同。

你既可以读取也可以写入到channel，流只能读取或者写入，inputStream和outputStream。
channel可以异步地读和写。
channel永远都是从一个buffer中读或者写入到一个buffer中去。

channel的实现

以下是NIO中最重要的几个channel的实现。

FileChannel 向文件当中读写数据。
DatagramChannel 通过UDP协议向网络读写数据
SocketChannel 通过TCP协议向网络读写数据
ServerSocketChannel 以一个web服务器的形式，监听到来的TCP连接，对每个连接建立一个SocketChannel。

一个简单的channel例子

使用一个FileChannel将数据读入一个buffer

     RandomAccessFile aFile = new RandomAccessFile("data/nio-data.txt", "rw");
    FileChannel inChannel = aFile.getChannel();

    ByteBuffer buf = ByteBuffer.allocate(48);

    int bytesRead = inChannel.read(buf);
    while (bytesRead != -1) {

      System.out.println("Read " + bytesRead);
      buf.flip();

      while(buf.hasRemaining()){
          System.out.print((char) buf.get());
      }

      buf.clear();
      bytesRead = inChannel.read(buf);
    }
    aFile.close();

buf.flip()的意思是读写转换，首先你读入一个buffer，然后你flip，转换读写，然后再从buffer中读出，buffer的操作接下来会讲。

NIO buffer

NIO buffer在与NIO Channel交互时使用，数据从channel中读取出来放入buffer，或者从buffer中读取出来写入channel。

buffer就是一块内存，你可以写入数据，并且在之后读取它。这块内存被包装成NIO buffer对象，它提供了一些方法来让你更简单地操作内存。

buffer的基本使用

使用buffer读写数据基本上分为以下4部操作：

将数据写入buffer
调用buffer.flip()
将数据从buffer中读取出来
调用buffer.clear()或者buffer.compact()

在写buffer的时候，buffer会跟踪写入了多少数据，需要读buffer的时候，需要调用flip()来将buffer从写模式切换成读模式，读模式中只能读取写入的数据，而非整个buffer。

当数据都读完了，你需要清空buffer以供下次使用，可以有2种方法来操作：

调用clear()
调用compact()

区别：clear方法清空整个buffer，compact方法只清除你已经读取的数据，未读取的数据会被移到buffer的开头，此时写入数据会从当前数据的末尾开始。

一个简单的buffer使用例子：

RandomAccessFile aFile = new RandomAccessFile("data/nio-data.txt", "rw");
FileChannel inChannel = aFile.getChannel();

//创建一个容量为48的ByteBuffer
ByteBuffer buf = ByteBuffer.allocate(48);

int bytesRead = inChannel.read(buf); //从channel中读（取数据然后写）入buffer
//下面是读取buffer
while (bytesRead != -1) {

      buf.flip();                      //转换buffer为读模式

     while(buf.hasRemaining()){
          System.out.print((char) buf.get()); // 一次读取一个byte
      }

  buf.clear();                         //清空buffer准备下一次写入
  bytesRead = inChannel.read(buf);    
}
aFile.close();

buffer的Capacity,Position和Limit

buffer有3个属性需要熟悉以理解buffer的工作原理：

容量（Capacity）：缓冲区能够容纳的数据元素的最大数量。容量在缓冲区创建时被设定，并且永远不能被改变。
上界（Limit）：写模式中等价于buffer的大小，即capacity；读模式中为当前缓冲区中一共有多少数据，即可读的最大位置。这意味着当调用filp()方法切换成读模式时，limit的值变成position的值，而position重新指向0.
位置（Position）：下一个要被读或写的元素的位置。初始化为0，buffer满时，position最大值为capacity-1。切换成读模式的时候，position指向0。Position会自动由相应的 get( )和 put( )函数更新。

position和limit的值在读/写模式中是不一样的。
capacity的值永远表示buffer的大小。

下图解释了在读/写模式中Capacity,Position和Limit的意思。

buffer的种类

Java NIO中有以下这些buffer种类：

ByteBuffer
MappedByteBuffer //比较特殊，会在以后讲解
CharBuffer
DoubleBuffer
FloatBuffer
IntBuffer
LongBuffer
ShortBuffer

创建一个buffer

获得一个buffer 之前必须先分配一块内存，每个buffer类都有一个静态方法allocate() 来做这件事。

下例为创建一个容量为48byte的ByteBuffer：
ByteBuffer buf = ByteBuffer.allocate(48);

创建一个1024个字符的CharBuffer
CharBuffer buf = CharBuffer.allocate(1024);

将数据写入buffer

写入buffer的方法有2种：

1.从一个channel中写入buffer。
2.调用buffer的put()方法来自行写入数据。

例：

int bytesRead = inChannel.read(buf); //从channel读入buffer

buf.put(127); //自行写入buffer

put方法有很多的重载形式。以供你用各种不同的方法写入buffer中，比如从一个特定的position，或者写入一个array，详见JavaDoc。

flip()

flip方法将写模式切换成读模式，调用flip()方法会将limit设置为position，将position设置回0。

换句话说，position标志着写模式中写到哪里，切换成读模式之后，limit标志着之前写到哪里，也就是现在能读到哪里。

从buffer中读取数据

有2种方法可以从buffer中读取数据。

1.从buffer中读取数据到channel中。
2.使用buffer的get()方法自行从buffer中读出数据。

例子：

//从buffer中读取数据到channel中
int bytesWritten = inChannel.write(buf);

//使用buffer的get()方法自行从buffer中读出数据
byte aByte = buf.get();

get方法有很多的重载形式。以供你用各种不同的方法读取buffer中的数据。例如从特定位置读取数据，或者读一个数组出来。详见JavaDoc。

rewind()

rewind()方法将position设置为0，但是不会动buffer里的数据，这样可以从头开始重新读取数据，limit的值不会变，这意味着limit依旧标志着能读多少数据。

clear()和compact()

当你读完所有的数据想要重新写入数据时，你可以调用clear或者compact方法。

当你调用clear()方法的时候，position被设置为0，limit被设置为capacity，换句话说，buffer的数据虽然都还在，但是buffer被初始化了，处于可以被重写的状态。

这也就意味着如果buffer中还有没被读取的数据，在执行clear之后，你无法知道数据读到哪儿了，剩下的数据还有多少。

如果还有没有读完的数据，但是你想先写数据，可以用compact()方法，这样未读数据会放在buffer前端，可以在未读数据之后跟着写新的数据。compact()会复制未读数据到buffer前端，然后设置position为未读数据单位后面紧跟的位置。limit还是设置为capacity，这和clear是一样的。现在buffer处于可以写的状态，但是不会覆盖之前未读完的数据。

mark()和reset()

你可以通过调用buffer.mark()来mark一个buffer中给定的位置。然后你就可以用buffer.reset()方法来讲position设置回之前mark的位置。

例子：

buffer.mark();

//调用buffer.get()方法若干次，e.g. 比如在做parsing的时候

buffer.reset();  //set position back to mark.

equals() 和 compareTo()

使用这2种方法能够比较2个buffer。

equals()

equals()方法用于判断2个buffer是否相等，2个buffer是equal的，当它们：

是同一种数据类型的buffer。
buffer中未读取的bytes，chars等数据个数是一样的，即（limit-position）相等，capacity不需要相等，剩余数据的索引也不需要相等。
未读取的bytes，chars等内容是一模一样的，即各自[position，limit-1]索引的数据要完全相等。

如你所见，equals()方法只比较buffer的部分内容，而不是buffer中所有的数据，事实上，它只比较buffer中剩余的元素是否一样。

compareTo()

compareTo()方法比较两个buffer的剩余元素（字节，字符等），用于例如：排序。

在下列情况下，缓冲区被认为比另一个缓冲区“小”：

比较是针对每个缓冲区你剩余数据（从 position 到 limit）进行的，与它们在 equals() 中的方式相同，直到不相等的元素被发现或者到达缓冲区的上界。如果一个缓冲区在不相等元素发现前已经被耗尽，较短的缓冲区被认为是小于较长的缓冲区。

if (buffer1.compareTo(buffer2) < 0) { 
// do sth, it means buffer2 < buffer1，not buffer1 < buffer2
    doSth(); 
}