1. 背景
使用socket在Java程序與C程序間進行進程間通信。本文主要描述了在同C程序進行通信的Client端的Java實現功能。
1.1. 使用的語言
Client端:Java,JVM(JDK1.3)
Server端:C,UNIX(Sun Solaris)
1.2. 討論范圍
數據發送:只涉及到Java中int整型系列的討論,包括byte,short,int。
數據接受:涉及到byte,short,int,long,float,double,char。
1.3.Java與C的數據類型的比較
Type Java C
short 2-Byte 2-Byte
int 4-Byte 4-Byte
long 8-Byte 4-Byte
float 4-Byte 4-Byte
double 8-Byte 8-Byte
boolean 1-bit
N/A
byte 1-Byte
N/A
char 2-Byte 1-Byte
2. 實現
輸出流:使用OutputStream流發送數據到C程序端。
輸入流:使用DataInputStream流從C程序端接受數據
2.1. 數據發送
由于DataOutputStream流對于Java各個基本數據類型都相應地提供了“寫”方法,如wrightShort和wrightInt等,因此當進行進程間通信(sockect通信)時,我們總是優先考慮使用DataOutputStream流。
下面我們對DataOutputStream流及其成員方法進行分析:
2.1.1. DataOutputStream流
DataOutputStream流實現了接口DataOutput。
本文只討論writeByte(int v)、writeShort(int v)和writeInt(int v)部分(這是因為我們需要發送的數據只涉及到int,short和byte,其它的long,double等則不在這里介紹),而且它們都有一個共同的特征,即唯一的int類型的輸入參數。
這些成員方法的功能描述也為我們以后手動進行字節順序轉換,提供了理論依據。
2.1.2.
網絡字節順序
規定:網絡上傳輸的數據統一采用Big Endian格式(即“高字節在前”),我們稱之為“網絡字節順序”(network byte order)。
Big Endian格式:
高字節 低字節
1 2 3 4
Byte[0] byte[1] byte[2] byte[3]輸出緩沖區
因此,無論本機字節順序采用的那種順序,在發送到網絡之前都要轉化為網絡字節順序,才能進行傳輸。特別是在Java與C兩種不同語言的應用程序間進行通信時,這一點優為重要。(若是兩個Java程序間通信時可能只要保證接受與發送采用相同的字節順序,則可以不進行轉換格式,但這種做法并不好,不具有良好的移植性)
2.1.3. 數據發送:手動字節轉換 / writeInt方法
以writeInt(int v)為例進行描述:
閱讀DataOutput的writeInt(int v)方法的文檔可知:
使用writeInt方法可以寫一個4-byte的int值v到輸出流,其字節順序為:
(byte)(0xff & (v >> 24)) byte[0] 高字節
(byte)(0xff & (v >> 16)) byte[1]
(byte)(0xff & (v >> 8)) byte[2]
(byte)(0xff & v) byte[3] 低字節
這樣的字節順序為Big Endian格式,標準的“網絡字節順序”。
但是在實際工作中輸出流采用DataOutputStream.readInt(int)方法時寫數據出錯,需要自己手動按照以上所說的對需要寫的v值進行轉換(通過移位完成),轉換的代碼如下所示,可參見程序SocketClient.java中的ByteConverter.intToByte()方法。
static public final byte[] intToByte(
int value, int offset, int length, byte[] buffer)
{
// High byte first on network
for (int i=0,j=length-1; i<length; i++,j--) {
if ( j+offset >= 0 && j+offset < 1024 ) {
buffer[j+offset] = (byte)( (value >> i*8) & 0xFF );
} else {
System.out.println (
"Array index out of the bounds:Index=" + (j+offset) );
}
}
return buffer;
}
2.2. 數據接收
同數據發送相同,由于DataInputStream流對于Java各個基本數據類型都相應地提供了“讀”方法,如readShort和readInt等,因此當進行進程間通信(sockect通信)時,我們總是優先考慮使用DataInputStream流。
而與數據發送不同的是,DataInputStream下的成員方法經實際測試,“基本上可以”根據數據類型正確讀出相應的數值。
但并非完美,特別是與不同語言的應用程序進行通信時(如C)。
根據表1(Java與C的數據類型的比較)可知:
(1)long型的字節數在Java和C中相差4個字節:
因此由readLong方法讀來的數值應進行帶符號的右移32(4-byte)位才能得到在C程序中相應的long型數值。
Type Java C
long 8-Byte 4-Byte
(2)由于Java中的char型為2個字節,C中的char型為1個字節,因此不能使用readChar方法來讀取C程序中的char數值。
然而在Java中byte型為1個字節長,因此可以使用readByte方法得到C程序中的char型數值。
Type Java C
byte 1-Byte
N/A
char 2-Byte 1-Byte
最近一個項目中
c/c++代碼和java代碼通信,c那邊用的是UINT類型,穿過來時4個字節,在這邊java要把這4個字節轉換成數值。這里就出現了一個java和c數值類型存儲順序不同的問題了。
從微觀上來看,也就是從單個byte來看,在c中和在java中存放的順序是一樣的,例如31在c中表示為0x1F(從左往右輸出表示),在java中也是如此。但是如果從宏觀,也就是每個byte之間的順序,java和c就大不一樣了。從宏觀來說java也是高高低低,高位放左邊低位放右邊,但是c中剛好相反。
如果在c中,31L的16進制從左往右輸出結果是1F00000000000000,java中是000000000000001F。