Oracle的varchar2(4000)插入汉字过长

在使用oracle时,如果在一个varchar2(4000)的字段上插入的字符过长(一般只能插入666个汉字,视字符集不同会有所不同),会导致失败,具体报错会因驱动版本不同而不同。

原因一:

666 汉字所用的编码里 (可能是 UTF8) 每个字占了 3 bytes,当存的时候, 没有作好 charset-encoding 的转换,造成你的每个 byte 被当成是 java 的一个 char (2 bytes) 来存,这时,每个汉字要用 3x2=6 bytes 存进 oracle 中,所以最多只能存到 4000/6=666 字。

原因二:
这是个OracleJDBC问题。一般直接用ps.setString()设置字符串数据时,Oracle的JDBC驱动会将中文转换为2字节或3字节,不固定的,因此经常会越界。如果改为ps.setCharacterStream()就是固定的每个中文两个字节。

解决办法:

方法一:

使用ps.setCharacterStream()插入多个字符:

原来的代码
//ps.setString(i, ((String) parameter));

String s = (String) parameter;
ps.setCharacterStream(i, new StringReader(s), s.length());

方法二:

不用PreparedStatement,而直接组成sql语句插入。

方法三:

用CLOB字段来解决。