postgre数据导入出现字符不支持的问题解决(Linux版)

当导入备份文件到postgre时出现一些如:

Unicode characters greater than or equal to 0x10000 are not supported  invalid byte sequence for encoding "UNICODE": 0xd6  invalid byte sequence for encoding "EUC_CN": 0xfb66
....

如上的导入出现的某些字符集不支持的问题,现解决如下:

下面我以主和备机进行说明(主机作为备份数据来源,备机作为导入已备份的数据文件):

1、进入主机,执行psql -l命令,例如:

[root@localhost]$ psql -l
      List of databases
   Name    | Owner | Encoding
-----------+-------+----------
mydata    | root | EUC_CN
template0 | root | EUC_CN
template1 | root | EUC_CN
(3 rows)

第三列的Encoding就是对应的库所使用的字符集EUC_CN

也有一种情况是使用psql -l查看所使用的字符集时并没发现Encoding这一列,例如:

[root@localhost]$ psql -l
List of databases
Database  | Owner
-----------+-------
mydata    | root
template0 | root
template1 | root
(3 rows)

那么它所使用的字符集默认就是ISO885915 (注意默认的字符集名字了)

好了,知道了主机的postgre所使用的字符集后,就好办了。

2、进入备机,执行dropdb mydata删除数据库mydata

注意,当使用dropdb mydata后,出现如下信息则说是有进程在连接postgre:

[root@localhost]$ dropdb mydata
dropdb: database removal failed: ERROR:  database "mydata" is being accessed by other users      
                 
这时,你就必须使用ps ax|grep post查出进程再使用kill ID号来杀掉相关进程了。

使用dropdb必须是postgre已经正常启动,所以当kill进程后,如果postgre没启来就要用pg_ctl start命令来启动它才可以使用dropdb命令。

3、当把数据库mydata删除掉后,就重新创建mbs这一步了,创建方法如下:

createdb -E 字符集 mydata

以上的命令格式中的“字符集”就是对应主机中所使用的字符集,比如主机使用的是EUC_CN,那么使用的命令就是 createdb -E EUC_CN mydata

4、成功创建数据库mydata后,就可以导入主机备份过来的数据文件了。

以上步骤基本解决了导入数据的问题。