大家好,各位老大帮帮忙,我想问下PYTHON 处理XML 字符的问题

大家好,各位老大帮帮忙,我想问下PYTHON 处理XML 字符的问题

用 python 处理XML字符
思路

读入 XML 字符串(UTF-8)编码

处理XML

处理好之后,输出到 XML文件(用GB2312编码)

这里遇到问题 ,原来文件中 的 汉字 半角字符  变成了 以 & 开头的编码  ,比如 " 变成了 & q u o t

想问下各位,怎么保持 字符 不变呢?
你用什么模块来解析?
我用的是 minidom
你可以尝试下
1. 文件开头coding 为 utf-8
2. 然后写文件时候每行转下:decode('utf-8').encode('gbk')

minidom只支持utf-8