[python] 遇到个问题..好象是个问题..

[python] 遇到个问题..好象是个问题..

不知道是哪里出了问题..

u = '%E7%94%A8%E6%B3%95'.replace('%','\\x')
print u # 输出 \xE7\x94\xA8\xE6\xB3\x95
uu = unicode(u,'utf-8') #这里用的是变量 u
print uu.encode('gbk') #输出 \xE7\x94\xA8\xE6\xB3\x95


但如果这样写:
u = '%E7%94%A8%E6%B3%95'.replace('%','\\x')
print u # 输出 \xE7\x94\xA8\xE6\xB3\x95
uu = unicode('\xE7\x94\xA8\xE6\xB3\x95','utf-8') #这里用的是变量 u 的结果(不一样?!)
print uu.encode('gbk') #输出 '用法' <-- 我要的结果..


有什么区别? 变量 u 是str类型的,这个有什么说法?

替换后是\\xE7\\x94\\xA8\\xE6\\xB3\\x95,所以输出为\xE7\x94\xA8\xE6\xB3\x95,用urllib.unquote
print urllib.unquote('%E7%94%A8%E6%B3%95')
输出乱码: 鐢ㄦ硶
谢谢2楼的

好象是\x 和字符的 \x问题.

还是没能搞清楚

def main():
    u = '%E7%94%A8%E6%B3%95'.replace('%','\\x')
    print u # 输出 \xE7\x94\xA8\xE6\xB3\x95
    uu = unicode('\xE7\x94\xA8\xE6\xB3\x95','utf-8')
    print uu.encode('gbk') #输出 '用法'
   
   

if __name__ == '__main__':
    main()
    #print '\xE7' #加上这句,第五行结果会改变?什么道理..


come on ..


QUOTE:
原帖由 sh_royan 于 2008-1-24 09:34 发表
print urllib.unquote('%E7%94%A8%E6%B3%95')
输出乱码: 鐢ㄦ硶

print urllib.unquote('%E7%94%A8%E6%B3%95').decode('utf-8').encode('gbk')

其他的还是转意的问题,实在转不过弯的话,别直接print,用pprint.print输出看下就清楚了
谢谢332 方法可行
是反斜杠的问题吧。
觉得这应该挺基础的。
\ 是转意符,本身并没有意义,只是在“编程”表示的时候起到一个转意的作用。
编程是后的 \\ = \
然而,在字符串里的 \\=\\ 同理,\=\。所以如果你要用字符串直接替代那里的的话。应该改成
\\xE7\\x94\\xA8\\xE6\\xB3\\x95

个人拙见。
恩 谢谢北斗,转意问题知道了
但5楼的那个还是不清楚,最后那句 print '\xE7' 不加就正常,加上后会出问题.这和上面的print有嘛关系?