Python新手请教：如何判断一个字符串（utf8）是英语还是汉语？

cc007cc

1^# cc007cc 发表于 2008-06-17 23:07

python有函数isalpha()，但对于utf8的字符不起作用？

现在是读入一个utf8的文本文件，对每一个字符串处理的时候要判断一下是英文字符串还是中文

谢谢

emacsnw

2^# emacsnw 发表于 2008-06-18 03:19

看有没有byte大于127.

limodou

3^# limodou 发表于 2008-06-18 08:34

可以先转为unicode，就好判断了。

cc007cc

4^# cc007cc 发表于 2008-06-18 11:24

ll=tf.readline()
temp=ll.split()
qword=temp[0].decode("utf8"

这样应该就转换成unicode的编码了吧怎么判断呢
不好意思不熟悉这个请大家指点

limodou

5^# limodou 发表于 2008-06-18 12:20

简单点就是按2楼的方法来做
如

ord(qword[0]) >127 #汉字

or

qword[0] > chr(127) #汉字

cc007cc

6^# cc007cc 发表于 2008-06-18 14:21

QUOTE:

原帖由 limodou 于 2008-6-18 12:20 发表
简单点就是按2楼的方法来做
如

ord(qword[0]) >127 #汉字

or

qword[0] > chr(127) #汉字

谢谢！第一种方法可以 ord（qword[0]）>127 可以判断
第二种都小于chr（127）？？

很简单的问题只是不知道相关函数谢谢limodou 热心指教

limodou

7^# limodou 发表于 2008-06-18 17:35

可能第二种要使用unichr(127)