Python新手请教:如何判断一个字符串(utf8)是英语还是汉语?

Python新手请教:如何判断一个字符串(utf8)是英语还是汉语?

python有函数isalpha(),但对于utf8的字符不起作用?

现在是读入一个utf8的文本文件,对每一个字符串处理的时候要判断一下是英文字符串还是中文

谢谢
看有没有byte大于127.
可以先转为unicode,就好判断了。
ll=tf.readline()
temp=ll.split()
qword=temp[0].decode("utf8"

这样应该就转换成unicode的编码了吧 怎么判断呢
不好意思 不熟悉这个 请大家指点
简单点就是按2楼的方法来做


ord(qword[0]) >127 #汉字

or

qword[0] > chr(127) #汉字


QUOTE:
原帖由 limodou 于 2008-6-18 12:20 发表
简单点就是按2楼的方法来做


ord(qword[0]) >127 #汉字

or

qword[0] > chr(127) #汉字

谢谢! 第一种方法可以 ord(qword[0])>127 可以判断
第二种都小于chr(127)??

很简单的问题 只是不知道相关函数 谢谢limodou 热心指教
可能第二种要使用unichr(127)