python 2.7 如何判断 Unicode 编码字符是否为汉字，如何判断unicode编码句子中是否含有汉字

文章目录

python 2.7 如何判断 Unicode 编码字符是否为汉字，如何判断unicode编码句子中是否含有汉字

		发表于: 2018-09-20 08:42:08 | 已被阅读: 818 | 分类于: Python

对于计算机来说，一切都是 0 1 组成的数字，汉字也不例外。因此对于 python 来说，汉字也是可以比较大小的，所以，判断一个 unicode字符是否汉字，只需要判断该字符是否在


        第一个汉字

和


        最后一个汉字

之间即可。

查阅资料，发现对于Unicode编码的汉字，最小为


        \u4e00

，最大为


        \u9fa5

，所以，自然的，python 判断一个Unicode字符是否为汉字的代码可以如下写：

def IsChineseChar(uchar):
    if uchar >= u'\u4e00' and uchar<=u'\u9fa5':
        return True
    return False

测试之：

print IsChineseChar(u'A'),  IsChineseChar(u'我')

发现符合预期：

# python t.py 
False True

进一步的，如果想用python判断一句unicode编码的话中是否含有中文，代码可以如下写：

def IsChineseCharInside(sentence):
        for uchar in sentence:
                if uchar >= u'\u4e00' and uchar<=u'\u9fa5':
                        return True
        return False

最终测试完整代码如下：

#encoding=utf8

def IsChineseChar(uchar):
    if uchar >= u'\u4e00' and uchar<=u'\u9fa5':
        return True
    return False

def IsChineseCharInside(sentence):
        for uchar in sentence:
                if uchar >= u'\u4e00' and uchar<=u'\u9fa5':
                        return True
        return False

print IsChineseChar(u'A'), IsChineseChar(u'我')
print IsChineseCharInside(u'Aasdas fsaf vs'), IsChineseCharInside(u'dasdf 我asd das')

执行之：

# python t.py 
False True
False True

python 2.7 如何判断 Unicode 编码字符是否为汉字，如何判断unicode编码句子中是否含有汉字

付费内容: 1.01 元，输入手机号或者邮箱查看

更多阅读