找回密码
 会员注册
查看: 22|回复: 0

python如何解决中文乱码问题

[复制链接]

2万

主题

0

回帖

7万

积分

超级版主

积分
72033
发表于 2024-9-7 12:40:30 | 显示全部楼层 |阅读模式
1、demo.py文件和编码声明都为GBK这种方法比较笨,就是把demo.py文件改为GBK存储,而且编码声明也是GBK,个人不推荐。# encoding:gbks = "中文"print sprint repr(s)2、中文用unicode表示只要在中文前面加上个小u标记,后面的中文就用unicode存储了。# encoding:utf-8s = u"中文"print sprint repr(s)cmd下是可以打印unicode字符的,如下:3、把中文强制转换为GBK或者unicode编码强制转换为unicode编码,在Python中编码是可以互相转换的,比如从utf-8转换为gbk,不同编码之间不能直接转换,需要通过unicode字符集中间过渡下,从上面基础知识可知unicode是一种字符集,不属于编码,而utf-8是具体实现unicode思想的一种编码。utf-8转换为unicode是一种解码过程,通过decode可从utf-8解码成unicode。# encoding:utf-8s = "中文"u = s.decode('utf-8')print uprint type(u)print repr(u)强制转换为gbk编码,上一步已经从utf-8转换为unicode了,从unicode是编码的过程,通过encode实现。# encoding:utf-8s = "中文"u = s.decode('utf-8')g = u.encode('gbk')print gprint type(g)print repr(g)总结windowscmd窗口下不支持utf-8,想要显示中文必须转换为gbk或者unicode,而Pythonidle中这三种编码都支持。中文乱码的出现都是由于编码不一致导致的,存储的是用utf-8,打印的时候用gbk就会乱码了,所有要保证不乱码尽量保持统一,建议全部使用unicode。decode解码从其它编码变成unicode叫解码,解码用的方法是decode,第一个参数为被解码的字符串原始编码格式,如果写错了也会报错。比如s是utf-8,用gbk去解码就会报错。# encoding:utf-8s = "中文"u = s.decode('gbk')print uprint repr(u)小提示在Pythonidle和cmd下直接输入s="中文"会以gbk编码的,如果在文件中输入s="中文"且文件存储格式为utf-8,那么s是以utf-8编码存储的,有点不一样曾经踩过坑,及时Pythonidle成功了文件运行的时候也可能失败。encode编码不可以直接从utf-8转换为gbk,必须经过unicode中间转换,这点很重要,被编码的原始字符串一定要为unicode,否则会报错。raw_inputraw_input是获取用户输入值的,获取到的用户输入值和当前运行环境编码有关,比如cmd下默认编码是gbk,那么输入的汉字就是以gbk编码,而不管demo.py文件编码格式和编码声明。# encoding:utf-8s = raw_input("input something: ")print sprint type(s)print repr(s)GBK编码一个汉字两个字节,UTF-8一个汉字通常3个字节。细心的朋友已经注意了,raw_input的提示语我用的是英文,那改成中文看看,果真出现乱码了。# encoding:utf-8s = raw_input("请输入中文汉字:")print sprint type(s)print repr(s)怎么办呢?把提示字符串强制为gbk编码就好,unicode和utf-8都不可以。# encoding:utf-8s = raw_input(u"请输入中文汉字:".encode('gbk'))print sprint type(s)print repr(s)相等陷阱“中文”这两个字符串用不同的编码存储是不一样的,utf-8编码和gbk编码存储的“中文”都不一样。总结想要不乱码,记住以下5点法则:(1)文件存储为utf-8格式,编码声明为utf-8,#encoding:utf-8。(2)出现汉字的地方前面加u。(3)不同编码之间不能直接转换,要经过unicode中间跳转。(4)cmd下不支持utf-8编码。(5)raw_input提示字符串只能为gbk编码。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2025-1-10 23:08 , Processed in 1.123693 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表