程序员必须要知道的几个编码知识!Python专业培训
老男孩IT教育
常见问题
2021年12月2日 14:57
众所周知,我们和朋友进行交流,通常是普通话,如果想和计算机进行交流,该如何进行呢?计算机不懂我们的话,它只知道0和1,也就是编码知识,对于从事编程行业的同学来说,了解编码知识是非常重要的,有哪些一定要牢记的编码知识呢?请看下文:
众所周知,我们和朋友进行交流,通常是普通话,如果想和计算机进行交流,该如何进行呢?计算机不懂我们的话,它只知道0和1,也就是编码知识,对于从事编程行业的同学来说,了解编码知识是非常重要的,有哪些一定要牢记的编码知识呢?请看下文:
| ASCII
是美国人开发出来的,所以在初期,只考虑到了英文编码的情况,由于英文字符较少,再加上一些特殊字符,大概有128个,完全可以用一个字节进行编码,然而还空着1位,这一位一直没有参与编码,即定义为0,这也就是所谓的ASCII编码。
| 非ASCII
随着计算机的逐渐普及,欧洲人发现ASCII的128个字符并不能满足他们的使用,比如法语,字母上方有注音符号,无法用ASCII表示,于是一些欧洲国家决定把闲置的那一位编入新的符号,这样一来,就可以满足欧洲国家的日常需求,也就是大家经常能见到的ISO-8859-1编码,也被叫做Latin1编码。
下面是中文编码:
GB2312:
为了能够使计算机认识汉字,需要对汉字进行编码,最后决定两个字节表示一个汉字,具体规则是这样的:一个小于127的字节意义与ASCII相同,但大于127字节连在一起时,表示为汉字,前面的一个字节称高字节,后面一个字节称为低字节,这样就可以组合成6763个简体汉字。
GBK:
上面所提到的GB2312编码的6763个汉字,也并不能适应所有的使用场景,比如"喆"字,于是又进行了新的扩展,规定只要第一个字节大于127就可以,不管第二个字节是否大于127,经过此改动后,收录的汉字及符号就可以达到2W多个,也就是我们常说的GBK编码。
再后来,人们继续对第二个字节进行扩展,衍生出了GB18030编码,比GBK又多出了一些字符编码。
BIG-5
上面提到的都是简体中文编码,虽然GBK和GB18030已经包含了部分繁体字,但也不全面,于是TW同胞发了专门支持繁体字的Big5编码,也就是大家常说的大五码。
关于"程序员必须要知道的几个编码知识!"的话题到这里就结束了,老男孩IT教育Python课程针对企业用人需求不断改善,并且结合市场最新技术进行精进,既可以让学员学习到最新技术,也可以提高项目实战能力。
推荐阅读:
盘点Python面试中常被问到的几种设计模式!Python全日制培训班
