三、学习py: 代码的运行方式 进制 计算机中的单位 编码
1.python代码的运行方式
1.1脚本式
文件,用解释器运行。
本质上pycharm也是脚本式。
1.2交互式
在终端直接进入python解释器,即为交互式。(也可以称进入了py的交互式环境。)
在pycharm中进入Terminal 也可以进入交互式环境。
2.进制
计算机中底层所有的数据都是以二进制存在。
3.计算机中的单位
3.1单位b(bit),位
1,1位
101,3位
3.2单位B(byte),字节
8位是一个字节
3.3单位KB(kilobyte),千字节
1024个字节就是1KB
3.4单位m g t
4.编码
编码,文字和二进制之间的一个对照表。
4.1 ASCII编码
ascii码规定使用一个字节来表示字母与二进制的对应关系。
4.2 gb-2312编码
gb-2312编码,只有中文的文字。
gbk编码,对gb2312进行扩展,包含了中日韩等文字。(其中包含了两万多的对应关系)
4.3Unicode
Unicode也被称为万国码,为全球的每个文字都分配了一个码位(二进制表示)。
ucs2:用两个字节表示一个文字
ucs4:用四个字节表示一个文字
4.4 utf-8编码
包含了所有文字与二进制对应的关系,也是全球应用最广泛的一种编码。
本质上:utf-8是对Unicode的一种压缩,用尽量少的二进制去与文字进行对应。
4.5python相关的代码
字符串(str) “dhk是一个小丑” Unicode处理 一般在内存
字节(byte) “dongganshixiaochou“ utf-8编码 or gbk编码 一般用于文件
1 | v1 = "越江".encode("utf-8") |
将一个字符串写入到一个文件中。所以在存储写入文件的时候,需要把str转化为utf-8.
1 | name = "dhk是一个小丑" |
file函数的相关操作:Python File(文件) 方法 | 菜鸟教程 (runoob.com)