Python 基础语法一

数据类型

一、整数

Python 可以处理任意大小的整数，当然包括负整数，在 Python 程序中，整数的表示方法和数学上的写法一模一样，例如：1，100，-8080，0，等等。

计算机由于使用二进制，所以，有时候用十六进制表示整数比较方便，十六进制用 0x 前缀和 0-9，a-f 表示，例如：0xff00，0xa5b4c3d2，等等。

二、浮点数

浮点数也就是小数，之所以称为浮点数，是因为按照科学记数法表示时，一个浮点数的小数点位置是可变的，比如，1.23x10^9 和 12.3x10^8 是相等的。浮点数可以用数学写法，如 1.23，3.14，-9.01，等等。但是对于很大或很小的浮点数，就必须用科学计数法表示，把 10 用 e 替代，1.23x10^9 就是 1.23e9，或者 12.3e8，0.000012 可以写成 1.2e-5，等等。

整数和浮点数在计算机内部存储的方式是不同的，整数运算永远是精确的（除法难道也是精确的？是的！），而浮点数运算则可能会有四舍五入的误差。

三、字符串

字符串是以 '' 或 "" 括起来的任意文本，比如**'abc'，"xyz"等等。请注意，''或""**本身只是一种表示方式，不是字符串的一部分，因此，字符串 'abc' 只有 a，b，c 这 3 个字符。

四、布尔值

布尔值和布尔代数的表示完全一致，一个布尔值只有 True、False 两种值，要么是 True，要么是 False，在 Python 中，可以直接用 True、False 表示布尔值（请注意大小写），也可以通过布尔运算计算出来。

布尔值可以用 and、or 和 not 运算。

and 运算是与运算，只有所有都为 True，and 运算结果才是 True。

or 运算是或运算，只要其中有一个为 True，or 运算结果就是 True。

not 运算是非运算，它是一个单目运算符，把 True 变成 False，False 变成 True。

五、空值

空值是 Python 里一个特殊的值，用 None 表示。None 不能理解为 0，因为 0 是有意义的，而 None 是一个特殊的空值。

print 语句

print 语句可以向屏幕上输出指定的文字。比如输出'hello, world'，用代码实现如下：


print 'hello, world'

Python 的注释

Python 的注释以 # 开头，后面的文字直到行尾都算注释


# 这一行全部都是注释...
print 'hello' # 这也是注释

Python 变量

在 Python 中，变量的概念基本上和初中代数的方程变量是一致的。

例如，对于方程式 y=x*x ，x 就是变量。当 x=2 时，计算结果是 4，当 x=5 时，计算结果是 25。

只是在计算机程序中，变量不仅可以是数字，还可以是任意数据类型。

在 Python 程序中，变量是用一个变量名表示，变量名必须是大小写英文、数字和下划线（_）的组合，且不能用数字开头，比如：


a = 1

变量 a 是一个整数。


t_007 = 'T007'

变量 t_007 是一个字符串。
在 Python 中，等号 = 是赋值语句，可以把任意数据类型赋值给变量，同一个变量可以反复赋值，而且可以是不同类型的变量，例如：


a = 123    # a是整数
print a
a = 'imooc'   # a变为字符串
print a

这种变量本身类型不固定的语言称之为动态语言，与之对应的是静态语言。

静态语言在定义变量时必须指定变量类型，如果赋值的时候类型不匹配，就会报错。例如 Java 是静态语言，赋值语句如下（// 表示注释）：


int a = 123; // a是整数类型变量
a = "mooc"; // 错误：不能把字符串赋给整型变量

和静态语言相比，动态语言更灵活，就是这个原因。

请不要把赋值语句的等号等同于数学的等号。比如下面的代码：


x = 10
x = x + 2

如果从数学上理解 x = x + 2 那无论如何是不成立的，在程序中，赋值语句先计算右侧的表达式 x + 2，得到结果 12，再赋给变量 x。由于 x 之前的值是 10，重新赋值后，x 的值变成 12。

最后，理解变量在计算机内存中的表示也非常重要。当我们写：a = 'ABC' 时，Python 解释器干了两件事情：

1. 在内存中创建了一个 'ABC' 的字符串；

2. 在内存中创建了一个名为 a 的变量，并把它指向 'ABC'。

也可以把一个变量 a 赋值给另一个变量 b，这个操作实际上是把变量 b 指向变量 a 所指向的数据，例如下面的代码：


a = 'ABC'
b = a
a = 'XYZ'
print b

最后一行打印出变量 b 的内容到底是'ABC'呢还是'XYZ'？如果从数学意义上理解，就会错误地得出 b 和 a 相同，也应该是'XYZ'，但实际上 b 的值是'ABC'，让我们一行一行地执行代码，就可以看到到底发生了什么事：

执行 a = 'ABC'，解释器创建了字符串 'ABC'和变量 a，并把 a 指向 'ABC'：

执行 b = a，解释器创建了变量 b，并把 b 指向 a 指向的字符串'ABC'：

执行 a = 'XYZ'，解释器创建了字符串'XYZ'，并把 a 的指向改为'XYZ'，但 b 并没有更改：

所以，最后打印变量 b 的结果自然是 'ABC' 了。

Python 中定义字符串

前面我们讲解了什么是字符串。字符串可以用 '' 或者 "" 括起来表示。

如果字符串本身包含 ' 怎么办？比如我们要表示字符串 I'm OK，这时，可以用 " " 括起来表示：


"I'm OK"

类似的，如果字符串包含 "，我们就可以用 ' ' 括起来表示：


'Learn "Python" in imooc'

如果字符串既包含 ' 又包含 " 怎么办？

这个时候，就需要对字符串的某些特殊字符进行“转义”，Python 字符串用 \ 进行转义。

要表示字符串 Bob said "I'm OK".
由于 ' 和 " 会引起歧义，因此，我们在它前面插入一个 \ 表示这是一个普通字符，不代表字符串的起始，因此，这个字符串又可以表示为


'Bob said \"I\'m OK\".'

**注意：**转义字符 \ 不计入字符串的内容中。

常用的转义字符还有：


\n 表示换行
\t 表示一个制表符
\\ 表示 \ 字符本身

Python 中 raw 字符串与多行字符串

如果一个字符串包含很多需要转义的字符，对每一个字符都进行转义会很麻烦。为了避免这种情况，我们可以在字符串前面加个前缀 r ，表示这是一个 raw 字符串，里面的字符就不需要转义了。例如：


r'\(~_~)/ \(~_~)/'

但是 r'...' 表示法不能表示多行字符串，也不能表示包含 ' 和 " 的字符串（为什么？）

如果要表示多行字符串，可以用 '''...''' 表示：


'''Line 1
Line 2
Line 3'''

上面这个字符串的表示方法和下面的是完全一样的：


'Line 1\nLine 2\nLine 3'

还可以在多行字符串前面添加 r，把这个多行字符串也变成一个 raw 字符串：


r'''Python is created by "Guido".
It is free and easy to learn.
Let's start learn Python in imooc!'''

Python 中 Unicode 字符串

字符串还有一个编码问题。

因为计算机只能处理数字，如果要处理文本，就必须先把文本转换为数字才能处理。最早的计算机在设计时采用 8 个比特（bit）作为一个字节（byte），所以，一个字节能表示的最大的整数就是 255（二进制 11111111=十进制 255），0 - 255 被用来表示大小写英文字母、数字和一些符号，这个编码表被称为 ASCII 编码，比如大写字母 A 的编码是 65，小写字母 z 的编码是 122。

如果要表示中文，显然一个字节是不够的，至少需要两个字节，而且还不能和 ASCII 编码冲突，所以，中国制定了 GB2312 编码，用来把中文编进去。

类似的，日文和韩文等其他语言也有这个问题。为了统一所有文字的编码，Unicode 应运而生。Unicode 把所有语言都统一到一套编码里，这样就不会再有乱码问题了。

Unicode 通常用两个字节表示一个字符，原有的英文编码从单字节变成双字节，只需要把高字节全部填为 0 就可以。

因为 Python 的诞生比 Unicode 标准发布的时间还要早，所以最早的 Python 只支持 ASCII 编码，普通的字符串'ABC'在 Python 内部都是 ASCII 编码的。

Python 在后来添加了对 Unicode 的支持，以 Unicode 表示的字符串用 u'...'表示，比如：


print u'中文'
中文

注意: 不加 u ，中文就不能正常显示。

Unicode 字符串除了多了一个 u 之外，与普通字符串没啥区别，转义字符和多行表示法仍然有效：

转义：


u'中文\n日文\n韩文'

多行：


u'''第一行
第二行'''

raw+ 多行：


ur'''Python的Unicode字符串支持"中文",
"日文",
"韩文"等多种语言'''

如果中文字符串在 Python 环境下遇到 UnicodeDecodeError，这是因为.py 文件保存的格式有问题。可以在第一行添加注释


# -*- coding: utf-8 -*-

目的是告诉 Python 解释器，用 UTF-8 编码读取源代码。然后用 Notepad++ 另存为... 并选择 UTF-8 格式保存。

Python 中整数和浮点数

Python 支持对整数和浮点数直接进行四则混合运算，运算规则和数学上的四则运算规则完全一致。

基本的运算：


1 + 2 + 3   # ==> 6
4 * 5 - 6   # ==> 14
7.5 / 8 + 2.1   # ==> 3.0375

使用括号可以提升优先级，这和数学运算完全一致，注意只能使用小括号，但是括号可以嵌套很多层：


(1 + 2) * 3    # ==> 9
(2.2 + 3.3) / (1.5 * (9 - 0.3))    # ==> 0.42145593869731807

和数学运算不同的地方是，Python 的整数运算结果仍然是整数，浮点数运算结果仍然是浮点数：


1 + 2    # ==> 整数 3
1.0 + 2.0    # ==> 浮点数 3.0

但是整数和浮点数混合运算的结果就变成浮点数了：


1 + 2.0    # ==> 浮点数 3.0

为什么要区分整数运算和浮点数运算呢？这是因为整数运算的结果永远是精确的，而浮点数运算的结果不一定精确，因为计算机内存再大，也无法精确表示出无限循环小数，比如 0.1 换成二进制表示就是无限循环小数。

那整数的除法运算遇到除不尽的时候，结果难道不是浮点数吗？我们来试一下：


11 / 4    # ==> 2

令很多初学者惊讶的是，Python 的整数除法，即使除不尽，结果仍然是整数，余数直接被扔掉。不过，Python 提供了一个求余的运算 % 可以计算余数：


11 % 4    # ==> 3

如果我们要计算 11 / 4 的精确结果，按照“整数和浮点数混合运算的结果是浮点数”的法则，把两个数中的一个变成浮点数再运算就没问题了：


11.0 / 4    # ==> 2.75

Python 中布尔类型

我们已经了解了 Python 支持布尔类型的数据，布尔类型只有 True 和 False 两种值，但是布尔类型有以下几种运算：

与运算：只有两个布尔值都为 True 时，计算结果才为 True。


True and True   # ==> True
True and False   # ==> False
False and True   # ==> False
False and False   # ==> False

或运算：只要有一个布尔值为 True，计算结果就是 True。


True or True   # ==> True
True or False   # ==> True
False or True   # ==> True
False or False   # ==> False

非运算：把 True 变为 False，或者把 False 变为 True：


not True   # ==> False
not False   # ==> True

布尔运算在计算机中用来做条件判断，根据计算结果为 True 或者 False，计算机可以自动执行不同的后续代码。

在 Python 中，布尔类型还可以与其他数据类型做 and、or 和 not 运算，请看下面的代码：


a = True
print a and 'a=T' or 'a=F'

计算结果不是布尔类型，而是字符串 'a=T'，这是为什么呢？

因为 Python 把 0、空字符串'' 和 None 看成 False，其他数值和非空字符串都看成 True，所以：


True and 'a=T' 计算结果是 'a=T'
继续计算 'a=T' or 'a=F' 计算结果还是 'a=T'

要解释上述结果，又涉及到 and 和 or 运算的一条重要法则：短路计算。

在计算 a and b 时，如果 a 是 False，则根据与运算法则，整个结果必定为 False，因此返回 a；如果 a 是 True，则整个计算结果必定取决与 b，因此返回 b。

2. 在计算 a or b 时，如果 a 是 True，则根据或运算法则，整个计算结果必定为 True，因此返回 a；如果 a 是 False，则整个计算结果必定取决于 b，因此返回 b。

所以 Python 解释器在做布尔运算时，只要能提前确定计算结果，它就不会往后算了，直接返回结果。

Python 创建 list

Python 内置的一种数据类型是列表：list。list 是一种有序的集合，可以随时添加和删除其中的元素。

比如，列出班里所有同学的名字，就可以用一个 list 表示：


>>> ['Michael', 'Bob', 'Tracy']
['Michael', 'Bob', 'Tracy']

list 是数学意义上的有序集合，也就是说，list 中的元素是按照顺序排列的。

构造 list 非常简单，按照上面的代码，直接用 [ ] 把 list 的所有元素都括起来，就是一个 list 对象。通常，我们会把 list 赋值给一个变量，这样，就可以通过变量来引用 list：


>>> classmates = ['Michael', 'Bob', 'Tracy']
>>> classmates # 打印classmates变量的内容
['Michael', 'Bob', 'Tracy']

由于 Python 是动态语言，所以 list 中包含的元素并不要求都必须是同一种数据类型，我们完全可以在 list 中包含各种数据：


>>> L = ['Michael', 100, True]

一个元素也没有的 list，就是空 list：


>>> empty_list = []

Python 按照索引访问 list

由于 list 是一个有序集合，所以，我们可以用一个 list 按分数从高到低表示出班里的 3 个同学：


>>> L = ['Adam', 'Lisa', 'Bart']

那我们如何从 list 中获取指定第 N 名的同学呢？方法是通过索引来获取 list 中的指定元素。

需要特别注意的是，索引从 0 开始，也就是说，第一个元素的索引是 0，第二个元素的索引是 1，以此类推。

因此，要打印第一名同学的名字，用 L[0]:


>>> print L[0]
Adam

要打印第二名同学的名字，用 L[1]:


>>> print L[1]
Lisa

要打印第三名同学的名字，用 L[2]:


>>> print L[2]
Bart

要打印第四名同学的名字，用 L[3]:


>>> print L[3]
Traceback (most recent call last):
  File "", line 1, in 
IndexError: list index out of range

报错了！IndexError 意思就是索引超出了范围，因为上面的 list 只有 3 个元素，有效的索引是 0，1，2。

所以，使用索引时，千万注意不要越界。

Python 之倒序访问 list

我们还是用一个 list 按分数从高到低表示出班里的 3 个同学：


>>> L = ['Adam', 'Lisa', 'Bart']

这时，老师说，请分数最低的同学站出来。

要写代码完成这个任务，我们可以先数一数这个 list，发现它包含 3 个元素，因此，最后一个元素的索引是 2：


>>> print L[2]
Bart

有没有更简单的方法？

有！

Bart 同学是最后一名，俗称倒数第一，所以，我们可以用 -1 这个索引来表示最后一个元素：


>>> print L[-1]
Bart

Bart 同学表示躺枪。

类似的，倒数第二用 -2 表示，倒数第三用 -3 表示，倒数第四用 -4 表示：


>>> print L[-2]
Lisa
>>> print L[-3]
Adam
>>> print L[-4]
Traceback (most recent call last):
  File "", line 1, in 
IndexError: list index out of range

L[-4] 报错了，因为倒数第四不存在，一共只有 3 个元素。

使用倒序索引时，也要注意不要越界。

Python 之添加新元素

现在，班里有 3 名同学：


>>> L = ['Adam', 'Lisa', 'Bart']

今天，班里转来一名新同学 Paul，如何把新同学添加到现有的 list 中呢？

第一个办法是用 list 的 append() 方法，把新同学追加到 list 的末尾：


>>> L = ['Adam', 'Lisa', 'Bart']
>>> L.append('Paul')
>>> print L
['Adam', 'Lisa', 'Bart', 'Paul']

**append()**总是把新的元素添加到 list 的尾部。

如果 Paul 同学表示自己总是考满分，要求添加到第一的位置，怎么办？

方法是用 list 的 insert() 方法，它接受两个参数，第一个参数是索引号，第二个参数是待添加的新元素：


>>> L = ['Adam', 'Lisa', 'Bart']
>>> L.insert(0, 'Paul')
>>> print L
['Paul', 'Adam', 'Lisa', 'Bart']

L.insert(0, 'Paul') 的意思是，'Paul'将被添加到索引为 0 的位置上（也就是第一个），而原来索引为 0 的 Adam 同学，以及后面的所有同学，都自动向后移动一位。

Python 从 list 删除元素

Paul 同学刚来几天又要转走了，那么我们怎么把 Paul 从现有的 list 中删除呢？

如果 Paul 同学排在最后一个，我们可以用 list 的 pop() 方法删除：


>>> L = ['Adam', 'Lisa', 'Bart', 'Paul']
>>> L.pop()
'Paul'
>>> print L
['Adam', 'Lisa', 'Bart']

**pop()**方法总是删掉 list 的最后一个元素，并且它还返回这个元素，所以我们执行 L.pop() 后，会打印出 'Paul'。

如果 Paul 同学不是排在最后一个怎么办？比如 Paul 同学排在第三：


>>> L = ['Adam', 'Lisa', 'Paul', 'Bart']

要把 Paul 踢出 list，我们就必须先定位 Paul 的位置。由于 Paul 的索引是 2，因此，用 pop(2) 把 Paul 删掉：


>>> L.pop(2)
'Paul'
>>> print L
['Adam', 'Lisa', 'Bart']

Python 中替换元素

假设现在班里仍然是 3 名同学：


>>> L = ['Adam', 'Lisa', 'Bart']

现在，Bart 同学要转学走了，碰巧来了一个 Paul 同学，要更新班级成员名单，我们可以先把 Bart 删掉，再把 Paul 添加进来。

另一个办法是直接用 Paul 把 Bart 给替换掉：


>>> L[2] = 'Paul'
>>> print L
L = ['Adam', 'Lisa', 'Paul']

对 list 中的某一个索引赋值，就可以直接用新的元素替换掉原来的元素，list 包含的元素个数保持不变。

由于 Bart 还可以用 -1 做索引，因此，下面的代码也可以完成同样的替换工作：


>>> L[-1] = 'Paul'

Python 之创建 tuple

tuple 是另一种有序的列表，中文翻译为“ 元组 ”。tuple 和 list 非常类似，但是，tuple 一旦创建完毕，就不能修改了。

同样是表示班里同学的名称，用 tuple 表示如下：


>>> t = ('Adam', 'Lisa', 'Bart')

创建 tuple 和创建 list 唯一不同之处是用 ( ) 替代了 [ ]。

现在，这个 t 就不能改变了，tuple 没有 append()方法，也没有 insert()和 pop()方法。所以，新同学没法直接往 tuple 中添加，老同学想退出 tuple 也不行。

获取 tuple 元素的方式和 list 是一模一样的，我们可以正常使用 t[0]，t[-1]等索引方式访问元素，但是不能赋值成别的元素，不信可以试试：


>>> t[0] = 'Paul'
Traceback (most recent call last):
  File "", line 1, in 
TypeError: 'tuple' object does not support item assignment

Python 之创建单元素 tuple

tuple 和 list 一样，可以包含 0 个、1 个和任意多个元素。

包含多个元素的 tuple，前面我们已经创建过了。

包含 0 个元素的 tuple，也就是空 tuple，直接用 ()表示：


>>> t = ()
>>> print t
()

创建包含 1 个元素的 tuple 呢？来试试：


>>> t = (1)
>>> print t
1

好像哪里不对！t 不是 tuple ，而是整数 1。为什么呢？

因为 () 既可以表示 tuple，又可以作为括号表示运算时的优先级，结果 (1) 被 Python 解释器计算出结果 1，导致我们得到的不是 tuple，而是整数 1。

正是因为用()定义单元素的 tuple 有歧义，所以 Python 规定，单元素 tuple 要多加一个逗号“,”，这样就避免了歧义：


>>> t = (1,)
>>> print t
(1,)

Python 在打印单元素 tuple 时，也自动添加了一个“,”，为了更明确地告诉你这是一个 tuple。

多元素 tuple 加不加这个额外的“,”效果是一样的：


>>> t = (1, 2, 3,)
>>> print t
(1, 2, 3)

Python 之“可变”的 tuple

前面我们看到了 tuple 一旦创建就不能修改。现在，我们来看一个“可变”的 tuple：


>>> t = ('a', 'b', ['A', 'B'])

注意到 t 有 3 个元素：'a'，'b'和一个 list：['A', 'B']。list 作为一个整体是 tuple 的第 3 个元素。list 对象可以通过 t[2] 拿到：


>>> L = t[2]

然后，我们把 list 的两个元素改一改：


>>> L[0] = 'X'
>>> L[1] = 'Y'

再看看 tuple 的内容：


>>> print t
('a', 'b', ['X', 'Y'])

不是说 tuple 一旦定义后就不可变了吗？怎么现在又变了？

别急，我们先看看定义的时候 tuple 包含的 3 个元素：

当我们把 list 的元素**'A'和'B'修改为'X'和'Y'**后，tuple 变为：

表面上看，tuple 的元素确实变了，但其实变的不是 tuple 的元素，而是 list 的元素。

tuple 一开始指向的 list 并没有改成别的 list，所以，tuple 所谓的**“不变”是说，tuple 的每个元素，指向永远不变。即指向'a'，就不能改成指向'b'**，指向一个 list，就不能改成指向其他对象，但指向的这个 list 本身是可变的！

理解了**“指向不变”**后，要创建一个内容也不变的 tuple 怎么做？那就必须保证 tuple 的每一个元素本身也不能变。