生成器和迭代器

1.列表生成式

现在有个需求,看列表[0, 1, 2, 3, 4, 5],要求你把列表里的每个值加1,你怎么实现?

创新互联公司是一家专注于成都网站设计、做网站、成都外贸网站建设公司与策划设计,奉贤网站建设哪家好?创新互联公司做网站,专注于网站建设十年,网设计领域的专业建站公司;建站业务涵盖:奉贤等地区。奉贤做网站价格咨询:028-86922220

可以使用for循环,while循环
map方式
>>> a
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
>>> a = map(lambda x:x+1, a)
>>> a

>>> for i in a:print(i)
... 
3
5
7
9
11

高级方式:
列表生成式方式
>>> a = [i+1 for i in range(10)]
>>> a
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
>>> a = [i for i in range(10)]
>>> a
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>

2.生成器

2.1生成器的创建与调用

通过列表生成式,我们可以直接创建一个列表。但是,收到内存限制,列表容量是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅使用其中的几个元素,那后面的元素所占用的空间就浪费掉了。
所以,如果列表中的元素可以按照某种算法推算出来,那是否可以在循环的过程中推算出后续的元素呢?就不需要创建完整的list,从而节省大量的空间。在Python中,一边循环一边计算的机制,称为生成器:generator.
要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator
生成器的特性:
1.预先定义一个生产输的范围,使用一个生产一个,不占用内存空间
2.只能往下不断取数,不能回退
3.走到最后,报stopIteration错误

##这里生成大量的数据,需要一段时间
>>> a = [i for i in range(100000000000000)]
##列表生成式,立刻生成,因为是调用net()方法时才产生数据,调用一次产生一次
>>> a = (i for i in range(100000000000000))
>>> 
>>>
>>> a = [i for i in range(10)]
>>> a
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> g = (i*2 for i in range(10))
>>> g
 at 0x00000237FF9BF2B0>
通过next()函数获得generator的下一个返回值
>>> next(g)
0
>>> next(g)
2
>>> next(g)
4
>>>
>>> next(g)
16
>>> next(g)
18
>>> next(g)
Traceback (most recent call last):
  File "", line 1, in 
StopIteration

#可使用for循环调用
#创建了一个generator后,基本上永远不会调用next(),而是通过for循环来迭代它,并且不需要关心StopIteration的错误
>>> g = (i*2 for i in range(10))
>>> for n in g:
...     print(n)
...
0
2
4
6
8
10
12
14
16
18
>>>

2.2通过函数方式创建生成器

generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for循环无法实现的时候,可以使用函数来实现

2.2.1斐波那契数列-普通函数方式

#!/usr/bin/env python
# -*- coding:utf-8 -*-
# Author: vita

def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        print(b)
                # 相当于t = a+b, a = b,b = t,但不需要显式写出临时变量t就可以赋值
        a, b = b, a + b
        n = n + 1
    return 'done'
fib(10)

E:\PythonProject\python-test\venvP3\Scripts\python.exe E:/PythonProject/python-test/BasicGrammer/test.py
1
1
2
3
5
8
13
21
34
55

Process finished with exit code 0

仔细观察。fib函数实际上已经定义了斐波那契数列的推算规则,可以从第一个元素开始推算出后续的任意元素,这种逻辑其实已经很类似generator,实际只需要把print(b)改为yield b就变成了生成器。

2.2.2斐波那契数列-生成器方式

如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator.

#!/usr/bin/env python
# -*- coding:utf-8 -*-
# Author: vita

def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        yield b
        a, b = b, a + b
        n = n + 1
    return 'done'
# 用for循环输出内容
for i in fib(10):
    print(i)

E:\PythonProject\python-test\venvP3\Scripts\python.exe E:/PythonProject/python-test/BasicGrammer/test.py
1
1
2
3
5
8
13
21
34
55

Process finished with exit code 0

print(fib(10))

生成器和迭代器

普通函数是顺序执行的,遇到return语句或最后一行函数语句就返回数据,并冻结当前的执行过程
generator的执行流程是每次调用next()的时候执行,遇到yeild语句返回,再次调用next()时从上次yeild语句处继续执行。

#!/usr/bin/env python
# -*- coding:utf-8 -*-
# Author: vita

def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        yield b
        a, b = b, a + b
        n = n + 1
    return 'done'
data = fib(10)
print(data.__next__())
print(data.__next__())
print("做别的事情")
print(data.__next__())
print(data.__next__())
print(data.__next__())

E:\PythonProject\python-test\venvP3\Scripts\python.exe E:/PythonProject/python-test/BasicGrammer/test.py
1
1
做别的事情
2
3
5

Process finished with exit code 0

用for循环调用generator时,发现拿不到generator的return语句的返回值。如果想要拿到返回值,必须捕获StopIteration错误,返回值包含在StopIteration的value中

#!/usr/bin/env python
# -*- coding:utf-8 -*-
# Author: vita

def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        yield b
        a, b = b, a + b
        n = n + 1
    return 'done'
g = fib(10)
while True:
    try:
        x = next(g)
        print('g:', x)
    except StopIteration as e:
        print('Generator return value:', e.value)
        break

E:\PythonProject\python-test\venvP3\Scripts\python.exe E:/PythonProject/python-test/BasicGrammer/test.py
g: 1
g: 1
g: 2
g: 3
g: 5
g: 8
g: 13
g: 21
g: 34
g: 55
Generator return value: done

Process finished with exit code 0

2.3send

send作用
1.唤醒并继续执行
2.发送一个信息到生成器内部

#!/usr/bin/env python
# -*- coding:utf-8 -*-
# Author: vita

def fib(max):
    n,a,b = 0,0,1

    while n < max:
        #print(b)
        sign=yield  b
        a,b = b,a+b
        if sign=="stop":
            print(sign)

        n += 1

    return 'done'

f = fib(6)
print(next(f))
print(next(f))
print(next(f))
f.send("stop")
print(next(f))

E:\PythonProject\python-test\venvP3\Scripts\python.exe E:/PythonProject/python-test/BasicGrammer/test.py
1
1
2
stop
5

2.4range和xrange

python3中
range()就是创建了一个生成器,用到的时候才会生成数据
Python2中
range()是创建一个定义大小的列表,
xrange()是创建了一个一个生成器,和Python3中的range()相同

>python3
Python 3.6.2 (v3.6.2:5fd33b5, Jul  8 2017, 04:57:36) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> range(100000000000000000000)
range(0, 100000000000000000000)
>>> type(range(10))


>>> quit()

>python2
Python 2.7.16 (v2.7.16:413a49145e, Mar  4 2019, 01:37:19) [MSC v.1500 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> 
>>> xrange(100000000)
xrange(100000000)
>>> range(10000000)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37...]
>>> type(range(10))

>>> type(xrange(10))

3.迭代器

3.1可迭代对象

我们已经知道,可以用于for循环的数据类型有以下几种:
一类是集合数据类型,如list,tuple,dict,set,str等;
一类是generator,包括生成器和带yeild的generator function。
这些可以直接作用于for循环的对象称为可迭代对象(Iterable)
可以使用isinstance()判断一个对象是否是Iterable对象

>>> from collections import Iterable
>>> isinstance([], Iterable)
True
>>> isinstance({}, Iterable)
True
>>> isinstance('abc', Iterable)
True
>>> isinstance((x for x in range(10)), Iterable)
True
>>> isinstance(100, Iterable)
False

3.2迭代器

生成器不但可以用for循环,还可以被next()函数不断调用并返回下一个值,直到最后抛出StopIteration错误表示无法继续返回下一个值。
可以被next()函数调用并不断返回下一个值的对象称为迭代器(Iterator)
可以使用isinstance()判断一个对象是否是Iterator对象

python3
>>> from collections import Iterator
 >>> isinstance(range(10),Iterator)
False

>>> isinstance((x for x in range(10)), Iterator)
True
>>> isinstance([], Iterator)
False
>>> isinstance({}, Iterator)
False
>>> isinstance('abc', Iterator)
False

生成器都是迭代器,但list,tuple,set,dict,str虽然是可迭代对象,但不是迭代器。
可以使用iter()函数把list,str,dict,set变为迭代器

>>> isinstance(iter([]),Iterator)
True
>>> isinstance(iter(""),Iterator)
True
>>> isinstance(iter({}),Iterator)
True
>>>

为什么list,set,dict,str不是迭代器?
因为Python的迭代器对象表示的是一个数据流,Iterator对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()函数实现按需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时才会计算。
Iterator甚至可以表示一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。

4.小节

1.凡是可作用于for循环的对象都是Iterable类型;
2.凡是可作用于next()函数的对象都是Iterator类型,它们表示一个惰性计算的序列;
3.集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。
4.Python3的for循环本质上就是通过不断调用next()函数实现的,例如:

for x in [1, 2, 3, 4, 5]:
    pass
实际上完全等价于:

# 首先获得Iterator对象:
it = iter([1, 2, 3, 4, 5])
# 循环:
while True:
    try:
        # 获得下一个值:
        x = next(it)
    except StopIteration:
        # 遇到StopIteration就退出循环
        break

文章名称:生成器和迭代器
文章路径:http://myzitong.com/article/pjcjjs.html