python之timeit模块

timeit模块:

  • timeit 模块定义了接受两个参数的 Timer 类。两个参数都是字符串。 第一个参数是你要计时的语句或者函数。 传递给 Timer 的第二个参数是为第一个参数语句构建环境的导入语句。 从内部讲, timeit 构建起一个独立的虚拟环境, 手工地执行建立语句,然后手工地编译和执行被计时语句。

  • 一旦有了 Timer 对象,最简单的事就是调用 timeit(),它接受一个参数为每个测试中调用被计时语句的次数,默认为一百万次;返回所耗费的秒数。

  • Timer 对象的另一个主要方法是 repeat(), 它接受两个可选参数。 第一个参数是重复整个测试的次数,第二个参数是每个测试中调用被计时语句的次数。 两个参数都是可选的,它们的默认值分别是 3 和1000000。 repeat() 方法返回以秒记录的每个测试循环的耗时列表。Python 有一个方便的 min 函数可以把输入的列表返回成最小值,如: min(t.repeat(3, 1000000))

  测试一个列表推导式与for循环的时间

import timeit
foooo = """
sum = []
for i in range(1000):
    sum.append(i)
"""

print(timeit.timeit(stmt="[i for i in range(1000)]", number=100000))
print(timeit.timeit(stmt=foooo, number=100000))

#res:
#3.2855970134734345
#8.19918414604134

  使用列表推导式要比正常使用list追加元素 通过10w次循环会快上近5秒左右,速度快上近三倍。

  timeit 模块抽象出了;两个可以直接使用的方法,包了一层可以让我们不用关心内部的实现,下面看一下模块里面的代码:

def timeit(stmt="pass", setup="pass", timer=default_timer,
           number=default_number):
    """Convenience function to create Timer object and call timeit method."""
    return Timer(stmt, setup, timer).timeit(number)

def repeat(stmt="pass", setup="pass", timer=default_timer,
           repeat=default_repeat, number=default_number):
    """Convenience function to create Timer object and call repeat method."""
    return Timer(stmt, setup, timer).repeat(repeat, number)

  可以看到这两个方法都是对Timer类包了一层这几个参数:

  stmt: 这个参数就是statement,可以把要进行计算时间的代码放在里面。他可以直接接受字符串的表达式,也可以接受单个变量,也可以接受函数。

  setup:  这个参数可以将stmt的环境传进去。比如各种import和参数什么的。

  timer: 这个参数一般使用不到,具体使用可以参看文档。

  Timer类下面还有repeat和timeit方法 使用也非常方便就是 timeit.timeit 和  timeit.repeat。

  一个就是上面例子的timeit,一个就是repeat 其实repeat就比timeit多了一个执行Timer次数的参数。这个执行次数会以数组的形式返回.

import timeit

foooo = """
sum = []
for i in range(1000):
    sum.append(i)
"""

print(timeit.repeat(stmt="[i for i in range(1000)]", repeat=2, number=100000))
print(min(timeit.repeat(stmt="[i for i in range(1000)]", repeat=2, number=100000)))

#res:
#[3.4540683642063277, 3.300991128415932]
#3.321008256502136

  我们可以根据此,对所有执行时间取min最小值,平均值,最大值得到我们想要的数据。

# coding: utf-8
import timeit

# 初始化类
x = """
say_hi.ParseFromString(p)
"""

y = """
simplejson.loads(x)
"""

print(timeit.timeit(stmt=x, setup="import say_hi_pb2;"
                                  "say_hi = say_hi_pb2.SayHi();"
                                  "say_hi.id = 13423;"
                                  "say_hi.something = 'axiba';"
                                  "say_hi.extra_info = 'xiba';"
                                  "p =say_hi.SerializeToString()", number=1000000))

print(timeit.timeit(stmt=y, setup="import simplejson; "
                                  "json={"
                                  "'id': 13423,"
                                  "'something': 'axiba',"
                                  "'extra_info': 'xiba',"
                                  "};"
                                  "x = simplejson.dumps(json)", number=1000000))
 

另外需要补充一点是,如果你想直接 stmt 那里执行函数。可以把函数申明在当前文件中,然后在 stmt = ‘func()’ 执行函数。然后使用 setup = ‘from __main__ import func’ 即可,如果要import 多个需要使用 setup = from __main__ import func; import simplejson'

  

def test1():
    n=0
    for i in range(101):
        n+=i
    return n
def test2():
    return sum(range(101))
def test3():
    return sum(x for x in range(101))
if __name__=='__main__':
    from timeit import Timer
    t1=Timer("test1()","from __main__ import test1")
    t2=Timer("test2()","from __main__ import test2")
    t3=Timer("test3()","from __main__ import test3")
    print(t1.timeit(10000))
    print(t2.timeit(10000))
    print(t3.timeit(10000))
    print(t1.repeat(3,10000))
    print(t2.repeat(3,10000))
    print(t3.repeat(3,10000))
    t4 = timeit.timeit(stmt=test1,setup="from __main__ import test1",number=10000)
    t5 = timeit.timeit(stmt=test2,setup="from __main__ import test2",number=10000)
    t6 = timeit.timeit(stmt=test3,setup="from __main__ import test3",number=10000)
    print(t4) #0.05130029071325269
    print(t5) #0.015494466822610305
    print(t6) #0.05650903115721077
    print(timeit.repeat(stmt=test1,setup="from __main__ import test1",number=10000)) # [0.05308853391023148, 0.04544335904366706, 0.05969025402337652]
    print(timeit.repeat(stmt=test2,setup="from __main__ import test2",number=10000)) # [0.012824560678924846, 0.017111019558035345, 0.01429126826003152]
    print(timeit.repeat(stmt=test3,setup="from __main__ import test3",number=10000)) # [0.07385010910706968, 0.06244617606430164, 0.06273494371932059]

#res:
0.043916918200588385
0.014892355541932578
0.05214884436618059
[0.04372713709398021, 0.04197132052492908, 0.04255431716177577]
[0.014356804181737959, 0.012456603785177323, 0.012629659578433372]
[0.0543709217115389, 0.05334180294099272, 0.05334931226535494]