请问如何统计梯度的通信开销?

kvstore.py中表示push和pull函数都是给engine发送了相应的指令后就返回的,因为是异步执行的。那有没有一种方法可以测量到在engine中执行push操作所花费的时间呢?