艾锑知识 |一文读懂时延敏感网络的调度整形机制
2020-03-07 19:52 作者:艾锑无限 浏览量:
生命中需要什么样的同行者
我在上学的时候就看过这样一个故事,是说丰田汽车公司生产线发生了事故,他的管理者透过提问的方式找到了这次事故的根本原因,那时候自己还不是教练,只是觉得这个管理者很厉害,可以透过提问就能找到问题的本源,以后如果自己走上了工作岗位也要向他学习.
但后来创业,经历的事越来越多,发现这种追问方式有时有效,有时也是没有效的,有效的是能解决当下的问题,无效的是问题还会经常重复性发生.当时并没有领悟到问题的根源是什么,只是觉得可能自己的能力有限,后来学习了教练,开始给企业高管和CEO做教练时,逐渐发现这样的提问为什么只能解决当下发生的问题,原因是管理者的焦点只放在这件事情的本身,而没有真正关注到人,人是一切问题的根源.
让我们来看一下关注事的提问和关注人的提问两个版本到底有什么不同:
关注事的版本:
丰田汽车公司前副社长大野耐一,用5Why法追问生产线停机原因的案例最为典型。
一次,大野耐一发现生产线上的机器总是停转,工人修过多次但仍不见好转。他忍不住问工人:
一问:“为什么机器停了?”
答:“因为超过了负荷,保险丝就断了。”
二问:“为什么超负荷呢?”
答:“因为轴承的润滑不够。”
三问:“为什么润滑不够?”
答:“因为润滑泵吸不上油来。”
四问:“为什么吸不上油来?”
答:“因为油泵轴磨损、松动了。”
五问:“为什么磨损了呢?”
再答:“因为没有安装过滤器,混进了铁屑等杂质。噢……我们这就去安装。”
经过连续五次不停地问“为什么”, 工人找到问题的真正原因和解决方法。
关注人的版本:
一问:“发生了什么?”
答:“我们的机器修过了好多次都没有解决问题,也不知道怎么了.
”
二问:“如果你经常生病,也经常去医院,但总还是生病,你会如何思考?
”
答:“我可能会想是不是这家医院有问题,或者这个医生不行,但每次来的时候他都能给冶好,隔几天又发生了状况,这会让我想想进入我身体的食物、水、空气、还有我居住的环境等是否有问题,从医院和自身两个方面入手来思考这个问题吧.
”
三问:“非常好的思考方式,这样的思考如果放在这台机器上,你会有什么发现?
”
答:“我觉得也可以从两个方面入手,一方面是否我们的修理能力有问题,我们可以找其他师傅来试试,还有一方面,不一定是我们能力问题,有可能是这台机器与其它设备连接原因,可以检查一下和这台设备有关的所有方面,看是否能找到根本的原因.
”
四问:“你这样思考的好处是什么?
”
答:“这样思考就能让我看清整个问题系统的原因,而不是紧盯在这个问题上,还能让我打开更多的思路,这样下次遇到类似问题的时候,我就能立刻找到问题的本质,而不是在同一个问题上不断重复处理浪费时间.
五问:“还有什么呢?
”
答:“这对我自身的能力也是极大的提高,也会让我从一个修理工的思维变成一个管理工程师的思维,在未来我相信自己也能成为一名团队的管理人员.
”
六问:“好的非常棒,那你觉得这件事你什么时间能处理完呢?
”
答:“立刻,马上来系统全面的检查,我相信一会就能找到根本原因,彻底的解决这个问题.
”
七问:“好的,透过这次谈话,你最大的学习是什么?
”
答:“我体验到自己内在是有智慧的,这让我很惊讶,你并没有告诉我怎么做,却启发了我的思维,让我看见自己是有能力解决一切的问题,只是以前给了自己太多的限制,在修不好的时候,内心里就已经下了决定,这个机器就是坏的,就是有问题的,怎么修都不会修好的,基于结果我证明自己是对的,但如果我能像您启发我的那样,去想我要什么,去突破内在的限制,去打开自己的思维,去看见自己想要的未来,我相信,这对于我一生的成长都是至关重要的,谢谢您.
”
八问:“好的,加油,期待你成长过程中的好消息.
”
透过上面的案例我们发现,关注人的提问,焦点始终放在这个人身上,这个人要什么,怎样帮助他去获得自己想要的,当他发生改变的时候,他的世界也就变了,他世界里遇到的问题也都不是问题了,我相信下次这个人在遇到类似这些问题时,他就会启动自主的思考,从而一一化解.
关注事的提问者只能算是个管理者,这个管理者只是运用了提问的技巧,机械式的解决了当下遇到的问题.而关注人的提问,才是真正的教练,因为他未必了解机器的原理,但他了解人,并启动了人的生命力,他知道人产生问题最大的根源是自我设限,所以很多时候我们的困难和挑战,不是没有能力去实现,而是没有打开自己的能量,让自己的能力释放出来,才会让我们陷入混沌和迷茫,我们的思维和内心的能量一旦打开,每个人都将无所不能.
无论是在生活中,还是在企业中,我们遇到的每个人都是创造力的天才,但很多时候就像掉进了泥潭中,有力却无计可施,如果是这样,记得找一位愿意关注你,关注你内在发生了什么,关注你想要成为一个什么样的人,关注你渴望的是什么,关注你内心真正的想法的人,也许这个人就能帮你从泥潭中走出来,还能陪你一起箭步如飞的前行.
你的生命中有这样的人吗?
艾锑知识 |一文读懂时延敏感网络的调度整形机制
一、什么是时延敏感网络
时延敏感网络(TSN, Time Sensitive Network)是指能保证时延敏感流的服务质量,实现低时延、低抖动和零丢包率的网络。
时延敏感流可分为周期时延敏感流(PTS, Periodic Time Sensitive),比如工厂里的循环控制指令、同步信息,和非周期/零星时延敏感流(STS,Sporadic Time Sensitive),比如事件告警信息。
对于周期时延敏感流,一般采用同步的调度整形机制,即要求全网设备进行精准的纳秒级时钟同步,其最早的思想来自时间触发以太网(TTE, Time-Triggered Ethernet),当前研究的机制包括时间感知整形(TAS)、循环排队转发(CQF)、基于信用整形(CBS)。
对于零星时延敏感流,一般采用异步的调度整形机制,即不需要全网时钟同步,当前的研究机制包括基于紧急度的调度(Urgency-Based Scheduler,UBS)、帕特诺斯特机制(Paternoster)和帧抢占(Frame Preemption)。
看到这么多机制和新名词,它们各自有什么作用,又有什么关联和区别,大脑已经反应不过来了对不对?没关系,忘掉以上名词,接下来小编将带领大家化繁为简、抽丝剥茧、拨云见日,直击时延敏感网络调度整形机制的本质。
二、什么是调度整形机制
调度整形机制是交换机中的两种服务质量保障机制,调度是指队列调度,一般实现在交换机的出端口,包含进入队列、根据调度算法选择发送队列、出队传输三个部分;整形是指流量整形,通过限制端口的转发速率从而防止交换机内部或下一跳出现拥塞。
由于异步调度整形机制无法保证包的最坏时延满足一定阈值,只能保证包的平均时延和同步方法相当,且时延抖动比较大,在网络拥塞的情况下时延敏感流很容易产生丢包,当前的异步机制并不成熟,为更好的阐明时延敏感网络的本质,后文主要先讨论使用同步机制传输周期时延敏感流(PTS)的场景。
三、如何实现低时延、低抖动和零丢包率
那么时延敏感网络如何才能实现低时延呢?首先,网络的每跳时延可分为链路传播时延、交换机处理时延、出端口排队时延三部分,而端到端时延为逐跳时延求和。链路时延和处理时延基本为固定值,所以减少时延必须要减少排队时延,即时延敏感网络的本质就是不排队:先通过优先级队列将时延敏感流和尽力而为流隔开,再从时间上(划分时隙)或空间上(规划路由)将同样的时延敏感流隔开。
实现低时延后,包在交换机里的停留时间很短,包的累积不会超过队列缓冲区大小,从而实现零丢包率;同时,抖动是指时延的变化差值,低时延降低了最坏时延,让时延上界靠近时延下界,减小了时延的变化区间,从而也实现了低抖动。
四、PTS的头号问题:配置时隙
传统的以太网采用“尽力而为”的转发,无法保证包的端到端最坏时延,时延敏感网络采用类似时分复用的方式,为每一个包配置时隙,保证其有足够的时间进行转发。以下总结三种基于时间的调度整形机制和一个时隙配置模型。
-
时间触发以太网(TTE):把时间戳打在包上,通过时间表控制包的发送,让每个包自己知道自己的发送时间,在发包侧就将各个包的发送时间隔开,严格保证时延抖动满足要求。
-
时间感知整形(TAS):利用优先级门控队列,即在优先级队列后加上门控开关,通过门控时间表控制门控开关的打开闭合来保证时延抖动要求。其可以阻断尽力而为流的持续转发,让高优先级的包得到稳定的间隔转发时间,同时PTS流之间依然要将发包时间隔开,时延抖动保证效果才最好。比如每跳时延为T,共有n跳,则可保证端到端时延最大为nT。和TTE相比,让优先级队列决定包何时被转发,降低了对发端的要求,同时时延抖动保证粒度也会弱一些。
-
循环排队转发(CQF):把TAS里只用一个最高优先级队列来接收时延敏感流,变为用奇偶两个队列循环接收,即所谓的乒乓队列。其可以用于解决流聚合问题,如果两个PTS流同时到达了,必有一个PTS要等待转发,循环排队转发可以保证等待的流只等待前一个PTS流转发,即一个周期T,自己再转发一个周期T,假设共有n跳,则端到端时延可保证最大为2nT。
时隙配置模型:时隙的配置问题等同于二进制背包问题,是一个NP-hard问题,时延敏感网络的流量调度和时隙配置架构流程如下图所示,首先需要确定合适的转发平面调度整形机制,然后中心化用户配置(CUC)采集各个发端的发包周期、包大小、流大小、对时延抖动的要求等信息,以及网络的拓扑信息,并将这些信息作为输入,放入时隙配置模型中;模型包含一系列的多项式约束条件,可采用整数线性规划(ILP)或可满足性模理论(SMT)等方式进行建模,然后用解析器工具或者蚁群算法、模拟退火算法、遗传算法、禁忌搜索算法等启发式算法进行求解,最后输出为满足这些约束条件的一个时隙配置方案,并可采用离线静态或者在线增量式的方法进行配置下发。
五、PTS的衍生问题:流聚合、流增量、流突发
流聚合:当拓扑复杂、拓扑不对称、存在多个分支节点时,得到毫无排队的时隙配置会非常困难,下游聚合节点会产生流聚合现象,导致PTS流排队。CQF是一种解决流聚合的机制。
流增量:一般的配置方案是离线的静态配置方案,每次计算出方案可能需要花费数个小时,然后进行部署,当有新的设备加入网络时,需要考虑逐个的规划时延敏感流的时隙配置,同时保证已下发的配置不受影响。目前结合SDN进行时延敏感网络增量调度是一个比较火的方向,叫TSSDN(Time-sensitive Software-defined Network )。
流突发:当网络中有零星时延敏感流时,很有可能与周期时延敏感流的转发产生冲突,扰乱已有的时隙配置。混合时延敏感流调度是当前还没有解决的一个问题。
六、PTS的共流问题:考虑混合流的QoS和网络利用率
共流问题也叫做混合流问题,时延敏感网络的流量可以分为三类:时延敏感流(TS),速率限制流(RT)和尽力而为流(BE)。其中时延敏感流已在第一节介绍;速率限制流是指专业音视频等有一定时延抖动要求,同时占用带宽大,需要进行速率限制的流量;尽力而为流是普通的可以随意转发的以太网流量。
优先级等级上,TS > RT > BE,一般是转发完TS流后,剩余的时隙用来转发RT和BE流,并设立保护带宽隔离三种流量。保证了PTS流的服务质量后,从网络整体性能出发,还需要考虑保证RT和BE流的服务质量,降低其丢包率,并尽量提高整个网络的带宽资源利用率。
七、PTS的隐藏问题:时钟漂移、广域时钟同步、复杂度和扩展性
PTS调度整形机制的实现都有一个大前提,那就是严格的全网时钟同步,但由于温度等原因,时钟会产生漂移,一次时隙没有对齐,就会导致包无法在预计的时刻被发送完,导致整个调度出现严重问题,只能重启设备。
同时,当前的时钟同步机制只能保证7跳以内大小的局域网内的时钟同步,如何实现广域的时钟同步,在更大的范围内实现时延抖动的保障,同时还要考虑实现的复杂度和实现成本,这些问题都有待讨论。