数据中心交换机buffer需求分析白皮书
IT数据中心运维服务白皮书

IT数据中心运维服务白皮书IT数据中心运维服务白皮书1、简介1.1 背景1.2 目的1.3 范围2、数据中心运维概述2.1 定义2.2 目标2.3 重要性3、数据中心运维流程3.1 设备监控3.1.1 监控工具3.1.2 告警处理3.2 设备维护3.2.1 定期维护3.2.2 预防性维护3.3 容量规划与增长3.3.1 现有资源评估 3.3.2 容量规划策略 3.4 安全措施3.4.1 物理安全3.4.2 逻辑安全3.5 数据备份与恢复3.5.1 备份策略3.5.2 恢复测试4、运维服务级别协议4.1 定义4.2 协议内容4.2.1 运维响应时间 4.2.2 故障处理时间 4.2.3 售后支持4.3 违约责任和违约处理5、数据中心运维团队5.1 团队组成5.2 人员角色与职责5.3 培训与发展计划6、数据中心运维最佳实践6.1 设备标准化6.2 问题管理6.3 自动化工具和流程6.4 文档管理和知识库6.5 持续改进7、附件附件二、数据中心设备监控工具推荐注释:法律名词及注释:1、运维:维护与运营的合称,是指对设备、系统或网络等进行管理、维护和保养,以确保其正常运行和可靠性。
2、数据中心:指用于集中托管大量计算机服务器、存储系统和网络设备的设施,用于处理、存储和传输大量数据和信息。
3、服务级别协议:是提供给客户和运维服务提供商之间的协议,明确了双方对于服务响应时间、故障处理、售后支持等方面的约定。
4、违约责任和违约处理:指当一方违反了服务级别协议中的约定时,另一方可以要求违约方承担相应责任,并对违约行为进行处理。
5、自动化工具和流程:指使用自动化软件和流程来提高运维效率,减少人为操作错误的发生。
6、持续改进:指持续对运维流程和实践进行审查和改进,以提高运维效率和质量。
IT数据中心运维服务白皮书

IT服务白皮书鹏博士电信传媒集团股份有限公司IT服务白皮书二零一三年十一月目 录第一章运维服务概述 ...........................................................................1、 ........................................................................................2、 ........................................................................................3、 ........................................................................................第二章监控巡检服务 ...........................................................................1、实时监控 ...............................................................................2、日常监控 ...............................................................................第三章服务器运维管理服务 ....................................................................1、服务器健康检查 ........................................................................2、服务器日常维护 ........................................................................3、服务器配置管理 ........................................................................4、服务器性能管理 ........................................................................第四章网络运维管理服务 .......................................................................1、网络拓扑规划和优化 .....................................................................2、网络设备安装、配置、调试 ................................................................3、网络设备“高可用”配置和维护 ..........................................................4、网络设备性能管理 ......................................................................第五章存储运维管理服务 .......................................................................1、存储设备安装、配置、调试 ................................................................2、存储容量空间管理 ......................................................................3、存储性能管理 ............................................................................第六章数据库管理服务 .........................................................................1、数据库安装、配置、调试 ..................................................................2、数据库性能管理 ........................................................................3、数据库容量空间管理 .....................................................................4、数据库备份和恢复管理 ...................................................................第七章安全管理 ..............................................................................1、服务器安全管理 ........................................................................2、网络安全管理 ............................................................................第八章管理制度、流程 .........................................................................1、服务支持 ...............................................................................2、服务交付 ...............................................................................第九章应急管理 ..............................................................................1、应急预案开发和维护 .....................................................................2、应急演练 ...............................................................................第一章运维服务概述1、2、3、第二章监控巡检服务1、实时监控2、日常监控第三章服务器运维管理服务1、服务器健康检查为了提高系统的可用性,将故障排除在发生之前至关重要。
IDC 网络数据中心技术白皮书

技术参数白皮书﹝机柜﹞1、技术要求1.1一般要求用于IDC或其它电信网络数据中心大楼机房的通信机柜,其采用的材料和器件,紧固件、密封件,其机械、化学、电气性能以及各种性能的检测方式均应符合中国国家标准、通信行业标准及IEC的有关标准。
机架设计符合:IEC297-1-1986《Dimensions of mechanical-structures of the 482.6mm(19in)的要求。
》 series》的要求符合:ANST/EIA RS-310-D/DIN41491/PART1/IEC297-2/DIN41494/PART7/GB/T30472-92标准兼容19″国际标准、公制标准和ETSI标准.电源分配板的设计符合《通信用配电设备》(YD/T 585-1999)的要求。
1.2 环境条件1)工作温度:-5℃~40℃2)存温度:-20℃~+55℃3)工作相对湿度:不大于80%(+30℃时))4)贮存相对湿度:≤90%~96%(40℃±2℃)5)大气压力:76~106kpa6)运输:火车、汽车等交通工具的正常运输。
经包装的产品能适应于正常运输条件,不会出现有损设备外观及性能的情况。
机架包装采用防冲撞摩擦包装,内部用气泡塑料袋包装,底部用木托盘固定,外包装用AA纸标准纸箱包装,外框四周(5×50×2000)mm护纸角保护,边角可承受外界(50KG)碰撞冲击。
1.3 外观与结构1)开门结构,前门单开(单扇),后门对称双开(双扇),前后门冲散热网孔,网孔面积大于60%。
2)机柜顶框和底框整体制作,顶部配防尘罩,支持上下进缆, 后两侧有线缆固定装置。
机柜后部左右两侧配有电源接线板,共24插口,双电源接线配置,接线板一一对应空气开关至交流接线断子,交流接线端子容量为60A,设置合理、安全、方便操作。
3)机柜内设置4根标准移动立柱用于安装设备和固定层板。
移动立柱的前后位置可以整体前后、移动调整,层板安装高度和前后位置可调,能适合不同设备的安装要求。
数据中心网络系统技术白皮书

交换机架构
包括二层交换机、三层交 换机和四层交换机等,每 种类型的交换机都有各自 的应用场景。
网络设备部署方式
包括接入层、汇聚层和核 心层等,每个层面都需要 根据实际情况进行设备部 署和配置。
存储设备架构
DAS存储架构
直接附加存储架构,将存储设备直接连接到服务器上,数据传输效 率较高。
NAS存储架构
存储虚拟化
将物理存储设备抽象成逻辑存储资源,实现存储 资源的统一管理和调度。
分布式技术
分布式计算
01
通过将计算任务分配到多个计算节点上并行处理,实现计算效
率的提升。
分布式存储
02
通过将数据分散存储在多个存储节点上,实现数据的高可用性
和可扩展性。
分布式数据库
03
通过将数据分散存储在多个数据库节点上,实现数据的分布式
特点
高可靠性:数据中心 网络系统具有极高的 可靠性,能够保证数 据的稳定传输和存储 。
高性能:数据中心网 络系统具有较高的性 能,能够满足大量数 据传输和处理的需求 。
安全性:数据中心网 络系统具有严格的安 全措施,能够保护数 据的安全性和隐私性 。
数据中心网络系统的应用场景
01
02
03
互联网应用
开放接口
SDN控制器提供开放的网络接口,方便第三方应用开发商开发和集 成网络控制功能。
网络虚拟化
通过软件定义网络技术,实现网络资源的动态分配和虚拟化。
网络功能虚拟化(NFV)
1 2
虚拟化网络功能
将传统的物理网络设备抽象成虚拟化的网络功能 模块,实现网络功能的灵活管理和调度。
高效资源利用
NFV技术可以提高网络设备的资源利用率,减少 硬件设备的浪费。
精选-FusionSphere分布式虚拟交换机技术白皮书服务器虚拟化

____ 1分布式虚拟交换机概述1.1产生背景图1-1网络虚拟化的发展Serv&r viirtLializ^tiori> Run multiple vjrtuah servers on 務physical ^orverJ Each VM has illurekMi rt is rurailng aptiysical server计算虚拟化驱动网络虚拟化的发展。
传统数据中心,一台服务器运行一个操作系统,通过物理网线与交换机相连,由交换机实现不同的主机的交换、流量控制、安全控制等功能。
在计算虚拟化后,一台服务器虚拟化成多台的虚拟的主机,每个虚拟主机有自己的 CPU、内存和网卡。
同一服务器上的不同主机之间既需要维持原有的通信,同时由于共享物理设备,引出了新的安全隔离、以及对流控的更高的需求,对虚拟交换技术的诉求由此产生Bikie VM Red VMPhysicallserverN*rwork VbFliiililxxtlan>Run m^ultiplB virtualrwtwQi* neiwnirk>EacH virtual nelworK hasll as a dodlcLitedfabricPh^SHcalnetwork为统一和简化对各台主机的虚拟交换机的配置管理,业界引入分布式虚拟交换机。
分布式虚拟交换机一方面可以对多台服务器的虚拟交换机统一配置、管理和监控,另一方面也可以保证虚拟机在服务器之间迁移时网络配置的一致性。
1.2虚拟交换现状虚拟交换分为基于服务器来实现虚拟二层交换的功能和基于交换机实现虚拟交换功能两类实现方式。
其中服务器实现虚拟交换又分为服务器CPU实现虚拟交换和在服务器网卡上实现虚拟交换的两种方式。
总结来说,虚拟交换的实现形式一般分为三种:1)在服务器CPU上实现虚拟交换;2)在服务器网卡上实现虚拟交换;3)在物理交换机上实现虚拟交换。
1.2.1基于服务器CPU实现虚拟交换在服务器CPU中实现虚拟交换是目前较为成熟且产品化较好的技术方案。
数据中心供配电系统白皮书[1]
![数据中心供配电系统白皮书[1]](https://img.taocdn.com/s3/m/a83405bfba0d4a7303763a26.png)
数据中心供配电系统应用白皮书一引言任何现代化的IT设备都离不开电源系统,数据中心供配电系统是为机房内所有需要动力电源的设备提供稳定、可靠的动力电源支持的系统。
供配电系统于整个数据中心系统来说有如人体的心脏-血液系统。
1.1 编制范围考虑到数据中心供配电系统内容的复杂性和多样性以及叙述的方便,本白皮书所阐述的“数据中心供配电系统”是从电源线路进用户起经过高/低压供配电设备到负载止的整个电路系统,将主要包括:高压变配电系统、柴油发电机系统、自动转换开关系统(ATSE,Automatic Transfer Switching Equipment)、输入低压配电系统、不间断电源系统(UPS,Uninterruptible Power System)系统、UPS列头配电系统和机架配电系统、电气照明、防雷及接地系统。
如下图:图1 数据中心供配电系统示意方框图高压变配电系统:主要是将市电(6kV/10kV/35kV,3相)市电通过该变压器转换成(380V/400V,3相),供后级低压设备用电。
柴油发电机系统:主要是作为后备电源,一旦市电失电,迅速启动为后级低压设备提供备用电源。
自动转换开关系统:主要是自动完成市电与市电或者市电与柴油发电机之间的备用切换。
输入低压配电系统:主要作用是电能分配,将前级的电能按照要求、标准与规范分配给各种类型的用电设备,如UPS、空调、照明设备等。
UPS系统:主要作用是电能净化、电能后备,为IT负载提供纯净、可靠的用电保护。
UPS输出列头配电系统:主要作用是UPS输出电能分配,将电能按照要求与标准分配给各种类型的IT设备。
机架配电系统:主要作用是机架内的电能分配。
此外,数据中心的供配电系统负责为空调系统、照明系统及其他系统提供电能的分配与输入,从而保证数据中心正常运营。
电气照明:包括一般要求,照明方案、光源及灯具选择。
防雷及接地系统:包括数据中心防雷与接地的一般要求与具体措施。
1.2 编制依据《电子信息系统机房设计规范》GB 50174—2008《电子信息机房施工及检验规范》GB50462—20081.3 编制原则1.具有适应性、覆盖性、全面性的特征。
数据中心可持续发展白皮书

数据中心可持续发展白皮书数据中心可持续发展白皮书摘要:随着数字化时代的到来,数据中心的需求量与日俱增,同时也带来了巨大的能源消耗和环境影响。
可持续发展已成为全球范围内的共识,数据中心作为数字化时代的核心基础设施之一,也应与时俱进,向可持续发展方向发展。
本白皮书以全球数据中心的可持续发展情况为出发点,针对中国数据中心的现状与存在的问题,提出了一些可持续发展的解决方案。
第一部分:可持续发展的概念与背景随着资源消耗过度、环境恶化等问题日益突出,可持续发展的理念逐渐成为全球共识。
可持续发展是指在保障人类基本需求的前提下,实现社会经济的可持续增长,保护自然环境,以满足当前和未来世代的需求。
可持续发展的目标旨在实现经济、社会和环境三方面的平衡,提高资源利用效率和环境质量。
随着数字化和信息化的发展,数据中心已成为数字化时代的核心基础设施之一。
数据中心的运行需要大量的能源和资源,存在严重的能源浪费和环境污染问题。
因此,如何将数据中心向可持续发展方向发展,是全球数据中心业界亟待解决的问题。
第二部分:全球数据中心的可持续发展状况目前,全球数据中心的可持续发展状况不尽相同,下面我们将就此进行简要介绍。
1. 美国数据中心的可持续发展美国是全球最大的数据中心市场之一,其数据中心产业在可持续发展方面处于领先地位。
美国政府倡导数据中心绿色化,各相关部门也相继出台了一系列鼓励节能减排的政策和标准。
同时,美国数据中心业界也投入大量资金研发节能减排技术,采用先进的冷却系统和回收利用废热等措施,不断提高数据中心的能源利用效率和环境保护水平。
2. 欧洲数据中心的可持续发展欧洲是全球数据中心产业发展最为成熟的地区之一,其可持续发展水平也较高。
欧洲各国政府制定了严格的能源效率标准和环保政策,数据中心行业也广泛采用节能技术,如自然通风、天然气冷却等,同时还投资于采用可再生能源的研究和发展。
3. 亚洲数据中心的可持续发展亚洲是全球数据中心市场增长最快的地区之一,然而其可持续发展的水平相对而言较低。
IT数据中心运维服务白皮书

建立设备采购流程,包括需求分析、产品选型、采购计 划和合同签订等方面的流程。
配置管理流程
建立配置管理流程,包括设备部署、系统调试和验收等 方面的流程。
监控和应急响应流程
建立监控和应急响应流程,包括实时监控、故障排查和 应急预案等方面的流程。
完善数据中心运维服务组织架构
01
建立运维管理团队
02
选择合适的供应商
选择合适的供应商,购买性价比 高的设备和软件,降低成本。
03
优化服务级别
根据实际需求和优先级,优化服 务级别协议(SLA),降低不必要 的服务和成本。
THANKS
谢谢您的观看
中小企业虽然信息系统规模较小, 但对数据中心运维服务的需求也在 逐渐增加。
02
it数据中心运维服务核心价值
提高it系统的可靠性
1 2 3
实时监控硬件和软件系统
通过专业的监控工具和技术,实时监控IT系统 的硬件和软件运行状态,预防潜在的故障和问 题。
故障修复与预防
一旦出现故障,能够快速定位并修复问题,同 时通过定期的巡检和预防性维护,降低故障发 生的概率。
选择合适的运维服务提供商
提供商的经验和专业 技能
选择具有丰富经验和专业技能的 运维服务提供商,能够提供高效 、专业的运维服务。
提供商的服务质量
选择服务质量高的提供商,能够 保证运维服务的质量和稳定性。
提供商的客户评价
参考其他客户的评价,了解提供 商的服务水平和客户满意度。
设计合理的运维服务流程
定义明确的服务流程
制定明确的运维服务流程,包括服务级别、 服务响应时间、服务处理流程等,以便提高 服务效率和质量。
流程的可操作性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据中心交换机 buffer 需求分析白皮书目录1引言 (3)1.1DC 的网络性能要求 (3)1.2国内OTT 厂商对设备Buffer 的困惑 (4)1.3白皮书的目标 (4)2Buffer 需求的经典理论 (5)2.11BDP 理论 (5)2.2Nick Mckeown 理论 (6)2.3经典理论的适用性 (6)3基于尾丢弃的buffer 需求 (9)3.1丢包的影响 (9)3.1.2丢包对带宽利用率的影响 (9)3.1.3丢包对FCT 的影响 (12)3.2大buffer 的作用 (13)3.2.1吸收突发,减少丢包,保护吞吐 (13)3.2.2带宽分配均匀 (14)3.2.3优化FCT (15)3.3DC 内哪需要大buffer (15)3.4需要多大buffer (17)3.5带宽升级后,buffer 需求的变化 (19)3.6 小结 (19)4基于ECN 的buffer 需求 (21)4.1ECN 的作用 (21)4.2ECN 水线设置 (23)4.3基于ECN 的buffer 需要多大 (24)5基于大小流区分调度的buffer 需求 (27)5.1大小流差异化调度 (27)5.2大小流差异化调度如何实现大buffer 相当甚至更优的性能 (27)5.3基于大小流差异化调度的buffer 需要多大 (28)6 总结 (28)7 缩略语 (29)1 引言1.1DC 的网络性能要求近几年,大数据、云计算、社交网络、物联网等应用和服务高速发展,DC 已经成为承载这些服务的重要基础设施。
随着信息化水平的提高,移动互联网产业快速发展,尤其是视频、网络直播、游戏等行业的爆发式增长,用户对访问体验提出了更高的要求;云计算技术的广泛应用带动数据存储规模、计算能力以及网络流量的大幅增加;此外,物联网、智慧城市以及人工智能的发展也都对DC提出了更多的诉求。
为了满足不断增长的网络需求,DC 内的网络性能要求主要体现在:•低时延。
随着深度学习、分布式计算等技术的兴起和发展,人工智能、高性能计算等时延敏感型业务增长迅速。
计算机硬件的快速发展,使得这些应用的瓶颈已经逐渐由计算能力转移到网络,低时延已经成为影响集群计算性能的关键指标。
因此,时延敏感型应用对DC 网络时延提出了更高的要求。
目前DC 内,端到端5-10 微秒时延已经成为主流的目标要求。
•高带宽高吞吐。
数据时代的到来,产生了海量的数据,如图1-1。
基于数据的应用(如图像识别)的推广,使得网络数据呈爆发式增长,小带宽已经无法满足应用对传输速率的需求。
部分应用场景下,带宽成为制约用户体验的瓶颈。
高带宽高吞吐对于提升大数据量传输的应用性能有着至关重要的影响。
为了应对大数据量传输的应用需求,目前,百度、腾讯、阿里巴巴等互联网企业的DC 都已经全面部署100GE网络,阿里巴巴更是规划2020 年部署400GE 网络。
图1-1 数据中心内存储的实际数据数据来源:中国IDC 圈•极低丢包率。
丢包需要重传,甚至RTO 超时,造成带宽的浪费。
目前,不少DC,通过使能PFC(Priority-based Flow Control)实现无损网络。
1.2国内OTT 厂商对设备Buffer 的困惑为了满足应用的发展对DC 网络性能提出的更高要求,国内OTT 厂商除了上层的应用优化外,希望对DC网络架构以及交换设备做进一步的优化,以提升网络整体性能。
DC 内的设备buffer 成为关注的重点。
经过与国内OTT 厂商交流后发现,OTT 厂商对设备buffer 存在两点主要困惑:•设备buffer 需要多大。
设备buffer 大小一直备受关注。
大buffer 能吸收突发,减少丢包,但同时也会带来排队时延的增加;小buffer 能保证排队时延较低,但却无法吸收突发,影响链路的带宽利用率。
OTT 厂商都迫切想知道,在目标场景下,多大buffer的设备能满足业务需求。
•使能ECN 后,ECN 的水线该设多大。
ECN 使设备能尽早的反馈拥塞信息,避免排队时延过长,同时减少丢包,但是ECN 的水线设置对网络性能影响较大。
如果水线过低,则链路会欠吞吐;水线过高,则会造成时延增加,同时无法体现ECN 尽早反馈拥塞的优势。
因此,OTT 厂商迫切需要ECN 水线设置的经验指导。
1.3白皮书的目标在本白皮书中,我们梳理了目前业界关于DC 交换机buffer 的观点和结论,结合本身对buffer 的认识理解,通过理论和仿真分析,试图回答关于设备buffer 的两个基本问题:设备buffer 需要多大以及ECN 水线该设多大。
考虑到,目前DC 现网中的主流场景包括:基于尾丢弃的TCP 拥塞控制网络,基于ECN 的TCP 拥塞控制网络,以及使能大小流差异化调度的TCP 拥塞控制网络。
因此,本白皮书分别在三个DCN(Data Center Network)场景下分析交换机buffer 需求的相关问题,期望对交换机buffer 的设计以及使用提供经验性的指导。
2 Buffer 需求的经典理论2.11BDP 理论关于网络设备buffer 大小需求,最早的经典理论是Villamizar 和Song 在1994 年提出的1BDP(Bandwidth Delay Product)理论,也称为Rule-of-Thumb。
这里的BDP=C×RTT ,其中 C 为瓶颈链路的带宽,RTT 为链路的往返传输时延。
1BDP 理论做出如下假设:(1)传输层协议为基于丢包的TCP,丢包速率减半;(2)在链路中仅有一条长流;(3)网络只有一跳,TCP 流对buffer 的占用如图2-1 所示;(4)buffer 需求的目标是保证跑满链路带宽。
图2-1 一条TCP 流的buffer 占用在t1 时刻,TCP 的发送端感知到丢包,此时TCP 的拥塞窗口CWND 从Wmax 减小到Wmax/2,而TCP 流的在途数据量inflight=Wmax。
由于在途数据量在传输管道中或者在buffer 队列,因此inflight=BDP+B ,其中 B 为设备buffer 大小,于是可以得到Wmax=BDP+B。
在t2 时刻,buffer 队列排空,inflight≤CWND,发送端以Wmax/2 的窗口发送数据。
此时,数据报文无排队时延,数据包的RTT= 链路的往返传输时延,TCP 流的发送速率=Wmax/2/RTT,为了保证跑满链路带宽,TCP流的发送速率应该等于链路的瓶颈带宽C。
因此,C=Wmax/2/RTT,得到Wmax=2C×RTT 。
综合Wmax=BDP+B=2C×RTT,得到B=BDP=C×RTT。
也就是说,单流情形,设备1BDP的buffer 能保证出端口跑满链路带宽。
考虑到在不止一跳的网络拓扑中,当前设备buffer 排空的t2 时刻,流的RTT 包含除当前设备buffer 以外的其他设备的buffer 排队时延。
因此,要保证不欠吞吐的1BDP 设置中的时延需考虑队列时延。
n 2.2 Nick Mckeown 理论斯坦福大学的 Nick Mckeown 教授在 1BDP 理论的基础上,分别考虑多流同步和异步的情形,进一步扩展了 buffer 需求的理论。
(1) 多流同步。
流的同步指的是不同的流的发送窗口的大小变化锯齿曲线相位同步,即 发送窗口同时增大或减小。
通常,多流同时发起、多流在设备处同时丢包以及多流之间 接近的 RTT 都会增加多流的同步性。
对于在同一瓶颈链路传输的同步多流,在设备处叠 加后的发送窗口的大小变化曲线,就是多条锯齿曲线的同相叠加,与一条流的锯齿曲线类似。
因此,应用 1BDP 理论相同的推导逻辑,可以得到同步多流情形,要保证跑满链 路带宽,设备所需的 buffer 仍然为 1BDP 。
(2) 多流异步。
流不同步时,多流的发送窗口值形成的锯齿曲线会相互错开。
如果流数 足够多,假定各流的窗口值独立同分布,则根据中心极限定理,多流的窗口叠加后,形 成的总的窗口值服从正态分布。
此时,多流叠加的窗口值的变化与单流窗口值的变化存 在 n 的关系,其中的 n 为大流的条流。
因此,多流异步时,为了保障不欠吞吐,设备 所需的 buffer 为 BDP/ 。
2.3 经典理论的适用性经典理论都是针对广域网中的骨干网路由器的 buffer 需求提出。
相比于广域网,数据中 心的跳数更少,时延更短,业务的流量模型也不同,经典理论在 DCN 是否适用?BDP 理论在多流时是否依然适用?考虑到 buffer 溢出丢包后发送端需要 3 个冗余 ACK 才将窗口降半,假设多流的 buffer 占用曲线如图 2-2 所示。
假设 DCN 中共有 n 条流, 流 i 的窗口值大小为 W i ,流 i 的 RTT 为 RTT i 。
图 2-2 多 TCP 流的 buffer 占用在 t 1 时刻,buffer 溢出丢包,但由于源端无法立刻感知到丢包,收到 ACK 后,仍然会继续增大窗口值,继续发送数据包,导致 buffer 持续占满。
经过 3RTT 后,在 t 2 时刻,各流收到 3 冗余 ACK 后感知到丢包,此时多流的窗口都从 W i 降低到 W i /2。
在 t 2 时刻降窗口之前,各流的窗口值之和 ∑nWi 为各流的总在途数据报文,而这些报文或者在管道 中,或者在 buffer 队列中,因此 ∑n W i =BDP+B 。
在(t 2,t 3)期间,由于流的窗口值小于在途的报文数,于是各流停止发送报文,buffer 队列排空。
n n i在 t 3 时刻,各流已收到足够的 ACK ,使得在途数据报文数≤ ∑n W i / 2 ,于是各流开始 恢复数据发送。
W 要/保2证此时链路不欠吞吐,则各流的发送速率之和应该为瓶颈链路带宽 C 。
因此,∑ i = C 。
假设 RTT =max{RTT },则 C = ∑ W i / 2 ≥ ∑ W / 2 , n RTT maxi n RTT i n RTT max因 此 , 有 ∑ W i ≤ 2C ⨯ R T m T a 。
x 将 ∑W i =BDP+B 代 入 , 可 得 B ≤ C ⨯ R T m T a =x B D m P a 。
x 所以,buffer 为 1BDP 可以保证链路打满带宽,即 1BDP 的理论在数据中心依然适用。
BDP/ 理论成立需要满足两个基本假设前提:多流窗口值异步以及多流窗口值独立。
如果网络中的多流的窗口值不满足异步性和相互独立性,则多流叠加后的窗口值和单流窗口值之间的关系将失效。
在 DCN 中,尤其是大数据、图像识别等应用为主的 DCN 中,MapReduce 以及参数服务器等这类分区/聚合(Partion/Aggregate)的 incast 通信模式非 常常见。