FusionSphere虚拟化套件GPU直通技术白皮书

合集下载

FusionSphere虚拟化套件安全技术白皮书

FusionSphere虚拟化套件安全技术白皮书

华为FusionSphere 虚拟化套件安全技术白皮书目录1虚拟化平台安全威胁分析 (1)1.1概述 (1)1.2云安全威胁分析 (1)1.2.1传统的安全威胁 (1)1.2.2云计算带来的新的安全威胁 (3)1.3云计算的安全价值 (4)2 FusionSphere安全方案 (6)2.1 FusionSphere总体安全框架 (6)2.2网络安全 (7)2.2.1网络平面隔离 (7)2.2.2 VLAN隔离 (8)2.2.3防IP及MAC仿冒 (9)2.2.4端口访问限制 (9)2.3虚拟化安全 (10)2.3.1 vCPU调度隔离安全 (10)2.3.2内存隔离 (11)2.3.3内部网络隔离 (11)2.3.4磁盘I/O隔离 (11)2.4数据安全 (11)2.4.1 数据加密 (11)2.4.2用户数据隔离 (12)2.4.3数据访问控制 (12)2.4.4剩余信息保护 (12)2.4.5数据备份 (13)2.4.6软件包完整性保护 (13)2.5运维管理安全 (13)2.5.1管理员分权管理 (13)2.5.2账号密码管理 (14)2.5.3日志管理 (14)2.5.4传输加密 (14)2.5.5数据库备份 (14)2.6基础设施安全 (15)2.6.1操作系统加固 (15)2.6.2 Web安全 (15)2.6.3数据库加固 (16)2.6.4 Web容器加固 (16)2.6.5安全补丁 (17)2.6.6防病毒 (17)1 虚拟化平台安全威胁分析1.1 概述云计算虚拟化平台作为一种新的计算资源提供方式,用户在享受它带来的便利性、低成本等优越性的同时,也对其自身的安全性也存在疑虑。

如何保障用户数据和资源的机密性、完整性和可用性成为云计算系统急需解决的课题。

本文在分析云计算带来的安全风险和威胁基础上,介绍了华为云计算虚拟化平台针对这些风险和威胁所采取策略和措施,旨在为客户提供安全可信的服务器虚拟化解决方案。

FusionSphere虚拟化套件分布式虚拟交换机技术白皮书

FusionSphere虚拟化套件分布式虚拟交换机技术白皮书

华为FusionSphere 6.5.0 虚拟化套件分布式虚拟交换机技术白皮书目录1 分布式虚拟交换机概述 (1)1.1 产生背景 (1)1.2 虚拟交换现状 (2)1.2.1 基于服务器CPU实现虚拟交换 (2)1.2.2 物理网卡实现虚拟交换 (2)1.2.3 交换机实现虚拟交换 (3)2 华为方案简介 (5)2.1 方案是什么 (5)2.2 方案架构 (7)2.3 方案特点 (7)3 虚拟交换管理 (8)3.1 主机 (8)3.2 分布式虚拟交换机 (8)3.3 端口组 (8)4 虚拟交换特性 (9)4.1 物理端口/聚合 (9)4.2 虚拟交换 (9)4.2.1 普通交换 (9)4.2.2 SR-IOV直通 (10)4.2.3 用户态交换 (10)4.3 流量整形 (11)4.3.1 基于端口组的流量整形 (11)4.4 安全 (11)4.4.1 二层网络安全策略 (11)4.4.2 广播报文抑制 (12)4.4.3 安全组 (12)4.5 Trunk端口 (12)4.6 端口管理 (13)4.7 存储面三层互通 (13)4.8 配置管理VLAN (13)4.9 业务管理平面 (13)5 虚拟交换应用场景 (14)5.1 集中虚拟网络管理 (14)5.2 虚拟网络流量统计功能 (14)5.3 分布式虚拟端口组 (14)5.4 分布式虚拟上行链路 (14)5.5 网络隔离 (14)5.6 网络迁移 (15)5.7网络安全 (15)5.8 配置管理VLAN (15)5.9 业务管理平面 (15)6 缩略语 (16)1 分布式虚拟交换机概述1.1 产生背景图1-1网络虚拟化的发展计算虚拟化驱动网络虚拟化的发展。

传统数据中心,一台服务器运行一个操作系统,通过物理网线与交换机相连,由交换机实现不同的主机的交换、流量控制、安全控制等功能。

在计算虚拟化后,一台服务器虚拟化成多台的虚拟的主机,每个虚拟主机有自己的CPU、内存和网卡。

FusionSphere虚拟化套件SSD直通技术白皮书

FusionSphere虚拟化套件SSD直通技术白皮书

华为FusionSphere虚拟化套件SSD直通技术白皮书目录1NVMe SSD直通 (1)1.1概述 (1)1.2原理 (1)1.2.1PCI直通 (1)1.2.2NVMe SSD (3)2华为方案 (4)2.1方案简介 (4)2.2方案特点 (4)2.3方案约束 (4)3NVMe SSD直通应用场景 (5)4缩略语表 (6)1N VMe SSD直通1.1概述存储虚拟化让IT管理员可以通过一种便利的方式管理数据中心的存储设备,简化管理。

通过精简卷提高了资源利用率,但虚拟化技术增加了虚拟机IO访问路径长度、主机上用户态与内核态切换次数,同一设备上的资源竞争,导致IO性能有所损失。

设备直通技术为虚拟机提供了一种机制来直接访问物理设备,以减小虚拟化带来的开销,使虚拟机有接近物理设备的性能。

随着计算机能力的不断增强,存储技术也在不断的发生变化,SSD的出现,摆脱了传统HDD的磁头、盘片及电机等机械部件,不会出现任何机械故障,相对于HDD而言,SSD在性能、可靠性、能耗方面都有着绝对的优势,基于NVME协议标准的SSD相比使用SATA接口与AHCI标准的SSD大幅的降低了延迟、提升了IOPS,使得SSD的随机性能得到了极大的提升。

虚拟化环境下在对IO性能有极致需求的场景下面临着极大的挑战,基于普通存储设备提供的存储虚拟化能力根本无法满足诉求,NVMe SSD直通可以完美的解决这一问题,直通技术解决了虚拟化带来的开销,NVMe SSD提供最强的硬件能力。

1.2原理1.2.1PCI直通SSD直通是将SSD设备作为PCI设备通过PCI直通技术完成,当前有两种直通设备实现方式:kvm pci-assign和VFIO。

在虚拟机看来,直通设备是物理上连接在PCI或者PCI-E总线上的,虚拟机对该设备的I/O交互操作和实际的物理设备操作完全一样。

1.2.1.1PCI-ASSIGN使用pci-assign方式时,通过硬件虚拟化技术将宿主机中的物理PCI 设备直接分配给虚拟机,虚拟机以独占方式访问宿主机的PCI/PCI-E 设备,这种方式存在一些缺陷, KVM 是hypervisor并不是设备驱动,资源访问方式与安全启动并不兼容,仅支持PCI设备、X86平台、KVM虚拟化引擎。

华为FusionStorage技术白皮书

华为FusionStorage技术白皮书

华为FusionStorage技术白皮书1 执行摘要/Executive Summary本文从存储技术的发展趋势为切入点,结合用户需求,从高性能、高可靠、高扩展、易管理、兼容性等方面详细介绍了华为公司FusionStorage产品的功能及特点,旨在突出FusionStorage 产品独有的亮点、应用场景以及为客户带来的价值。

2 简介/Introduction虚拟化与云计算技术正在引领IT技术的发展方向,越来越多的企业采用虚拟化与云计算技术来构建新一代IT系统,以提升IT系统的资源利用率,并在保证服务级别水平的前提下降低成本;同时帮助业务更加具有敏捷性,加速新业务的上线时间。

然而,虚拟化与云计算技术的广泛应用也给后端的存储系统提出更加严峻的挑战。

如:需要存储系统能够承载更多的业务、更高的性能与可靠性、更好的扩展性、保证关键业务服务级别水平并降低成本等。

华为分布式存储软件FusionStorage采用创新的分布式软件架构,以高性能、高可靠、高扩展为其设计理念,充分满足企业未来业务需求,帮助其IT系统转型以更快更好地应对日益激烈的竞争环境,实现与客户的共同成长。

3 解决方案/Solution随着企业面临的竞争环境越来越激烈、新业务上线时间要求越来越短,其IT系统需要从传统的成本中心转变为提升企业竞争力的利器,帮助企业提升竞争力并实现商业成功。

作为存放企业数据资产的存储系统,不但要满足业务所需要的高性能、高可靠等基本诉求,更要满足未来业务的发展、提升业务的敏捷性,帮助业务更快更好地适应竞争环境的需要。

从IT业界发展来看,以下技术趋势正在影响存储行业的发展:l 虚拟化技术的广泛应用虚拟机技术给服务器带来更高的利用率、给业务带来更便捷的部署,降低了TCO,因而在众多行业得到了广泛的应用。

与此同时,虚拟机应用给存储带来以下挑战:第一,相比传统的物理服务器方式,单个存储系统承载了更多的业务,存储系统需要更强劲的性能来支撑;第二,采用共享存储方式部署虚拟机,单个卷上可能承载几十或上百的虚拟机,导致卷IO呈现更多的随机特征,这对传统的Cache技术提出挑战;第三,单个卷承载多个虚拟机业务,要求存储系统具备协调虚拟机访问竞争,保证对QoS要求高的虚拟机获取到资源实现性能目标;第四,单个卷上承载较多的虚拟机,需要卷具有很高的IO性能,这对传统受限于固定硬盘的RAID技术提出挑战;第五,虚拟机的广泛使用,需要更加高效的技术来提高虚拟机的部署效率,加快新业务的上线时间。

FusionSphere虚拟化套件技术白皮书

FusionSphere虚拟化套件技术白皮书

华为FusionSphere 6.5.0 虚拟化套件技术白皮书pg. i1 摘要云计算并不是一种新的技术,而是在一个新理念的驱动下产生的技术组合。

这个理念就是—敏捷IT。

在云计算之前,企业部署一套服务,需要经历组网规划,容量规划,设备选型,下单,付款,发货,运输,安装,部署,调试的整个完整过程。

这个周期在大型项目中需要以周甚至月来计算。

在引入云计算后,这整个周期缩短到以分钟来计算。

IT业有一条摩尔定律,芯片速度容量每18个月提升一倍。

同时,IT行业还有一条反摩尔定律,所有无法追随摩尔定律的厂家将被淘汰。

IT行业是快鱼吃慢鱼的行业,使用云计算可以提升IT设施供给效率,不使用则会拖慢产品或服务的扩张脚步,一步慢步步慢。

云计算当然还会带来别的好处,比如提升复用率缩减成本,降低能源消耗,缩减维护人力成本等方面的优势,但在反摩尔定律面前,已经显得不是那么重要。

业界关于云计算技术的定义,是通过虚拟化技术,将不同的基础设施标准化为相同的业务部件,然后利用这些业务部件,依据用户需求自动化组合来满足各种个性化的诉求。

云着重于虚拟化,标准化,和自动化。

FusionSphere是一款成熟的Iaas层的云计算解决方案,除满足上面所述的虚拟化,标准化和自动化诉求外,秉承华为公司二十几年电信化产品的优秀基因,向您提供开放,安全可靠的产品。

本文档向您讲述华为FusionSphere解决方案中所用到的相关技术,通过阅读本文档,您能够了解到:●云的虚拟化,标准化,自动化这些关键衡量标准是如何在FusionSphere解决方案中体现的;●FusionSphere解决方案是如何做到开放,安全可靠的;●FusionSphere解决方案所包含的部件,所涉及的主要技术领域,使用的主要单点技术;●针对FusionSphere提供的各种技术选择,您怎样使用它们来满足您的业务诉求;本书分为如下章节:第一章,就是本章,给您对云计算,云平台有一个概括性的认识,并对本文档的阅读给出指导。

FusionSphere虚拟化套件备份技术白皮书

FusionSphere虚拟化套件备份技术白皮书

华为FusionSphere 虚拟化套件备份技术白皮书目录1备份简介 (1)1.1云计算备份概述 (1)1.1.1为什么需要备份 (1)1.1.2备份系统设计原则 (1)1.1.3备份系统的定位(与容灾的关系) (3)1.1.4备份系统的组成 (3)1.2云计算备份典型需求描述 (4)1.3 FusionSphere备份方案简介 (5)2 FusionSphere备份方案介绍 (7)2.1 eBackup虚拟机备份方案 (7)2.1.1方案概述 (7)2.1.2适用场景 (9)2.1.3方案组网 (11)2.1.4方案特点 (12)2.2用户数据备份到第三方备份服务器方案 (13)2.2.1方案概述 (13)2.2.2适用场景 (13)2.2.3方案组网 (14)2.2.4方案特点 (15)3综述:FusionSphere备份方案对比分析 (16)4术语 (17)1 备份简介1.1 云计算备份概述随着云计算的蓬勃发展,越来越多重要的计算机信息系统出现在云计算中。

由于各行业的用户和企业对网络应用和数据信息的依赖日益强烈,使得突发性灾难如火灾、洪水、地震、区域电力中断或者人为破坏对整个企业的数据和业务生产会造成重大影响,如重要信息丢失、服务中断、经济损失、客户流失等。

因此,为了保证云计算中计算机信息系统的业务连续性和数据可靠性,华为提供了针对云计算的备份解决方案,保证灾难发生时关键数据不丢失,系统服务尽快恢复运行。

1.1.1 为什么需要备份虽然计算机技术的发展给人们的日常生活提供了很多便利,然而,人为的操作错误,系统软件或应用软件的缺陷、硬件的损毁、电脑病毒、骇客攻击、自然灾难等等诸多因素都有可能造成计算机中数据的丢失,从而给企业造成无可估量的损失。

为了保护业务系统的关键业务数据,必须对这些数据进行有效的保护,并支持快速恢复。

所有的备份都是为发生灾难时作恢复而准备的,一个自动备份系统的优劣标准不仅仅在于它的备份模式/备份速度等,需要慎重衡量的还有另一个标准---可恢复性。

NVIDIA 虚拟 GPU 虚拟化技术白皮书说明书

NVIDIA 虚拟 GPU 虚拟化技术白皮书说明书

Delivering Cost-Effective, High-Value Healthcare with NVIDIA Virtual GPU SolutionsYear after year , the healthcare industry is faced with the challenge of lowering costs while also improving quality of care. With the shift toward value-based care, initiatives such as mobility, virtualization, and new patient services like telemedicine and virtual care are gaining popularity. As a result, healthcare providers must find ways to effectively deploy technology that improves care delivery and scalability, while ensuring continued security and regulatory compliance.>Doctors spend more time working on electronic health records than with patients themselves.¹>Healthcare providers are seeing 50-175x the number of telemedicine visits compared to the previous year .²>70% of U.S. healthcare organizations report they have been breached at some point in their history, the highest of any U.S. vertical.³>Artificial intelligence in healthcare is expected to expand at a compound annual growth rate of 46.21 percent from 2018 to reach $33.42 billion by 2026.4NVIDIA VIRTUAL GPU OPENS NEW OPPORTUNITIES FOR OPTIMIZING PATIENT CAREDigital transformation for healthcare providers has resulted in an increasing use of Virtual Desktop Infrastructure (VDI) to lower costs while also enabling improved security. However, many of these traditional VDI solutions didn’t include GPU virtualization and are unable to keep up with the increasing compute demands of modern, more graphics intensive applications.Furthermore, big data analytics and AI in healthcare is becoming more prevalent — from AI based resource scheduling of patient appointments to AI-assisted annotation of radiographic images to analyzing DNA sequences for early detection of disease. By adding NVIDIA virtual GPU solutions to their VDI environments, healthcare organizations realize significant benefits, including improved performance and increased productivity at lower cost. The impact of NVIDIA virtual GPU has been extensive:>Enhance Productivity and Mobility. More healthcare professionals can now be untethered and access data from any location, at any time, and on a variety of devices with a native-like PC experience. This portability and rapid access to information results in faster decision-making and improved diagnostic accuracy. Furthermore, mobility improves the completeness and accuracy of patient records and speed of input, improving clinical workflows.WHAT IS GPU VIRTUALIZATION?GPU virtualization enables every virtual machine to leverage the same benefits of a GPU physical desktop, workstation or server . Because work typically done by the CPU is offloaded to the GPU, the user has a much better experience and more users can be supported. GPU virtualization can also be used to run compute-intensive server workloads, including Artificial Intelligence (AI), data science, and High-Performance Computing (HPC) on a virtualmachine with the benefit of improved manageability and security.¹ Lee, Bruce Y . Jan 13, 2020. "How Doctors May be Spending More Time with Electronic Health Records Than Patients "² Bestsennyy , O., Gilbert, G., Harris, A., Rost, J. May 29, 2020. T eleheath: A quarter-trillion-dollar post-Covid 19 reality?³ Thales. 2019 Thales Data Thread Report - Healthcare Edition>Reduce Infrastructure Costs. Healthcare organizations can now virtualize electronic medial record (EMR) and PACS applications, then deliver them cost effectively to all users. Even data from legacy and siloed IT systems are unified and easily accessible to all users. IT can replace thick clients with thin or zero clients without compromising user experience, and support the BYOD movement. Total cost of ownership is further reducedby simplifying enterprise data management with visibility across your entire virtualized infrastructure, including end-to-end management of your virtual GPU infrastructure.>Uncompromised Security. The healthcare industry is experiencing massive growth of data coupled with the rising trend to support a more mobile workforce and BYOD programs. IT can now expand virtualization to more users with secure access to critical clinical applications on any device, and still adhere to the federally-mandated Health Insurance Portability and Accountability Act of 1996 (HIPAA) and Health Information Technology for Economic and Clinical Health (HITECH) Act.>Improve Quality of Care. Allowing healthcare professionals to access information anywhere, on any device enables better collaboration between doctors and specialists, as well as better information sharing with patients. Physicians no longer have to waste significant amounts of time during patient rounds accessing, retrieving, and recording data, since information isnow readily available at their fingertips. This increased efficiency frees up more time for direct patient care.>Support Any Workload. IT can leverage the same infrastructure used for VDI to run compute intensive workloads — including AI, data science, and HPC — to support the needs of researchers, and other hospital departments such as radiology, neurology, and cardiology.NVIDIA VIRTUAL GPU SOLUTIONSCUSTOMER EXAMPLESFor more information, visit /virtualgpu© 2022 NVIDIA Corporation. All rights reserved. NVIDIA, the NVIDIA logo, and Iray are trademarks and/or registered trademarks of NVIDIA Corporation. All company HOW NVIDIA VIRTUAL GPU WORKSIn a virtualization environment powered by NVIDIA virtual GPU, theNVIDIA virtual GPU software is installed at the virtualization layer along with the hypervisor . The NVIDIA virtual GPU software creates virtual GPUs enabling every virtual machine (VM) to share the physical GPU installed on the server. The NVIDIA virtualization software includes a graphics driver for every VM. vWS includes for example, the powerful Quadro driver . Because work typically done by the CPU is offloaded to the GPU, the user has a much better experience. Demanding engineering and creative applications, as well as compute intensive server workloads including AI and data science, can now be supported in a virtualized and cloud environment.WHAT MAKES NVIDIA VIRTUAL GPU POWERFULRegular cadence of new software releases to ensure you stay on top of the latest features and enhancementsCONTINUOUS INNOVATIONSupport for all major hypervisors. Most extensive portfolio of professional app certifications with RTX Enterprise driversBROADEST ECOSYSTEM SUPPORT Industry’s highest user-density solution with support for up to 64 virtual desktops per GPU. Lower TCO with more than 9 vGPU profiles for the most flexibility in provisioning resources to match your users’ needsBEST USER DENSITYEnd-to-end management and monitoring for real-time insight into GPU performance. Broad partner integrations so you can use the tools you know and loveOPTIMAL MANAGEMENT AND MONITORING Ultimate user experience, with the ability to support both compute and graphics workloads for every vGPUEXCEPTIONAL USER EXPERIENCE Consistent performance with guaranteed quality of service, whether on premises or in the cloudPREDICTABLE PERFORMANCE。

华为FusionSphere 5.1容灾方案白皮书(服务器虚拟化)

华为FusionSphere 5.1容灾方案白皮书(服务器虚拟化)

华为FusionSphere 5.1 容灾方案白皮书文档版本V1.0发布日期2014-09-05版权所有© 华为技术有限公司2014。

保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。

商标声明和其他华为商标均为华为技术有限公司的商标。

本文档提及的其他所有商标或注册商标,由各自的所有人拥有。

注意您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。

除非合同另有约定,华为公司对本文档内容不做任何明示或暗示的声明或保证。

由于产品版本升级或其他原因,本文档内容会不定期进行更新。

除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。

华为技术有限公司地址:深圳市龙岗区坂田华为总部办公楼邮编:518129网址:目录1 容灾简介 (1)1.1 云计算容灾概述 (1)1.1.1 容灾简介 (1)1.1.2 容灾系统的评价指标 (1)1.1.3 容灾系统建设过程 (2)1.1.4 容灾系统的实现分类 (3)1.2 FusionSphere容灾方案简介 (4)2 FusionSphere容灾方案介绍 (7)2.1 UltraVR基于主机远程复制容灾方案 (7)2.1.1 方案概述 (7)2.1.2 适用场景 (8)2.1.3 方案组网 (9)2.1.4 方案特点 (12)2.2 UltraVR基于存储远程复制容灾方案 (12)2.2.1 方案概述 (12)2.2.2 适用场景 (14)2.2.3 方案组网 (16)2.2.4 方案特点 (19)2.3 城域双活容灾方案 (19)2.3.1 方案概述 (19)2.3.2 适用场景 (20)2.3.3 方案组网 (21)2.3.4 方案特点 (23)2.3.5 VIS产品简介 (23)2.4 第三方应用层容灾方案 (24)2.4.1 方案概述 (24)2.4.2 适用场景 (24)2.4.3 方案组网 (24)2.4.4 方案特点 (25)3 综述:FusionSphere容灾方案对比分析 (26)4 术语 (28)容灾方案白皮书 1 容灾简介1 容灾简介1.1 云计算容灾概述随着云计算的蓬勃发展,越来越多重要的计算机信息系统出现在云计算中。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

华为FusionSphere
虚拟化套件GPU直通技术白皮书
目录
1 简介 (1)
1.1 背景简介 (1)
1.2 方案简介 (1)
2 技术和方案介绍 (2)
2.1 PCI直通方案 (2)
2.1.1 方案概述 (2)
2.1.2 适用场景 (3)
2.1.3 方案特点 (3)
2.2 GPU资源组方案 (4)
2.2.1 方案概述 (4)
2.2.2 适用场景 (4)
2.2.3 方案特点 (6)
3 术语 (6)
1 简介
1.1 背景简介
随着信息化社会的飞速发展,大数据分析、深度学习等新技术的不断涌现,高性能计
算不仅应用在石油勘探、地震分析、流体力学计算、分子运力学等传统领域,互联
网、金融、政府信息化、教育等领域对高性能计算的需求也飞速增长。

GPU在高性能计算领域的使用,使得CPU不再是计算芯片的唯一选择。

与CPU相
比,GPU具备更强大的计算能力以及更简单的任务处理模式,在高性能计算领域扮演
者越来越重要的角色。

与此同时,在传统的图形渲染领域,包括虚拟桌面、游戏、工业设计、影视渲染等场
景中,GPU也扮演者不可替代的角色。

GPU直通方案,为虚拟机提供接近于物理GPU能力的GPU设备。

1.2 方案简介
华为FusionSphere虚拟化套件针对不同的业务场景及对GPU资源的使用情况,提供以
下两种有针对性的解决方案:
•主机PCI设备直通
•GPU资源组
FusionSphere 虚拟化套件使用PCI 直通技术将GPU 设备直通给虚拟机,即将GPU 在计算节点中呈现的PCI 设备直接绑定给虚拟机以呈现成为虚拟机的一个PCI 设备。

Virtual Machine Virtual Machine Hypervisor Graphics Driver GuestOS
Application
GuestOS Application Graphics Driver
GPU
GPU
GPU GPU
2
技术和方案介绍
2.1 PCI 直通方案
2.1.1 方案概述 FusionSphere 虚拟化套件在主机(计算节点)启动等时机主动发现其以装配的GPU 设备,这些GPU 设备可直接绑定给虚拟机。

Host Host
Virtual Machine
GPU
GPU GPU GPU GPU GPU GPU
GPU
Virtual Machine
GPU GPU
2.1.2 适用场景
使用场景
适用于对GPU资源需求明确,需要对GPU进行持续独占使用的场景。

例如:地震分析、视频云等领域
使用约束
PCI直通方案存在以下约束:
1、虚拟机必须与GPU设备所在主机绑定;
2、已直通GPU设备的虚拟机不支持内存快照;
3、已直通GPU设备的虚拟机不支持热迁移、休眠、唤醒操作;
4、仅支持在GPU关闭状态下进行GPU设备的绑定与解绑定操作;
5、一个GPU只能绑定给一个虚拟机或一个GPU资源组;
6、需要进行GPU直通的虚拟机的内存必须全部预留;
7、每个虚拟机最多支持直通8个GPU设备;
8、需要提前在主机的BIOS中开启VT-d和VT-x支持。

不同厂商服务器开启的方式会有
区别,请参考具体的服务器帮助文档;
2.1.3 方案特点
绑定GPU的虚拟机,不会因为GPU资源不足导致虚拟机无法启动
说明
即使绑定GPU的虚拟机的电源已关闭,GPU也不能被其他虚拟机使用
2.2 GPU资源组方案
2.2.1 方案概述
GPU资源组方案需要管理员首先创建以直通方式使用的GPU资源组,并将主机上的
GPU设备添加到资源组中。

在需要对虚拟机分配GPU资源时,直接将GPU资源组绑
定给虚拟机,并指定预计在资源组中分配的GPU数量。

客户虚拟机启动时,GPU资源组按照虚拟机所需的GPU数量,找到空闲的GPU数量
满足条件的主机,并从该主机中分配所需数量的GPU资源以PCI直通的方式直通给虚
拟机,以使虚拟机顺利启动。

客户虚拟机在关闭后,GPU资源会释放给资源组,此时这些GPU资源可以被分配给其
他虚拟机使用。

Host Host
Virtual Machine
GPU
GPU GPU GPU GPU GPU GPU
GPU
Virtual Machine
GPU GPU
GPU Group
相比于FusionSphere虚拟化套件6.3之前的版本,该方案支持在一套环境中同时使用多
种规格的GPU卡,只需将不同的GPU卡划分在不同的资源组中即可。

该方案可以支
持系统中存在需要使用不同GPU的应用的情况,同时也可在设备演进中平台地支持
GPU卡进行更新换代。

多种GPU卡是否可以同时直通给一台虚拟机,需要从虚拟机操作系统供应商以及显卡
芯片厂商处获取支持。

说明
每个GPU资源组可以管理相同产品型号的GPU资源,虚拟机可以通过绑定多个不同
产品型号的GPU资源组以挂载不同型号的GPU设备,但是这些设备在虚拟机的操作
系统中是否可以正常使用,由GPU的驱动程序以及操作系统决定。

2.2.2 适用场景
使用场景
适用于对GPU资源需求存在弹性,允许进行GPU分时复用的场景。

场景举例:大数据分析、深度学习、互联网、教育等领域
例如:
分时复用
某公司有3种业务A、B、C均需要使用GPU,但各业务运行的高峰时段存在明显差
异,如下表所示:
在此种场景下,为满足所有业务在高峰时段对于GPU的诉求,共需配备13块GPU;
而各业务存在明显的高峰时段差异,此时对各高峰时段进行分析得出在每个高峰时段
中,所需要的GPU数量都不超过9个,如下表所示:
展节点(虚拟机)的方式进行扩容,在脱离高峰时段时进行缩容,只需配备9块
GPU,即可满足所有业务在各自高峰时段对GPU的诉求。

此种相同GPU在不同时间由不同的系统或应用使用的情况即为分时复用。

使用约束
GPU资源组方案存在以下约束:
1)同一台虚拟机所使用的GPU必须集中在同一台主机上,当任意主机空闲的GPU不足
以满足虚拟机运行所需时,即使资源组中的空闲GPU总量满足,虚拟机也无法被分
配到所需的GPU资源;
2)已直通GPU设备的虚拟机不支持内存快照;
3)已直通GPU设备的虚拟机不支持热迁移、休眠、唤醒操作;
4)仅支持在GPU关闭状态下进行GPU设备的绑定与解绑定操作;
5)一个GPU只能绑定给一个虚拟机或一个GPU资源组;
6)需要进行GPU直通的虚拟机的内存必须全部预留;
7)每个虚拟机最多支持直通8个GPU设备;
8)需要提前在主机的BIOS中开启VT-d和VT-x支持。

不同厂商服务器开启的方式会有
区别,请参考具体的服务器帮助文档;
2.2.3 方案特点
允许对GPU资源进行超分配,同一个GPU在多个虚拟机间分时复用
由一个应用释放出来的GPU可以被其他应用使用
说明
在GPU资源不足时,绑定GPU资源的已关闭电源的虚拟机不支持启动,如果需要启
动虚拟机,需要将占用GPU的虚拟机关闭电源以释放GPU资源
3 术语。

相关文档
最新文档