百度基础架构技术发展之路

合集下载

基础架构解决方案

基础架构解决方案
《基础架构解决方案：打造稳定可靠的技术基石》
随着科技的不断发展，基础架构解决方案在各个行业中扮演着越来越重要的角色。

无论是传统行业还是互联网企业，都离不开稳定可靠的技术基石。

基础架构解决方案的设计和实施，直接关系到企业业务的稳定运行和发展。

基础架构解决方案不仅需要满足日常业务需求，还需要考虑未来的扩展性和可维护性。

一个好的基础架构解决方案，应该能够有效地应对各种风险和挑战，确保系统的高可用性和性能稳定。

在当前的多样化技术环境下，基础架构解决方案往往需要涉及到硬件设备、网络架构、数据中心、云计算、安全防护等方面。

因此，基础架构解决方案的设计和实施需要综合考虑各种因素，包括技术选型、系统集成、成本控制、运维保障等。

对于企业而言，一个稳定可靠的基础架构解决方案，可以提高业务的可用性和灵活性，同时也能够降低系统的运维成本和风险。

因此，越来越多的企业开始重视基础架构解决方案的建设和维护。

在实际的项目实施中，基础架构解决方案的设计与选择通常需要依据业务需求、技术趋势、预算限制等因素进行权衡。

只有在全面分析和思考的基础上进行选择和设计，才能够打造出真正适合企业需求的基础架构解决方案。

综上所述，基础架构解决方案是企业技术发展的重要基础，在当前复杂多变的技术环境下，构建稳定可靠的基础架构解决方案显得尤为重要。

只有做好基础架构解决方案的设计和实施工作，才能够为企业业务的成功发展提供有力的支撑。

企业信息化的基础架构与技术框架

企业信息化的基础架构与技术框架随着信息技术的不断发展和应用，企业信息化成为各行各业的发展趋势。

企业信息化不仅能够提高企业的运营效率，降低成本，更能够提升企业的核心竞争力。

建立健全的企业信息化基础架构与技术框架已经成为企业信息化发展的必要手段。

一、企业信息化基础架构1. 数据中心技术数据中心是企业信息化的核心，是管理和运维的核心，需要建立高可用、灵活可扩展、易于管理的数据中心。

数据中心技术包括服务器、存储、网络、安全等方面。

其中，云计算、虚拟化、分布式存储、软件定义网络等技术应用应成为数据中心发展的重点。

2. 传统IT基础架构传统的IT基础架构包括业务系统、企业级应用、数据库等方面。

企业应当在这些方面进行优化、升级，实现更高效、更安全的运转。

通过统一的管理，达到成本降低、效率提升、响应快速等目的。

3. 业务流程与应用集成随着企业应用的不断增加，应用整合和业务流程管理也变得越来越复杂。

应用集成和业务流程协调能力是企业信息化建设的关键。

因此，企业应当构建易于应用集成的服务平台，通过集成、融合不同的应用达到更高效的业务流程协同。

二、企业信息化技术框架1. 移动技术移动化已经成为一个趋势，移动办公、移动支付、移动营销成为企业发展的新方向。

因此，企业应当在移动技术的发展上不断跟进，为移动化的应用提供技术支持。

2. 大数据与分析大数据分析是企业信息化发展的重点。

基于数据分析，企业可以改进运营、研发、市场营销等方面，提高企业效率和竞争力。

因此，企业应当建立自己的数据分析能力，开发和应用大数据分析技术。

3. 云计算与智能化云计算技术具有高效率、低成本、灵活性等特点，在企业信息化中应用越来越广泛。

而智能化技术，则成为企业应对信息化建设中的新挑战。

企业需要不断探索如何将云计算技术与智能化技术整合，实现企业信息化更高效和智能化。

总之，企业信息化基础架构与技术框架的建设，需要全方位的考虑，充分考虑应用、安全、运维等方面的需求，不断积累技术和管理经验，逐步实现企业信息化的可持续发展。

数据中心基础架构的演进史

数据中心基础架构的演进史一、引言数据中心作为现代企业信息化建设的核心基础设施，承载着各种关键业务系统和海量数据的存储、处理和传输。

随着科技的不断发展和企业需求的不断增长，数据中心基础架构也经历了多个阶段的演进。

本文将从数据中心的起源开始，详细介绍数据中心基础架构的演进史。

二、数据中心的起源数据中心的起源可以追溯到上世纪60年代，当时计算机技术刚刚起步，大型计算机主要用于科学计算和军事应用。

数据中心最初是为了集中管理和维护这些大型计算机而建立的，主要包括机房、电力供应、空调系统等基础设施。

三、第一阶段：单一应用数据中心在上世纪80年代和90年代，随着计算机技术的普及和互联网的兴起，企业开始使用计算机进行日常业务处理。

这一阶段的数据中心主要以单一应用为主，通常只有一个主机房和一套基础设施。

数据中心的规模相对较小，主要用于支持企业的核心业务系统，如财务、人力资源等。

四、第二阶段：分布式数据中心随着企业业务的扩展和计算机技术的进一步发展，数据中心逐渐从单一应用发展为支持多个应用系统的分布式数据中心。

该阶段的数据中心通常由多个机房组成，分布在不同的地理位置，通过网络连接起来。

分布式数据中心的优势在于提高了系统的可用性和容错性，一旦某个机房发生故障，其他机房可以继续提供服务。

五、第三阶段：虚拟化数据中心随着虚拟化技术的成熟和应用，数据中心进入了虚拟化时代。

虚拟化数据中心将物理资源抽象化为虚拟资源，通过虚拟化技术将多个虚拟机部署在一台物理服务器上，实现资源的共享和灵活调度。

虚拟化数据中心的优势在于提高了资源利用率和灵活性，降低了硬件成本和能耗。

六、第四阶段：云计算数据中心云计算的兴起使得数据中心进入了新的阶段。

云计算数据中心基于虚拟化技术，通过云平台提供基础设施、平台和软件服务。

用户可以根据实际需求弹性地调整计算和存储资源，实现按需付费。

云计算数据中心的优势在于提供了高度可扩展的计算和存储能力，满足了企业快速发展和业务变化的需求。

集团IT基础架构规划方案

集团IT基础架构规划方案一说到集团IT基础架构规划方案，我就想到那些年我们团队一起熬过的夜，讨论的技术细节，还有那些为了满足业务需求而不断调整的方案。

这次，我就用我的经验，给大家带来一份既实用又接地气的规划方案。

我们得明确一下，IT基础架构规划的目标是啥。

简单来说，就是要满足集团业务发展需求，提高系统稳定性、安全性和可扩展性，降低运维成本。

那么，具体该怎么做呢？1.架构评估与需求分析在开始规划之前，我们需要对现有的IT基础架构进行全面的评估，了解现有系统的性能、可靠性和扩展性。

同时，要对集团的业务需求进行深入分析，了解业务发展趋势，为后续的规划提供依据。

2.架构设计（1）高可用性：确保系统在出现硬件故障、网络故障等情况下，能够快速恢复，减少业务中断时间。

（2）高安全性：采用多层次的安全防护措施，确保数据安全和系统稳定运行。

（3）可扩展性：考虑未来业务发展需求，设计可扩展的架构，便于后续升级和扩展。

（1）服务器虚拟化：通过虚拟化技术，提高服务器资源利用率，降低硬件投资成本。

（2）存储虚拟化：实现存储资源的集中管理，提高存储效率，降低运维成本。

（3）网络架构优化：采用模块化设计，提高网络可靠性和可扩展性。

（4）云计算技术：利用云计算技术，实现资源弹性伸缩，满足业务波动需求。

3.系统集成与迁移（1）兼容性：确保新系统与现有系统的兼容性，避免业务中断。

（2）数据迁移：制定详细的数据迁移方案，确保数据安全、完整地迁移到新系统。

（3）系统集成测试：在迁移完成后，进行全面的系统集成测试，确保系统稳定可靠。

4.运维管理（1）监控与报警：实时监控系统运行状态，发现异常及时报警，快速处理。

（2）备份与恢复：定期进行数据备份，制定数据恢复策略，确保数据安全。

（3）性能优化：定期对系统进行性能评估，针对瓶颈进行优化。

（4）安全管理：建立安全管理制度，定期进行安全检查，提高系统安全性。

5.培训与支持为了确保新系统能够顺利投入使用，我们需要对相关人员进行培训，提高他们的操作技能和运维水平。

百度腾讯系统架构演化

看看腾讯、百度等这样的大型网站系统架构是如何演化的2014-9-29 01:01|发布者: 田云|查看: 715|评论: 0摘要: 前言一个成熟的大型网站(如淘宝、天猫、腾讯等)的系统架构并不是一开始设计时就具备完整的高性能、高可用、高伸缩等特性的，它是随着用户量的增加，业务功能的扩展逐渐演变完善的，在这个过程中，开发模式、 ...前言一个成熟的大型网站(如淘宝、天猫、腾讯等)的系统架构并不是一开始设计时就具备完整的高性能、高可用、高伸缩等特性的，它是随着用户量的增加，业务功能的扩展逐渐演变完善的，在这个过程中，开发模式、技术架构、设计思想也发生了很大的变化，就连技术人员也从几个人发展到一个部门甚至一条产品线。

所以成熟的系统架构是随着业务的扩展而逐步完善的，并不是一蹴而就;不同业务特征的系统，会有各自的侧重点，例如淘宝，要解决海量的商品信息的搜索、下单、支付，例如腾讯，要解决数亿用户的实时消息传输，百度它要处理海量的搜索请求，他们都有各自的业务特性，系统架构也有所不同。

尽管如此我们也可以从这些不同的网站背景下，找出其中共用的技术，这些技术和手段广泛运用在大型网站系统的架构中，下面就通过介绍大型网站系统的演化过程，来认识这些技术和手段。

一、最开始的网站架构最初的架构，应用程序、数据库、文件都部署在一台服务器上，如图：二、应用、数据、文件分离随着业务的扩展，一台服务器已经不能满足性能需求，故将应用程序、数据库、文件各自部署在独立的服务器上，并且根据服务器的用途配置不同的硬件，达到最佳的性能效果。

三、利用缓存改善网站性能在硬件优化性能的同时，同时也通过软件进行性能优化，在大部分的网站系统中，都会利用缓存技术改善系统的性能，使用缓存主要源于热点数据的存在，大部分网站访问都遵循28原则(即80%的访问请求，最终落在20%的数据上)，所以我们可以对热点数据进行缓存，减少这些数据的访问路径，提高用户体验。

缓存实现常见的方式是本地缓存、分布式缓存。

互联网科技行业全栈工程师的职业发展路径

互联网科技行业全栈工程师的职业发展路径在互联网科技行业中，全栈工程师是一种能够同时应对前端和后端技术的多面手。

他们掌握着多种编程语言和技术，能够独立完成一个项目的各个环节。

全栈工程师的职业发展路径多样且前景广阔，接下来我们将探讨他们的职业发展路线。

1. 基础技术能力的建设全栈工程师首先需要建立扎实的基础技术能力，这包括编程语言的学习和常用开发工具的使用。

例如，掌握Java、Python、JavaScript等常用编程语言，并熟悉使用相关的开发框架和工具（如Spring、Django、React等）是必备的技能。

此外，了解数据库管理系统、Linux 操作系统和网络协议等基础知识也是非常重要的。

2. 前端技术的学习作为一个全栈工程师，掌握前端技术是必不可少的。

前端技术主要涉及网页设计、用户界面开发和移动应用开发等方面，包括HTML/CSS、JavaScript框架、UI设计等。

全栈工程师需要学习并掌握常用的前端技术，使得自己能够独立开发用户友好的网站和应用程序。

3. 后端技术的学习除了前端技术，全栈工程师还需要掌握后端技术。

后端技术主要负责服务器端应用程序的开发和维护，包括数据库管理、服务器配置和API接口的设计等。

全栈工程师需要学习并掌握后端开发框架（如Spring Boot、Django等）以及相关的数据库技术（如MySQL、MongoDB等），以实现服务器端的功能。

4. 架构设计和系统集成全栈工程师在项目开发过程中需要参与架构设计和系统集成工作。

他们需要理解整个项目的需求和目标，并能够提出合适的技术解决方案。

全栈工程师需要具备良好的逻辑思维和系统思维能力，能够将不同的模块整合起来构建出完整的系统。

5. 学习新技术和持续进修互联网科技行业的发展非常迅速，新技术层出不穷。

作为全栈工程师，需要不断学习新的技术和工具，以适应行业的发展和变化。

例如，学习云计算、大数据、人工智能等新兴技术，能够帮助全栈工程师在职业发展中保持竞争力。

信息系统的基础架构与发展趋势

信息系统的基础架构与发展趋势信息系统在现代社会中起着至关重要的作用，它们支持着企业、组织和个人的日常运作和决策制定。

信息系统的基础架构是这些系统能够正常运行的基石，同时也是信息系统发展的关键。

本文将探讨信息系统的基础架构以及当前的发展趋势。

一、信息系统的基础架构信息系统的基础架构包括硬件、软件和网络三个方面。

硬件主要指计算机和其他外围设备，如打印机、扫描仪等。

软件则是指应用程序和操作系统等。

网络则是连接这些硬件和软件的通信渠道。

1. 硬件硬件是信息系统中最基本的组成部分。

随着技术的发展，硬件设备愈发强大和高效。

现代的信息系统通常采用先进的服务器、存储设备和网络设备，以支持大规模的数据处理和传输。

此外，移动设备的普及也为信息系统的发展提供了更多的可能性。

2. 软件软件在信息系统中发挥着核心作用。

应用程序能够处理和管理各种类型的数据，并通过用户界面提供给用户。

操作系统则负责管理硬件资源，并提供各种服务和功能。

当前，许多信息系统开始采用云计算和虚拟化技术，以提供更高效的软件支持和管理。

3. 网络网络是信息系统的重要组成部分，它使得不同的硬件和软件能够连接在一起，并进行通信和数据传输。

现代信息系统普遍采用互联网作为网络基础设施，实现了全球范围内的信息交流和数据共享。

此外，无线网络和物联网的发展也为信息系统的架构提供了更大的灵活性和便利性。

二、信息系统发展的趋势随着科技的不断创新和进步，信息系统也在不断发展和演变。

以下是当前信息系统发展的几个趋势：1. 人工智能和大数据人工智能和大数据技术的兴起对信息系统产生了深远的影响。

通过利用机器学习和自然语言处理等技术，信息系统能够更好地处理和分析庞大的数据，帮助企业和组织做出更准确的决策。

这将使得信息系统能够实现更高效的自动化和智能化。

2. 云计算和边缘计算云计算和边缘计算技术的发展为信息系统提供了更高效、灵活的计算和存储能力。

通过将数据和应用程序迁移至云端或边缘设备，信息系统能够更好地应对海量数据的处理和分析需求。

技术细则百度

技术细则百度1. 简介本文档旨在介绍百度公司的技术细则，包括其技术架构、开发规范以及数据安全等方面的内容。

百度是中国领先的互联网公司，提供涵盖搜索引擎、在线地图、在线音乐和视频、电子商务等多个领域的产品和服务。

2. 技术架构百度公司的技术架构采用分布式系统和云计算技术为基础，具有高可用性、可扩展性和灵活性。

以下是其主要组成部分：2.1 分布式存储百度采用分布式存储系统来处理海量数据的存储和访问。

其存储系统具有良好的扩展性和冗余性，能够处理高并发的读写请求，并保证数据的一致性和可靠性。

2.2 分布式计算百度的计算系统基于分布式计算框架，能够进行大规模的数据处理和计算任务。

通过将计算任务划分成多个子任务，并分发到不同的计算节点上执行，可以提高计算效率和处理能力。

2.3 服务治理百度采用微服务架构来实现服务的拆分和管理。

每个服务由一个或多个微服务组成，通过服务治理系统进行统一管理和监控。

服务治理系统包括服务注册中心、配置中心、负载均衡和故障恢复等组件。

2.4 数据安全百度对数据安全非常重视，采用多层次的安全策略和技术来保护用户数据。

包括数据加密、访问控制、安全审计等措施，以确保数据的机密性、完整性和可用性。

3. 开发规范为了保证代码的质量和可维护性，百度制定了一系列的开发规范和最佳实践。

以下是一些主要的开发规范：3.1 代码规范百度采用统一的代码风格和命名规范，以提高代码的可读性和一致性。

包括缩进、命名规则、注释规范等方面的规范。

3.2 测试规范百度鼓励开发人员编写单元测试和集成测试来保证代码的质量。

测试代码要覆盖尽可能多的场景和边界条件，并进行持续集成和自动化测试。

3.3 文档规范百度强调文档的重要性，要求开发人员编写清晰、详细的文档来记录代码和系统的设计。

文档要包括设计思路、接口说明、使用方法等内容。

3.4 版本控制百度使用分布式版本控制系统来管理代码，每个项目都有自己的代码仓库。

开发人员提交代码前需要进行代码审查，并遵循代码合并和发布的流程。

现代网络架构的演进与发展趋势

现代网络架构的演进与发展趋势在当今数字化时代，网络已经成为人们生活和工作中不可或缺的一部分。

从最初的简单连接到如今的复杂智能网络，现代网络架构经历了持续的演进，并且展现出一系列引人瞩目的发展趋势。

早期的网络架构相对简单，主要是为了实现计算机之间的基本通信。

那时，网络速度较慢，功能有限，只能满足一些基本的数据传输需求。

然而，随着技术的不断进步，尤其是互联网的普及，网络的重要性日益凸显，其架构也开始发生深刻的变化。

在过去几十年里，网络架构的演进主要体现在以下几个方面。

首先是带宽的不断提升。

从早期的拨号上网，到后来的 ADSL，再到如今的光纤宽带，网络速度实现了质的飞跃。

这使得高清视频、在线游戏等大流量应用成为可能。

其次，无线网络技术的发展也给网络架构带来了巨大影响。

从 WiFi 的出现到 5G 网络的商用，人们摆脱了线缆的束缚，能够在移动中随时随地接入网络。

再者，网络设备的性能和功能不断增强。

路由器、交换机等设备变得更加智能，能够处理更多的流量和更复杂的网络任务。

如今，现代网络架构正朝着几个明显的趋势发展。

其一，软件定义网络（SDN）逐渐成为主流。

传统网络中，网络设备的控制平面和数据平面紧密耦合，导致网络配置和管理复杂且僵化。

SDN 将网络的控制平面与数据平面分离，通过集中式的控制器来管理网络，实现了网络的灵活配置和动态优化。

这使得网络管理员能够更轻松地调整网络策略，提高网络的服务质量和资源利用率。

其二，网络功能虚拟化（NFV）也在改变着网络的构建方式。

NFV 将传统的网络功能（如防火墙、负载均衡器等）以软件的形式运行在通用服务器上，而不再依赖于专用的硬件设备。

这样不仅降低了成本，还提高了网络功能的部署和管理效率。

其三，云计算对网络架构产生了深远影响。

随着越来越多的企业和个人将业务和数据迁移到云端，网络需要提供高速、稳定、安全的连接。

云数据中心内部的网络架构变得越来越复杂，同时，云与本地网络的融合也成为了一个重要的研究方向。

建设技术基础架构

建设技术基础架构随着信息技术的飞速发展，技术基础架构的建设变得愈发重要。

一个稳定、高效、安全的技术基础架构是企业发展的基石，它为企业的各项业务提供了可靠的支撑。

本文将从设计原则、关键技术和架构演进三个方面探讨技术基础架构的建设。

一、设计原则在建设技术基础架构时，需要遵循一些设计原则，以确保其稳定性和可扩展性。

首先，架构应该具备高可用性，即在面对硬件故障、网络中断等异常情况时，系统依然能够正常运行。

其次，架构应该具备高性能，能够满足企业在高并发、大数据量处理等场景下的需求。

此外，架构应该具备高安全性，能够有效防御各类网络攻击，保护企业的数据资产。

最后，架构应该具备良好的可扩展性，能够根据业务的发展变化进行灵活扩展，以应对不断增长的需求。

二、关键技术在技术基础架构的建设中，有一些关键技术不可或缺。

首先是虚拟化技术，通过虚拟化可以将物理资源抽象为虚拟资源，提高资源利用率，降低硬件成本。

其次是容器化技术，通过容器化可以将应用程序及其依赖打包成一个独立的可执行单元，实现快速部署、扩展和迁移。

此外，还有大数据技术，通过大数据平台的建设和数据分析挖掘，可以帮助企业抓住市场机遇，做出更明智的决策。

另外，云计算技术也是不可忽视的一项技术，在云计算平台的支持下，企业可以灵活调配资源，快速响应业务需求。

三、架构演进技术基础架构的建设是一个持续演进的过程。

随着业务的发展和技术的进步，架构也需要不断演进来满足新的需求。

首先，在架构的初期阶段，可以采用传统的三层架构，将业务逻辑、数据访问和数据存储分离，以实现系统的解耦和灵活性。

随着业务的增长，可以引入微服务架构，将业务拆分成多个小型服务，实现高内聚、低耦合，提高系统的可维护性和可扩展性。

进一步发展，可以引入Serverless架构，将业务逻辑以函数的形式运行在云端，实现更快的开发和部署。

此外，随着人工智能和物联网等新兴技术的兴起，还可以结合边缘计算和分布式存储等技术，构建更智能、更高效的架构。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

欧阳剑百度公司百度基础架构技术发展之路在2014年3月召开的第19届国际体系结构对编程语言和操作系统的支持会议(International Conference on Architecture Sup-port for Programming Languages and Operating Systems, ASPLOS)上，共收录了两篇来自中国大陆第一作者的论文，一篇是中国科学院计算技术研究所陈天石、陈云霁的论文，另一篇是百度公司的论文。

更令人振奋的是，陈氏兄弟的论文被评为最佳论文，百度公司的论文获得了最佳论文提名。

中国互联网公司在国际计算机系统及体系结构顶级会议上发表论文，这在国内工业界是第一次1。

很多同行比较好奇，想了解百度发表这篇论文的情况以及背后的故事，包括百度的研究开发体系以及相关的基础架构技术。

在此感谢CCCF 编辑部的邀请，关键词：ASPLOS2014　最佳论文提名让我们有机会和大家分享百度的混合研究之路及百度基础架构技术的现状和未来。

从ASPLOS 2014百度SDF论文说起在ASPLOS 2014上，百度以“SDF:Software-Defined Flash for Web-Scale Internet StorageSystem ”为题发表的论文成为此次大会录用的49篇论文之一。

国内互联网企业第一次在国际顶尖水平的计算机系统和体系结构会议上发表论文，代表着国际同行对百度公司的认可，也是对我们工作的极大鼓舞。

软件定义闪存(Software-De ﬁned Flash, SDF)，最早是由林仕鼎2在2011年初提出来的。

当时，从产业的角度，云和端的发展趋势已经非常明显；从技术角度，数据中心以后会承载用户绝大部分的计算和存储，而传统的数据中心体系结构仍然沿用PC 的体系结构，无法满足大规模系统对性能、成本、功耗以及可扩展性的要求。

当时百度正在做新一代的存储系统，考虑到传统的固态硬盘(solid state disk, SSD)在性能和成本方面的诸多缺陷，如带宽利用率低、空间利用率低及性能的不可预测等，需要面向数据计算中心重新设计SSD 。

于是，我们开始研制SDF 。

SDF 是一个软硬件协同系统，完全颠覆了SSD 的性能。

SDF 有如下几个特点：●底层Flash 通道用户态的软件是可见的，让软件来管理数据的布局(layout)，使得硬件的并行性能得到充分发挥。

1的Citeseer 影响因子高居CCF 认定的所有计算机系统与高性能计算领域会议的榜首。

在CCF 指定的“计算机系统与高性能计算领域”的五大A 类会议中，大陆科研机构作为第一作者在ASPLOS 上发表的论文只有三篇。

2012年，中国科学院计算技术研究所的论文“关于数据中心上的迭代编译优化”是第一篇。

2014年，有两篇入选ASPLOS ，说明大陆在系统结构研究水平上有了很大提高。

陈天石、陈云霁的论文介绍详见本刊2014年第5期。

2百度公司前首席架构师。

●基于层次到竖井的设计理念，实现了扁平的新文件系统和IO stack，提高了可扩展性并降低了延时。

●与存储系统相结合，读写块的大小尽量与硬件友好。

●资源全局利用，取消硬件通道间的异或校验，存储系统的三副本本身能保证数据的可靠性。

经过两年的努力，SDF研制成功了。

在实际应用的系统上，SDF的性能达到传统商用SSD 的三倍（硬件配置相同），而成本却大大降低，每GB可降低50%。

SDF的研发并不是一帆风顺的。

实际上，当林仕鼎提出SDF 的想法并打算由百度自己设计一款SDF时，百度只有一个硬件工程师和一个软件工程师负责此项目。

最要命的是，这个软件工程师当时还只是个实习生，而硬件工程师从学校毕业后工作也还不到两年。

当时很多人对此项目不抱任何希望，因为在大家的观念中，SSD是非常复杂的软硬件系统，很多专业做SSD的公司都有几十人甚至上百人的研发团队。

而且，SDF的概念非常新，在2011年初，甚至还有点科幻色彩，很多人都觉得不可能实现。

不过后来事实证明，正是SDF非常优雅直观的设计理念和架构，保证了其实现上的简单。

在只有两个人的情况下，花了大概半年多的时间，就完成了SDF初始版本，总共写了不到1万行的RTLverilog代码和3000行的C语言代码，而在这期间，这两个人还兼做了很多其他项目，包括后续将要提到的ARM服务器。

如果是在学术界，SDF完成初始版本，可能就到此为止了。

但工业界的目标是要落地、产品化，系统必须足够稳定，应用程序接口(API)足够好用。

在之后的半年多时间里，我们又发布了第二个版本。

经过长时间、充分的测试，第二版本还开发了轻量级的用户态文件系统以方便用户使用。

随后陆续上线。

第一批20台，第二批100台，第三批500台，每次上线都要运行很长一段时间后下一批才会再上线。

前三批稳定运行半年多，一直都非常顺利。

可是真的没有问题了吗？我们有些庆幸、甚至有些怀疑，当我们以为这个项目将要顺利完成的时候，问题终于在第四批1000多台的上线中暴露出来。

因为在进行硬件设计时的经验不足，对现场可编程门阵列(FPGA)的输入/输出(I/O)没有做足够的约束，导致在数据量大的时候会出现数据不可靠的问题，直接影响了线上的使用。

最初我们以为是硬件逻辑问题，一直没办法定位，那段时间我们承受着巨大的压力。

如果放弃，不仅仅是一年多的努力前功尽弃，还会给公司带来巨大的经济损失，例如硬件采购成本。

经过两三个月的艰难调试，在无数次尝试之后，发现有可能是I/O约束问题，在修改约束之后，数据的可靠性大大提高，使得第四批产品也顺利上图1　SDF与传统SSD的架构区别图2　SDF(b)和传统SSD(a)的IO stack区别线，并且性能数据非常好。

后来我们反思这个问题时发现，最初设计时，出于稳定性的考虑，只上了一个性能仅仅够用的版本，而这个版本的性能只有最终论文上描述的60%左右。

在SDF研发的过程中，我们真切地体会到，做工程和做研究其实是两条并行的道路，并没有太多的交集。

一个感性的想法离发表论文可能不太远，但离实际的规模应用还有十万八千里。

两者对做事情的方法要求也很不同，一个公司如果要想把这两者结合在一起，并且出成果，除了需要工程师的不懈努力外，还需要一套可行的研究及工程研发体系作保障。

SDF做到后期，我们考虑写篇文章把我们的想法和工作发表出去。

起初计划投第11届USENIX文件与存储技术会议(The 11th USENIX Conferenceon File and Storage Technologies, FAST2013)，当时文章其实已经写完了，但最后一刻我们又放弃了，因为我们希望尝试一下向ASPLOS投稿。

这又是一个工业界和学术界不同的地方。

学术界追求更多的产出，所以一般先把子系统、子想法发表在一些专业性更强的会议上，然后再把整体成果发表在系统的会议上。

但在工业界，发表论文是个人行为，工程师本职工作已经非常繁重，基本没有时间和精力来准备论文，所以我们想一步到位，直奔ASPLOS 2014。

由于准备经验不足，而且投稿截止时间刚好和SDF上线撞车，完全是抱着试试看评委们会给什么反馈的心态而仓促上阵。

没想到最后得到的反馈出乎意料的好，六位评委对SDF的工作都非常肯定，一个认为排名前5%，三个认为前25%，两个认为前50%，主要意见都是书写和实验部分，而此时，距离ASPLOS截稿时间只有两周了。

虽然时间紧迫，但ASPLOS的小试牛刀还是极大地振奋了团队，我们重写论文并补充了更多的新实验数据。

这一次，我们终于得到了挑剔的ASPLOS评委们的青睐。

百度为什么要发表论文和谷歌、脸谱等公司一样，百度这样的工业界公司，发论文的主要目的是建立技术品牌，扩大技术影响力，从而吸引更多优秀人才加盟百度。

另一个原因是通过公开自己的技术，回馈社会。

一个公司建立自己的技术品牌，有很多方式，例如做出最酷的产品，也可以开放自己产品或者系统的源代码，或者在顶级会议上发表论文。

谷歌、脸谱在这三方面做得都很不错，所以一直是美国大学生毕业求职最向往的公司之一。

而国内的互联网公司，做了很多产品，也开源了不少自己的系统，但是鲜有在国际顶级学术会议，尤其是计算机系统和体系结构会议上发表文章。

计算机系统和体系结构的研究对平台的依赖大，需要的资源多，一般的研究单位难以获得这样的资源和平台。

而互联网公司拥有大数据和大系统，具有做系统技术研究得天独厚的优势。

以百度为例，有超过1000PB的数据、单个分布式计算集群过万台的服务器。

互联网公司的另一个优势就是有很多真实的问题、挑战和需求，这些都是与互联网用户直接相关的，基于这些问题、挑战和需求来做研究，成果也会直接反馈到用户体验上，更容易引起大家的兴趣，也更容易让人理解。

很多传统的计算机系统及体系结构研究，十几年来一直基于经典的基准(benchmark)来做实验，或者一直基于基准中体现出来的问题来做研究，用互联网领域的流行语来讲就是不接地气。

以百度的SDF和ARM服务器为例，SDF面临的挑战是传统的SSD成本高，性能和容量利用率太低。

而SDF的成果直接应用在百度的网页库上，能间接影响搜索的用户体验。

百度的ARM服务器面临的挑战是云存储的成本太高，导致不能向用户免费赠送太大的存储空间。

我们用ARM服务器降低了存储成本，使得百度网盘在有1亿多用户的情况下，仍然敢于向每个用户免费赠送4TB的存储空间。

这些研究成果是直接惠及每一位用户的。

正是由于互联网公司具有这样的优势，所以最近十年来，每年顶级的计算机系统或者体系结构会议都会有来自互联网公司的文章，而且数量还不少。

百度也希望通过论文的方式，把一些只有在大型互联网公司才能开展的研究和实践方法公开出去。

百度的混合研究发展之路谷歌在《美国计算机学会通讯》(CACM)上发表过一篇文章“谷歌的混合研究方法”3。

该文章的核心思想是把工程和研究紧密地结合在一块，文章的核心语这样说到：“将研究与开发紧密结合，使得谷歌有能力以一种前所未有的规模进行实验，这常常为公司带来新的能力。

”文章提到了五种具体的实践方法。

这五种方法的核心是最终研究目标的产品化。

百度的做法与之类似，其实百度的基础架构部门到目前为止还没有纯粹的研究人员，工作人员的研究工作都是穿插在日常的工程项目中。

这些研究工作的唯一目标就是用更大胆、更超前的想法来把系统或者产品做得更好，这些研究最终都是要应用到实际的系统或者产品中。

百度的研究方法最大的特点就是敢为天下先。

无论是SDF、ARM，还是我们现在正在做的一些工作，都是世界范围内的先例。

我们做SDF的时候，需要重新设计软件和硬件，硬件的架构和软硬件之间的接口都与传统的SSD不同，而且我们的用户又是非常关键的“网页库”，可以有很多理由让这个项目不能落地，例如“新产品不稳定”，“新的架构没经过验证”等等。