Oracle RAC集群的简单介绍
linux oracle rac

– #find /lib/modules –name “hangcheck-timer.ko” – #vi /etc/modprobe.conf ~options hangcheck-timer hangcheck_tick=30 hangcheck_margin=180 – #vi /etc/rc.local ~ /sbin/modprobe hangcheck-timer – #modprobe hangcheck-timer – #grep Hangcheck /var/log/messages |tail -2
2、为oracle配置Linux服务器
交换空间:
– oracle10g至少512m内存 – #cat /proc/meminfo | grep MemTotal – #cat /proc/meminfo | grep SwapTotal
内核参数: – #sysctl –a | grep * – #vi /etc/sysctl.conf //编辑 – #sysctl –p //生效
配置网卡 自定义安装程序、工具
配置网卡
节点1:
en0: 取消DHCP设置 IP:143.168.2.103 网络掩码:255.255.255.0 en1: 取消DHCP设置 IP:10.2.2.103 网络掩码:255.255.255.0 en2: 取消DHCP设置 IP:10.2.1.103 网络掩码:255.255.255.0
crs oracle 集群件 2048M iSCSI asm1 oracle ASM 卷1 6000M iSCSI asm2 oracle ASM 卷2 6000M iSCSI asm3 oracle ASM 卷3 6000M iSCSI asm4 oracle ASM 卷4 6000M iSCSI
Oracle12cRAC数据库集群运维宝典

Oracle12cRAC数据库集群运维宝典2019.04Oracle RAC 是实现数据库⾼可⽤部署的产品,⽬前流⾏的12c 版本与旧版相⽐有较⼤变化,包括概念、命令、⽇志等。
是根据实战经验总结的管理RAC 必须掌握的运维技能,每条命令都经过实践检验⽽毫⽆保留地奉献给读者。
1基本概念RAC -Real Application Clusters (实时应⽤集群)。
GI -Grid Infrastructure (⽹格架构也称为cluster?Ware)。
ASM -Automatic Storage Management (⾃动存储管理)。
TAF -Transparent Application Failover (透明应⽤切换)。
CRS -Cluster Ready Service (集群就绪服务)。
CSS -Cluster Synchronization Services (集群同步服务)。
ONS -Oracle Notification Service (通知服务)。
VIP -Virtual IP (虚拟IP),浮动的IP,某节点宕机,其VIP 会⾃动切换到其他节点。
SCAN -Single Client Access Name (简单客户端连接名),提供给⽤户使⽤的服务IP。
OCR -Oracle Cluster Resource (集群配置信息),从12CR2开始,GI 开始把集群的配置信息进⾏本地化。
CRSCTL:为Oracle 集群控制⼯具,提供对集群和底层组件的管理功能。
SRVCTL:为服务控制⼯具,⽤于管理Oracle 集群中的资源和实体。
2RAC 配置与架构Oracle 12c RAC 由GI、ASM、RDBMS 组成,其中GI 是集群软件,要安装数据库,必须先安装GI;ASM 实现卷管理和共享存储,已经集成到GI 中;RDBMS 即数据库。
配置要求如下:2.1硬件配置对于⼀个RAC 数据库⽽⾔,⾄少应包括两个节点。
oracle rac和备份方案

ORACLE RAC及备份方案ORACLE RAC简介:ORACLE RAC集群是实现多机共享数据库,以保证应用的高可用性。
同时可以自动实现并行处理及均分负载,还能实现数据库在故障时的容错和无断点恢复。
集群内部的所有服务器共享存储,所有服务器都接入公共网络,通过集群唯一的别名对外形成逻辑上单一的数据库提供服务,对内实现集群数据库的高可用性、节点间的负载均衡和Failover(失败切换)。
逻辑结构:集群纵向看是由存储、数据库集群、应用集群三部分组成,横向来看,是由多台应用服务器、数据库服务器和存储设备组成。
物理结构:RAC物理结构图。
优势:高可用性:RAC 为数据中心的高可用性奠定了基础。
它也是 Oracle 最高可用性架构不可或缺的一部分,为实现数据中心的最高可用性提供了最佳实践。
RAC 还为高可用性数据管理提供了以下至关重要的关键特性:可靠性:Oracle 数据库以其可靠性而著称。
RAC Clusters 消除了数据库服务器单点故障问题,从而使可靠性更上一层楼。
如果一个实例发生故障,服务器池中的其余实例仍将保持运行状态。
Oracle Clusterware 可监视所有 Oracle 进程,并能立即重启任何生故障的组件。
恢复能力:Oracle 数据库包含的许多特性有助于数据库轻松地从各类故障中恢复。
如果Oracle RAC 数据库中的一个实例出现故障,服务器池中的另外一个实例将察觉到这一故障,随后自动进行故障恢复。
利用快速应用程序通知 (FAN)、快速连接故障切换 (FCF) 和透明应用程序故障切换 (TAF) 这三个功能,应用程序可以轻松地掩藏组件故障,使用户无法察觉。
错误检测:Oracle Clusterware 可自动监视 Oracle RAC 数据库和其他 Oracle 进程(ASM、监听器等),并快速诊断环境中的问题。
它还经常能在用户察觉之前自动完成故障恢复。
利用快速应用程序通知 (FAN),应用程序即可在集群组件出现故障时立即得到通知,以便在故障显现之前重新发布事务。
关于oracle的RAC

关于oracle的RACsaintfei:从网上搜集的文章集合整理而成,对ora的rac的组件和体系结构有了基本的认识。
下面为个人总结归纳:实例概念一组进程和对应的数据结构数据库是一个箱子,实例相当于机械手一台机器上一个库只能对应一个实例Rac一个库多个实例,并行。
每个实例运行在一个物理机器上,可以负载均衡,发生故障可以有状态切换。
需要能让多个机器同时读写的共享磁盘,可以由操作系统提供(AIX concurrent vg,Linux GPFS,)但concurrent vg是操作系统的双机软件中的组件所以必须安装ha软件。
可以用ora的ASM。
crs为ora的集群软件,提供ip切换等集群功能。
ASM功能类似LVM为os提供存储管理功能,但是是不可管理,把lun划给即可。
RAC模式,两个实例操作同一个数据库。
常用的方式是客户端连接的时候分别使用ip1加实例名和ip2加实例名的方式连接两个实例。
当一台主机故障之后,ip会切换到另一台主机上,但实例名变化了,仍然无法连接。
所以有了服务名的概念。
客户端使用ip加服务名方式连接数据库可以解决问题,切换比操作系统双机快。
但是对于tuxedo长连接的方式,没有重连接机制,仍然需要应用干预。
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------以下摘自:/share/detail/23532601一集群环境下的一些特殊问题1.1 并发控制在集群环境中,关键数据通常是共享存放的,比如放在共享磁盘上。
而各个节点的对数据有相同的访问权限,这时就必须有某种机制能够控制节点对数据的访问。
rac集群scanip运行原理

rac集群scanip运行原理RAC (Real Application Clusters) 是Oracle数据库提供的一种高可用性和可伸缩性解决方案,它允许将多台服务器连接在同一个集群中,共享一个数据库。
在RAC集群中,每台服务器被称为一个节点,每个节点都可以运行数据库的一个实例。
这些实例可以同时访问和处理共享的数据库。
RAC集群的scanip (Single Client Access Name) 功能充当了前端应用程序和后端数据库之间的中间人,它提供一个虚拟的IP地址,应用程序可以使用该IP地址连接到RAC集群中的任何一个节点。
scanip的主要工作原理如下:1. IP地址管理:在RAC集群中,多个节点共享一个数据库,每个节点都有自己的私有IP地址。
scanip负责管理这些私有IP地址并为它们提供一个共享的虚拟IP地址。
应用程序连接到scanip时,它会将连接请求转发到正在提供服务的节点上。
2. 节点监控:scanip通过定期PING命令来监控集群中的节点是否可用。
如果一些节点不可用,则扫描IP将不再将请求转发给该节点,从而确保应用程序的连续性。
3. 加载均衡:scanip通过动态分配连接请求到不同的节点来实现负载均衡。
它根据节点的负载情况和可用性来决定将连接请求发送到哪个节点上。
这样可以确保集群中的每个节点都能够平均地处理查询请求,并最大限度地提高整个系统的性能和可用性。
4. 透明重定向:如果一个节点从集群中移除或添加到集群中,scanip可以自动地将连接请求重定向到新的节点上,而不需要应用程序进行任何修改。
这种透明的重定向功能可以最大限度地减少应用程序的停机时间和不可用性。
5. 高可用性:scanip本身也是一个高可用性组件,它可以动态分配虚拟IP地址到集群中的多个节点。
如果一些节点或者网络发生故障,scanip可以自动重新分配虚拟IP地址到其他正常工作的节点上。
这样可以确保应用程序的连续性和高可用性。
oracle rac原理

oracle rac原理
Oracle Real Application Clusters(RAC)是Oracle的非常流
行的高可用集群数据库解决方案。
它通过在多台服务器上运行多份同
步数据副本来构建可靠,具有高可用性和可伸缩性的数据库解决方案。
Oracle RAC的基本原理是多实例,它使用多节点配置来共享单个物理数据库(不是虚拟数据库)。
每个节点的多实例模式使用Oracle Database和Oracle Clusterware实例作为主要组件,这些实例之间都使用称为Global Cache Services(GCS)的全局缓存服务通信。
Oracle Clusterware是一组系统软件,用于在RAC中的多个服务器节点之间管理群集应用程序。
Clusterware可以处理资源冲突,负责对故障进行检测并将故障转移到另一节点,以便实现无缝连续性。
RAC中每个应用程序可以拥有多个并行连接,这可以充分利用系
统资源,并且可以更快地处理负载。
然后,可以根据系统负载增加额
外的节点,以提高处理能力。
Oracle RAC提供了多层次数据库可用性,有助于避免单点故障。
它使用预配置的高可用性策略来检测和保护数据,如自动故障转移和
多节点卷分发(ASM)等。
总之,Oracle RAC是一种应用于多节点服务器的完整集群解决方案,可提供高可用性和可伸缩性,可以最大限度地减少停机时间,从
而提高数据库效率。
第29章 Oracle RAC服务器配置和管理

29.3
安装数据库软件
Oracle Clusterware安装完成后,接下来需要安装的 安装完成后, 安装完成后 是数据库软件. 的数据库安装文件与第28章中 是数据库软件.Oracle RAC的数据库安装文件与第 章中 的数据库安装文件与第 所介绍的单机版的Oracle安装文件相同,但安装的步骤以及 安装文件相同, 所介绍的单机版的 安装文件相同 选项有所差异.用户只需要在节点主机RAC1上安装 上安装Oracle 选项有所差异.用户只需要在节点主机 上安装 11g即可,Oracle通用安装程序会自动把文件复制到集群中 即可, 即可 通用安装程序会自动把文件复制到集群中 其他的所有主机节点上. 其他的所有主机节点上.
如何获得Clusterware Clusterware安装包 29.2.1 如何获得Clusterware安装包
可通过Oracle官方网站 官方网站下载 可通过 官方网站 下载 Clusterware 11g的软件安装包. 的软件安装包. 的软件安装包
安装Clusterware Clusterware的硬件环境要求 29.2.2 安装Clusterware的硬件环境要求
29.2.4 网络配置
Oracle 11g RAC可以支持多个 可以支持多个RAC主机节点,本例仅安装 主机节点, 可以支持多个 主机节点 两个主机结点,主机名分别为rac1和rac2.每台主机都有两张网 两个主机结点,主机名分别为 和 . 卡.
主机 rac1 rac1 rac1 网卡 eth0 eth1 IP地址 172.20.31.111 192.168.0.111 172.20.31.113 用途 rac1的公共网络地址 rac1的心跳网络地址 rac1的数据库服务虚拟地址,不需要在 网卡上设置,安装Clusterware后会自动 启用 rac2的公共网络地址 rac2的心跳网络地址 rac2的数据库服务虚拟地址,不需要在 网卡上设置,安装Clusterware后会自动 启用
Oracle RAC 10g 概述

Oracle RAC 10g 概述Oracle 白皮书2003 年11 月Oracle RAC 10g 概述1目录引言 (3)企业网格 (3)为实现大规模部署不懈努力 (4)什么是RAC? (4)ORACLE 真正应用集群 10G 的新功能 (6)集成集群件管理 (6)单一系统映像管理 (8)自动工作负载管理 (9)工作负载监视 (10)资源管理 (10)Oracle 工具 (11)快速连接故障切换 (11)用于灾难恢复的 Data Guard 集成 (12)集群验证和改进的诊断工具 (12)性能改进 (13)零停机时间补丁 (14)结论 (16)Oracle RAC 10g 概述2Oracle RAC 10g 是企业网格的一项主要基础技术。
它减弱了阻碍Oracle RAC 技术推广普及的壁垒,有助于实现“RAC 无处不在”的宏伟目标。
在企业网格中,数据中心将可以动态改变自身特性,以实时支持企业瞬息万变的需求。
引言Oracle 真正应用集群(RAC) 10g 主要用于管理领域。
Oracle RAC 10g 和Oracle 数据库10g 在管理方面的改进显著降低了管理成本,并提供了更出色的灵活性,从而赋予了企业更高的适应性、前瞻性和敏捷性。
Oracle RAC 10g 是企业网格的一项主要基础技术。
它减弱了阻碍Oracle RAC 技术推广普及的壁垒,有助于实现“RAC 无处不在”的宏伟目标。
企业网格现在,企业的IT 部门面临巨大的压力,他们需要以最低的成本,最高的效率和灵活性,提供优质的服务,同时具有最出色的可用性和可伸缩性。
简而言之,IT 部门需要以最低的成本,完成最多的事情。
企业网格能够把这些看似无法解决的挑战变成现实。
它由大规模的低成本商用集群组成,显著降低了计算机硬件的成本。
Oracle RAC 技术可为这一低成本硬件平台提供支持,使其提供优质的服务,并达到或超出昂贵的大型SMP 计算机所能提供的可用性和可伸缩性等级。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Oracle RAC集群的简单介绍一、 Oracle集群体系结构Oracle RAC,全称是 Oracle Real Application Cluster,即真正的应用集群,是Oracle 提供的一个并行集群系统,整个集群系统由 Oracle Clusterware (集群就绪软件)和 Real Application Clusters(RAC)两大部分组成。
oracle RAC的实质是位于不同操作系统的Oracle实例节点同时访问同一个Oracle数据库,每个节点间通过私有网络进行通信,互相监控节点的运行状态,oracle 数据库所有的数据文件、联机日志文件、控制文件等均放在集群的共享存储设备上,而共享存储设备可以是 RAW、ASM、OCFS2 等,所有集群节点可以同时读写共享存储。
Oracle RAC 的基本拓扑结构如下所示:由拓扑结构可知:一个 Oracle Rac 数据库有多个服务器节点组成,每个服务器节点上都有自己独立的 OS、ClusterWare、oracle Rac 数据库程序等,并且每个节点都有自己的网络监听器。
ClusterWare 是一个集群软件,主要用于集群系统管理,oracle Rac 数据库程序用于提供 oracle 实例进程,以供客户端访问集群系统,监听服务主要用于监控自己的网络端口信息,所有的服务和程序通过操作系统都去访问一个共享存储,最终完成数据的读写。
共享存储的实现方式有很多种,可以通过使用自动存储管理(ASM)、Oracle 集群文件系统(OCFS)、裸设备(Raw)、网络区域存储(NAS)等来保证整个集群系统数据的一致性。
从 Oracle10g 起,Oracle 提供了自己的集群软件,即 Oracle clusterware,它通过 CRS(即 Cluster Ready Services)来实现,这个软件是安装 oracle rac 的前提,也是 RAC 环境稳定运行的基础,在 oracle10g 之前的版本,安装 RAC 时必须借助与第三方的集群软件,而在 oracle10g 以后,安装 oracle rac 时,可以用 oracle 自带的集群软件,也可以使用经过 RAC 认证的第三方集群软件来代替。
从 oracle 的运行机制来说,集群中每台服务器就是一个oracle 实例,多个 oracle 实例对应同一个 oracle 数据库,组成了 oracle数据库集群。
请看下图:从图中可以看出,运行在两个节点上的数据库实例访问同一个RAC 数据库,并且两个节点的本地磁盘仅用来存放 oracle 安装程序和 ClusterWare 软件,而在共享存储上,存放了 oracle 的数据文件、控制文件、联机日志文件、归档日志文件等,这是安装 oracle Rac 时的一种数据存储分配方式,其实,RAC 提供了多种数据存储方式,这个将在下面进行独立介绍。
二、 Oracle Clusterware 体系结构与进程介绍2.1、Oracle Clusterware 简介Cluster Ready Services,简称 CRS,是 oracle 开发的一个集群软件,与其它集群软件类似,CRS 主要完成集群成员管理、心跳监控、故障切换等功能,CRS 要求每个集群节点的操作系统必须相同,这样,通过 CRS 将多个节点的操作系统绑定到了一起,客户端对集群的访问,就像访问一台服务器一样。
CRS 主要有两个集群套件组成,分别是 voting disk 和 OracleCluster Registry。
voting disk,即为表决磁盘,集群中每个节点定期评估自身的健康情况,然后会把它的状态信息放入到表决磁盘上。
并且节点间也会互相查看其运行状态,并把信息传递给其他节点进而写入表决磁盘。
当集群节点发生故障时,还可以通过表决磁盘进行投票仲裁等,因此,表决磁盘必须放在共享存储设备上。
以保证每个节点都能访问到。
表决磁盘可以是一个裸磁盘分区,也可以是一个独立的文件。
由于它仅记录节点运行信息,磁盘大小一般在 10-20M 左右即可。
Oracle Cluster Registry,简称 OCR,即集群注册服务,OCR 主要用于记录 RAC 中集群和数据库的配置信息。
这些信息包括了集群节点的列表、集群数据库实例到节点的映射以及 CRS 应用程序资源信息。
CRS 使用两种心跳设备来验证节点成员的状态,保证集群的完整性:一个是表决磁盘,集群同步服务进程每隔几秒钟都会向表决磁盘写入一条心跳信息,集群通过表决磁盘即可验证节点的状态,如果某个节点在指定的最大时间段内没有向表决磁盘写入信息,集群就认为此节点失效了,进而执行故障切换。
另一个心跳是节点间私有以太网的心跳,通过这个心跳机制可以判断节点间是否出现了网络故障。
两种心跳机制的结合,有效的增加了集群的可靠性。
另外,CRS 建议用于内部通讯的私有以太网心跳必须与用于 RAC 节点间通讯的网络分开,也就是不能在同一网络中,如果 RAC节点间通讯的网络与私有以太网心跳在同一个网络内,那么,必须保证该网络不能被非集群系统的节点访问到。
2.2、Oracle Clusterware进程介绍Oracle Clusterware 通过 Cluster Ready Services 来完成集群功能,CRS 包含了一组相互协作的后台进程,下面详细介绍下 CRS 中几个很重要的后台进程。
1、Cluster Synchronization Services简称 CSS,用于管理与协调集群中各节点的关系,并用于节点间通信,当节点在加入或离开集群时,都由 css 进行通知集群。
CSS 在集群中对应的后台进程为CSSD,该进程由 oracle 用户运行和管理。
当节点发生故障时,cssd 会自动重启操作系统。
2、Cluster Ready Services简称 CRS,是管理群集内高可用操作的主要程序,在集群中 CRS 管理所有资源,包括数据库、服务、实例、vip 地址、监听器、应用进程等,CRS 在集群中对应的后台进程为 CRSD,该进程可以对集群资源进行启动、停止、监视和容错等操作,正常状态下,CRSD监控节点各种资源,当某个资源发生异常时,自动重启或者切换该资源。
3、Process Monitor Daemon简称 OPROCD,此进程被锁定在内存中,用于监控集群及提供 I/O 防护(I/O fencing)。
OPROCD 运行在每个节点上,且定期执行健康检测,如果在超过它所希望的间隔内,仍然不能和某个节点通信,那么,OPROCD 将会重置处理器及重启节点。
一个 OPROCD故障也将导致 Clusterware 重启节点。
4、Oracle Notification Service简称 ONS,即 oracle 通告服务,主要用于发布和订阅 Fast Application Notification 事件。
5、Event Management简称 EVM,是一个事件检测的后台进程,由 oracle 用户运行和管理。
三、 RAC 数据库体系机构与进程3.1、RAC 简介RAC 是一个具有共享缓存体系结构的集群数据库,它克服了传统的不共享和共享磁盘方法的限制,为所有业务应用程序提供了一种具有可伸缩性和可用性的数据库解决方案,它一般与 Oracle Clusterware 或第三方集群软件共同组成 Oracle 集群系统。
RAC 是一个全共享式的体系架构,它的所有数据文件、控制文件、联机日志文件、参数文件等都必须存放在共享磁盘中,因为只有这样,集群所有节点才能访问到,RAC 支持多种存储方式,可以使用下面几种方式的任意一种:(1)裸设备(Raw devices)也就是不经过文件系统,将数据直接写入磁盘中,这种方式的好处是磁盘 I/O 性能很高,适合写操作频繁的业务系统,但缺点也很明显:数据维护和备份不方便,备份只能通过 dd 命令或者基于块级别的备份设备来完成,这无疑增加了维护成本。
(2)集群文件系统为了支持共享存储,oracle 开发出了集群文件系统 OCFS,这个文件系统可用于 Windows、Linux 和 Solaris,现在已经发展到了 OCFS2,通过 OCFS2 文件系统,多个集群节点可以同时读写一个磁盘而不破坏数据,但对于大量读写的业务系统,性能不是很高。
另外,oracle RAC 也支持第三方的集群文件系统,例如 Redhat 的 GFS 等。
(3)网络文件系统(NFS)(4)ASM,是 Oracle 推荐的共享数据存储方式,它是 Oracle 数据库 10g 包含的一个特性。
ASM 其实就是 RAW 方式存储数据,但是加入了数据管理功能,它通过将数据直接写入磁盘,避免了经过文件系统而产生的 I/O消耗。
因而,使用 ASM 可以很方便地管理共享数据,并提供异步 I/O 的性能。
ASM 还可以通过分配 I/O 负载来优化性能,免除了手动调整 I/O 的需要。
3.2、Oracle RAC的特点通过 RAC 数据库,可以构建一个高性能、高可靠的数据库集群系统,RAC 的优势在于:(1)可以实现多个节点间的负载均衡RAC 数据库集群可以根据设定的调度策略,在集群节点间实现负载均衡,因此,RAC 数据库每个节点都是工作的,同时也处于互相监控状态,当某个节点出现故障时,RAC 集群自动将失败节点从集群隔离,并将失败节点的请求自动转移到其它健康节点上,从而实现服务透明切换。
(2)可以提供高可用服务这个是 Oracle Clusterware 实现的功能,通过 CRS 可以实现节点状态监控,故障透明转移,这保证了oracle 数据库可以对外不间断的提供服务。
(3)通过横向扩展提高了并发连接数RAC 这个优点非常适合大型的联机事务系统中。
(4)通过并行执行技术提高了事务响应时间这个是 RAC 集群的一大优势,通常用于数据分享系统中。
(5)具有很好的扩展性在集群系统不能满足繁忙的业务系统时,RAC 数据库可以很方便的添加集群节点,且可以在线完成节点的添加,并自动加入集群系统,不存在宕机时间;同时在不需要某个集群节点时,删除节点也非常简单。
RAC 数据库也有一定的缺点:1)与单机数据库相比,管理维护更复杂,并对维护人员要求更高2)底层规划设计不好时,系统整体性能会较差,甚至不如单机系统的性能。
所以,如果对 RAC 数据库不是很了解,不建议马上在生产环境中使用。
3)由于 RAC 集群系统需要多个节点,那么需要购买多台服务器,同时需要 oracle 企业级版本数据库,这无形中也增加了软硬件成本。
3.3、RAC进程管理RAC 数据库是由多个节点构成的,每个节点就是一个数据库实例,而每个实例都有自己的后台进程和内存结构,并且在 RAC 集群中,每个实例的后台进程和内存结构都是相同的,从整体上看起来,就像是一个单一数据库的镜像,但是,RAC 数据库在结构上与单实例库也有不同之处:(1) RAC 数据库的每个实例至少拥有一个额外的重做线程(redo thread)(2) RAC 数据库的每个实例都拥有自己的撤消表空间(undotablespace)很显然,这种机制是每个实例独立的使用自己的重做线程和撤消表空间,各自锁定自己修改的数据。