Oracle_RAC_12C管理与实战-创新互联
Oracle12C官方文档:从官方网站下载
Oracle12C软件:从官方网站下载,可以免费试用;
高可用:业务不中断、数据不丢失,通过SLA指标来衡量;用于应对计划内升级维护、计划外故障灯场景;
MAA: maximum availability architecture;就是高可用解决方案,如RAC、dataguard、Oracle复制(流复制、高级复制)、GoldenGate(独立)、sharePlex(Dell,独立);
DB2高可用解决方案:HACMP(现更名为PowerHA)、pureScale(类似于oracle rac)、DB2 HADR(类似于oracle dataguard)、CDC(独立软件);
Mysql高可用解决方案: 主从复制、gelara、DRBD、OGG;具体实现方式:DRBD+heartybeat、mysql+keepalived;corosync+peacemaker+DRBD;
RAC历史:从9i引入;从扩展性来讲官方给的数据时可以扩展到100个实例;
RAC缺点:1. 管理维护复杂 2. 磁盘阵列单点,数据可靠性无法保证 3. 扩展性有限;
12C新特性:1.application continuty:应用不间断,针对读或写都适用; 2. 多个ASM实例共享一个ASM口令文件 3. GDS:将多个数据库形成一个数据库池,可以实现负载均衡、故障转移等需求;4. GNS:网格命名服务 5. 执行命令评估 6 Flex ASM:多个数据库实例共享一个ASM实例,达到节约计算资源的目的;7. flex cluster:包括Hub node跟leaf node,其中Hub可以访问共享存储;Leaf node不可以直接访问共享存储,需要通过对应的Hub node来访问;可扩展性高,可以扩展到1000节点;缺点是维护成本高、太多节点没有现实意义;
RAC硬件结构:1. 大型机:分区技术(指的是虚拟化,上世纪70年代就出现,包括物理分区、逻辑分区),特点是计算能力强、可靠性高;缺点是成本高,维护成本高,技术封闭
2.小型机:在价格、可靠性介于PC和大型机之间,几种常见的小型机:如IBM Power+AIX,Sun:SPARC+Solaris、HP:安腾处理器+HP-Unix; 3.PC服务器:价格便宜,性能接近小型机,但可靠性略差,需要从业务层面保证可靠性 4 磁盘阵列:也就磁盘阵列柜,关键技术是Raid(0,1,5,6,10),可以通过软Raid(LVM)或硬件Raid(Raid卡)实现;硬件Raid可以提供BBU(电池)来提供电源保障,一旦BBU出现问题,数据不会写入Raid卡的缓存,会直接写入硬件,影响IO性能 5. Rac网络设计:要考虑网路冗余;
RAC软件构成:包括两个部分,一个室Grid infrastructure(Clusterware+ASM instance)、Oracle RaC(数据库软件),先安装GI,再安装数据库软件;
Clusterware:作用是节点管理(加入、离开)、资源管理(VIP、数据库、监听器、应用程序、其他服务);主要包括的内容:OCR、Voting disk、共享存储、网络、后台进程等;
OCR:oracle集群注册表,用于保存整个集群的资源信息;必须放在共享磁盘上,且应该以多路径镜像保存(保存在多个硬盘上)
从软件上分为两个堆栈:cluster ready service(crsd)、Oracle high availability service(ohasd);
Voting disk:表决磁盘也叫做仲裁盘,作用用来判断节点是否还在集群中;当内部网络出现问题是,比如某个节点的网卡出现故障,为防止闹裂,通过将心跳连同性信息写入到表决文件中来决定将哪个节点从集群中剔除;需要多路径镜像(即表决文件应该在其他多个硬盘上保存);
共享存储软件:OCR、Voting disk、数据文件、联机重做日志、控制文件、参数文件(可选);访问共享存储上文件的方式有三种,一种是ASM(推荐,从11G开始稳定成熟)、一种是OCFS(发展一般),是独立的软件包一种是NFS(不推荐);ASM提Oracle管理存储,
VIP:虚IP,应用程序通过VIP访问数据库,必须跟公有网络在同一个网段内,在安装GI时设定,没有跟特定节点绑定,可以在节点发生故障是进行漂移;
SCAN:single clien access name:不是IP地址是主机名,在安装GI时,安装SCAN监听器;通过SCAN为整体集群提供统一入口,一个SCAN主机名可以映射多个SCAN VIP(可以通过DNS轮训实现),一个SCAN VIP对应一个SCAN 监听器,且与节点没有绑定关系;当用户进行访问时,通过统一的SCAN主机名进行访问,解析到相应的SCAN VIP,与SCAN VIP所在主机联系,这个是否该SCAN VIP所在主机的本地监听器是了解整个集群的负载,如果当面节点负载过重,会要求客户端向负载较轻的SCAN VIP所在节点建立连接;可以提供负载均衡、高可用;
GI安装: 1 安装前检查,先手工检查,再通过CVU检查 2. 启动OUI 3.安装后检查
安装数据库软件及创建数据库:1. 安装数据库 2. 创建数据库 3. 设置搜索路径 4 安装后检查 5. 总结 6 公有网络的管理
数据库和实例的管理:1.实例启动和停止 2.数据库启动和停止(对应所有实例的启动和停止) 3 参数文件,可以是多个节点共享,也可以是每个节点有独立的参数文件 4 会话管理 5 回滚表空间 6 联机重做日志文件 7 负载均衡(客户端、服务端) 8 失败转移(连接时失败转移、运行时失败转移)
故障回切总结:1. 空闲会话可以切换,如在故障前执行了查询,进行故障切换后依然可以进行查询 2. 慢查询:执行慢查询期间发生回切,会向新的节点发出连接,会在新的节点返回慢查询结果 3DML操作:如插入操作,但未提交,进行回切时,在新的节点提交时提示事物状态未明确
ASM概述:类似于操作系统中的逻辑卷管理器,主要作用是加载磁盘组,使得数据库实例能访问磁盘组上的问文件;
ASM实操:1. ASM实例的管理:创建有两种方式,一种是适用ASMCA图形化工具创建,一种是手工方式创建,不推荐手工方式; 2. 磁盘组的管理:有3种冗余,普通冗余(一个磁盘组包括两个失败组,每个失败组至少包括一块ASM磁盘)、高度冗余(一个磁盘组至少包括三个失败组,每个失败组至少包括一块ASM磁盘)、外部冗余; 加载方式:自动加载、手工加载 3. ASM管理工具:ASMCMD,实际使用不多 4. ADVM:也叫做ASM动态卷管理器,是11.2推出的新功能 5. ACFS,是集群文件系统,是对ASM的延伸,除了ASM支持的数据库文件外,还支持视频、图片等文件;不推荐使用,没有太多成功案例,关系可以理解为ASM->ADVM->ACFS;
备份与恢复:有两种备份形式,一种是物理备份(RMAN),一种是逻辑备份(导出、导入),通常使用物理备份;进行热备份时数据库应处于归档日志模式;
故障排查:1.诊断工具:raccheck(需要从官网下载,下载后运行会生成一个html网页,通过 客户端访问 该网页可以生成一个信息汇总页面)、diagcollection.sh(自带,直接 运行即可)、 CHM等;2 诊断层次:操作系统故障(日志文件、)、GI故障(多个日志文件)、ASM故障(警报日志文件)、数据库故障(警报日志文件)等; 3. 常规步骤:crsctl check crs,看四个服务是否 正常;crsctl stat res -t ,查看资源情况; 4. 常见原因:IP地址设置是否正确、DNS解析是否正确、数据库实例是否正在运行、ASM实例是否正在运行、权限设置是否正确、分区是否存在、ASM故障(经常是故障点);
另外有需要云服务器可以了解下创新互联cdcxhl.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。
分享标题:Oracle_RAC_12C管理与实战-创新互联
分享URL:http://myzitong.com/article/hgcho.html