[装机必备]checkpoints文件助力Oracle RAC断点续装 - ORACLE - dbaplus社群：围绕Data、Blockchain、AiOps的企业级专业社群。技术大咖、原创干货，每天精品原创文章推送，每周线上技术分享，每月线下技术沙龙。

[装机必备]checkpoints文件助力Oracle RAC断点续装

Jian Zhang 2016-02-15 11:03:03

安装集群GRID/GI一般包括三个过程：首先，运行OUI/RunInstaller输入集群配置信息。其次，拷贝/编译集群文件。最后，以root用户运行root.sh脚本配置集群/启动集群。

其中运行root.sh脚本是最关键的阶段。接触过很多 SR 都是在这个阶段出现错误导致安装失败。如果问题修复后，需要先deconfigure 已有的配置，然后再运行root.sh。从11.2.0.2版本开始支持重复运行root.sh脚本，也就是说修复问题后，可以直接再运行root.sh，并且从上次失败的地方继续安装（类似”断点续传”）。这个特性在12c中又得到增强。实现这个功能主要是通过将安装阶段信息记录到checkpoint文件和OCR文件来实现：

11.2 checkpoint文件位置:

$ORACLE_BASE/Clusterware/ckptGridHA_${nodename}.xml

12c checkpoint文件位置:

$ORACLE_BASE/crsdata/$hostname/crsconfig/ckptGridHA_${nodename}.xml

下面分享一个安装12.1.0.2 集群GRID/GI, 运行root.sh 脚本失败的案例。

案例分享

在Linux系统上安装12.1.0.2 集群GRID/GI软件，节点2运行root.sh失败，屏幕的错误信息：

以上错误说明节点2无法确认节点1安装状态是否完成。Root.sh是如果来确认节点1安装是否完成呢？需要检查日志：

以上信息说明节点2首先执行cluutil -exec -keyexists -key checkpoints.firstnode命令来查看OCR中的key: SYSTEM.rootcrs.checkpoints.firstnode，失败后又尝试执行OCRDUMP命令，但是OCRDUMP命令也失败。接下来分析OCRDUMP命令也失败的原因：

以上信息提示无法连接ORA-29701 CSS和PROCL-32 OHASD这些都是正常的，因为节点2集群没有启动，这些错误可能会干扰我们分析问题。关键的错误信息是AMDU-00210: No disks found in diskgroup OCR_VOTING，也就是说节点2没有找到ASM disk导致OCRDUMP失败，因此无法确认节点1安装的状态是否完成。接下来我们执行kfed确认ASM disk是否有问题：

在节点1查看/dev/raw/raw1显示disk 类型是KFBTYP_INVALID，并且kfdhdb.vfstart有值，说明raw1在节点1是正常的asm disk，并且是vote disk。但是节点2查看相同的disk，显示完全不同的信息。正常情况下，配置的共享设备raw1在节点1和节点2看到的信息应该是一致的，但是这个case中节点1和节点2看到的是不同的信息，说明共享disk配置是不正确的。

同时，在节点1手动执行OCRDUMP确认key SYSTEM.rootcrs.checkpoints.firstnode是存在的，并且状态是” SUCCESS”。

最后，修改UDEV配置文件(/etc/udev/rules.d/99-oracle-asmdevices.rules)后问题解决。

本文转载自Oracle Blogs

博客地址（https://blogs.oracle.com/Database4CN/entry/12c%E6%96%B0%E7%89%B9%E6%80%A7_root_sh%E8%84%9A%E6%9C%AC%E6%94%AF%E6%8C%81checkpoints%E6%96%87%E4%BB%B6%E5%AE%9E%E7%8E%B0%E9%87%8D%E5%A4%8D%E8%BF%90%E8%A1%8C）

小编精心为大家挑选了近日最受欢迎的几篇热文↓↓↓

（关注订阅号dbaplus，回复以下数字，即可获取相应文章）

回复011，看邹德裕《数据库运维工具化：一切从“简”，只为DBA更轻松》。

回复012，看马育义《Oracle内核系列3-揭秘ASM磁盘头信息》。

回复013，看吕海波《去不去O，谁说了算？》；

回复014，看杨德胜《Oracle故障日志采集“神助攻”—TFA工具详解》；

回复015，看郭耀龙《假事务之名，深入研究UNDO与REDO》；

回复016，看陈能技《基于Docker的开发模式驱动持续集成落地实施》；

回复017，看朱贤文《数据库与存储系统》；

回复018，看卢钧轶《揭秘Facebook数据库备份策略》；

回复019，看杨建荣《看似简单的dual，其实深藏玄机》；

回复020，看黎君原《扒一扒Oracle数据库迁移中的各种坑》。

热门文章

最新评论

: 访客 2024年04月08日

如果字段的最大可能长度超过255字节，那么长度值可能…

: 访客 2024年03月04日

只能说作者太用心了，优秀

: 访客 2024年02月23日

感谢详解

: 访客 2024年02月20日

一般干个7-8年（即30岁左右），能做到年入40w-50w；有…

: 访客 2023年08月20日

230721

活动预告

即将开始

直播预告丨智能运维新范式

时间：2025-10-27形式：线上活动
已结束

邀请函 | 海量数据1024开发者日暨产品发布会即将启航！

时间：2025-10-24形式：线上活动
已结束

20w奖金！OpenCloudOS「高效的容器镜像按需加载和去重挑战赛」直通腾讯面试！

时间：2025-10-23形式：线上活动
已结束

【会议邀请】“2025游戏安全行业研讨"暨"上半年游戏安全洞察报告”发布会来了！

时间：2025-10-21形式：线下活动
已结束

开赛 | KWDB 核心贡献挑战赛，30万奖金池等你来瓜分！

时间：2025-10-15形式：线上活动
已结束

#2025 vivo开发者大会# 分享vivo互联网技术实践经验

时间：2025-10-10形式：线上活动
已结束

完整版议程抢先看：2025第四届XOps产业生态创新发展论坛精彩来袭！

时间：2025-09-26形式：线下分享
已结束

数智引航向量数据库VexDB新品发布会

时间：2025-09-25形式：线上活动
已结束

直播预告 |智能体落地物流场景背后的支撑力量

时间：2025-09-24形式：线上活动
已结束

中国Scrum大会议程全览，本月早鸟团购双重优惠中！

时间：2025-09-20形式：线下活动
已结束

9 月成都，AI 驱动搜索、Serverless 日志分析、Agentic RAG 构建，干货一次吃透！

时间：2025-09-06形式：线下活动
已结束

直播预告 | 智能体技术演进及可观测平台场景落地分析

时间：2025-08-28形式：线上活动
已结束

Gitee Talk | 模力方舟 AI 应用开发沙龙，8 月 23 日下周六广州正式集结！

时间：2025-08-23形式：线下活动
已结束

直播预告 | AI Agent助推下的数据价值释放

时间：2025-08-20形式：线上活动
已结束

直播预告 | 数据库智能化再升级：京东DB运维大模型实践

时间：2025-07-30形式：线上活动
查看更多