常见 NetBackup 通讯问题及排错一般步 骤
摘要: 摘要: 大约有 20%以上的 NetBackup 备份/恢复失败是由通讯故障引起 的,而不是 NetBackup 自身的问题。而且在处理这些故障时,用 户往往忽略通讯问题的可能。本文从通讯的角度对可能引起 NBU 备份/恢复失败的因素进行分析及列举了一些排错方法。
内容:
大约有 20%以上的 NetBackup 备份/恢复失败是由通讯故障引起的,而不是 NetBackup 自身的问题。而且在处理这些故障时,用户往往忽略通讯 问题的可能。 这是因为一般的应用系统在安装 NetBackup 之前已经有业务系统(如 Oracle)在正常 运行,用户一般会进行简单的名字解析配置, 并使用 ping 命令验证通过。但事实 上,上述这些并不能完全保证 NetBackup 备份/恢复任务正常运行,因为: : ? NetBackup 进程流较一般应用
程序更为复杂,要求精心规划和实施名字解 析、端口使用及防火墙策略。 ? 备份应用会产生海量猝发网络流量,要求更为健壮的网络环境。 症状常见的通讯
问题可能表现为: 症状常见的通讯问题可能表现为: ? 同一个客户端,文件系统备份正常,数据库备份失败。 ? 新加的 Media Server 或 Client,不能正常工作。 ? 备份任务挂起。 常见的通讯问题引起的 NetBackup 错误代码有:23、24、 25、40、41、42 等。 要深入分析并解决备份和恢复中的通讯问题,必须深入了解 NetBackup 的进程 流,但如果遵循一些简单有效的原则,就可以避免、解决大部分的通讯问题。 通讯相关项 正确设置 NetBackup 通讯相关项 首先,要正确设置 NetBackup 通讯相关项,包括: 1. 确认 NetBackup 主机名称。 a. NetBackup 主机名可以从 hostname (短名)、FQDN (Fully Qualified Domain Name,正式域名、长名 )及 virtual name (集群网络资源名)中选择。
b. 一旦确定,坚持统一在所有 NetBackup 场合(Policy, Server Lists)使用,并保 持大小写一致。 2. 确保每个需要服务器权限的 NetBackup 主机,出现在 Server List 中并且名称 无误。 a. 对于 Unix/Linux 主机,Server List 在/usr/openv/netbackup/bp.conf 配置文件的 最前端。 b. 对于 Windows 主机,Server List 在注册表项 HKEY_LOCAL_MACHINE\SOFTWARE\VERITAS\NetBackup\CurrentVersion\Confi g\Server 中 3. 确定 NetBackup 主机与其它主机通讯时所使用的端口范围(Port Range)。建 议使用默认值: a. 侦听端口:13724,1556 b. 向外通讯源端口范围:512-65535 4. 指定 NetBackup 通讯用网络接口,即,Required Interface。当一台 NetBackup 主机有多个
网络接口及 IP 地址时,推荐设置一个固定 IP 地址由于与其 它主机通讯。 a. 对于 Unix/Linux 主机,在 bp.conf 中加入一行:REQUIRED_INTERFACE = ip 地址或网卡主机名 (所谓网卡主机名可以是现有 hostname,
FQDN, virtual name, 也可以是一个任意名字,该名称要通过 etc/hosts 或 DNS 解析为指定 NetBackup 通 讯用 IP 地址) b. 对于 Windows 主机,可以在
注册表中设置该项: HKEY_LOCAL_MACHINE\SOFTWARE\VERITAS\NetBackup\CurrentVersion\Confi g\ REQUIRED_INTERFACE 5. 检查通讯超时设置: a. Client Read Timeout,这是一个客户端属性,缺省值为 300 秒,对于数据库 备份建议则加到 900 以上。 b. Client Connection Timeout,这是一个服务器属性,应当随着 Client Read Timeout 的增加而增加。 检查操作
系统及网络设备的通讯设置 检查操作系统及网络设备的通讯设置
然后,检查操作系统及网络设备的通讯设置 1. 确定 IP 地址 ,包括: a. 主机是否有多个网卡 b. 主机是否有多个 IP 地址,和网卡如何对应,是否有浮动 IP 2. 检查名字解析 (etc/hosts, NIS, DNS) a. 推荐使用本地文件 etc/hosts 作为首选方法,把所有 NetBackup 主机包含在 内,并保持在所有主机上解析一致 b. 如果使用 DNS/NIS/WINS ,可以将其作为第二解析方法,同时