富士通双机软件异常恢复过程20140404
- 格式:docx
- 大小:54.82 KB
- 文档页数:3
软件测试中的异常处理与错误恢复一、引言在软件开发过程中,异常和错误是无法避免的。
软件测试作为一种验证和确认软件符合特定要求的方法,异常处理和错误恢复是测试过程中至关重要的一部分。
本文将探讨软件测试中的异常处理和错误恢复的原则、方法和策略。
二、异常处理的原则1. 及时发现异常:在软件测试过程中,测试人员应该及时发现和捕获异常,避免异常在后续阶段造成更大的问题。
2. 合理记录异常:对于发现的异常情况,应该做好记录,并尽可能详细地描述异常发生的条件、环境和出现的具体现象,以便后续的错误恢复工作。
3. 分类和归纳异常:对于不同类型的异常,可以进行分类和归纳,有助于对异常进行更有效的处理和恢复。
4. 尽量减少异常发生的可能性:在软件测试的过程中,应该尽量减少异常发生的可能性,采取有效的预防措施,例如合理的输入检查和错误处理机制等。
三、异常处理的方法1. 异常捕获和记录:通过在程序代码中使用异常处理机制,可以捕获到特定类型的异常,并将异常信息记录下来,以便后续分析和修复。
2. 异常处理流程:定义一套统一的异常处理流程,包括异常的报告、跟踪和修复等环节,确保异常能够得到及时的处理和解决。
3. 异常回滚和恢复:对于发生异常的场景,采取适当的措施,例如回滚事务、还原数据等,以确保软件系统能够在异常情况下正常运行。
4. 异常信息反馈:在软件测试过程中,及时反馈异常信息给开发人员和其他相关人员,以便他们能够了解异常的具体情况,进行修复和优化。
四、错误恢复的策略1. 安全退出:当发生无法处理的致命错误时,应该采取安全退出的策略,以防止错误对系统造成更大的损害。
2. 自动恢复:对于一些可预见的错误,可以通过自动恢复的机制来修复错误,并使系统继续运行下去,以提高软件的稳定性和可靠性。
3. 数据备份和还原:在软件测试过程中,需要考虑数据的备份与还原策略,确保在错误发生时能够及时恢复数据,减少数据丢失和损坏的风险。
4. 异常处理流程的优化:通过对异常处理流程的分析和优化,可以减少错误恢复的时间和成本,提高软件的可维护性和可测试性。
文件系统异常修复操作指南准备工作:注意:1)禁止fsck已经mount上的文件系统,否则会导致数据丢失!2)fsck 共享磁盘时,还必须检查另外一台机器是否已经在使用该共享磁盘!1.检查待修复的文件系统是否已经mount上。
# mount修复步骤:1.fsck -y 修复对应的文件系统,必须指定对应的设备。
如果时vxfs文件系统,必须使用fsck.vxfs命令。
# fsck -y /dev/vg01/lv01# fsck.vxfs -y /dev/sdb12.如果检查失败,说明文件系统损坏较严重,请仔细查看检查后的输出提示,加入额外参数修复。
注意:a)带参数运行fsck需要执行具体文件系统的命令,如fsck.reiserfs ,fsck.ext3,fsck.vxfs 。
b)此种情况下,可能丢失部分损坏严重的文件,建议修复完成后做一次文件对比检查。
以下为示范:# fsck -y /dev/vgscp/lvscpfsck 1.38 (30-Jun-2005)Comparing bitmaps..vpf-10640: The on-disk and the correct bitmaps differs.Bad nodes were found, Semantic pass skipped1 found corruptions can be fixed only when running with --rebuild-tree###########reiserfsck finished at Wed May 27 15:47:08 2009###########fsck.reiserfs /dev/vgscp/lvscp failed (status 0x4). Run manually!按提示加入--rebuild-tree参数执行命令:# fsck.reiserfs --rebuild-tree -y /dev/vgscp/lvscp#fsck -y /dev/scpdg/lvscuIf the partition table has not been changed, and the partition is validand it really contains a reiserfs partition, then the superblockis corrupted and you need to run this utility with --rebuild-sb.fsck.reiserfs /dev/scpdg/lvscu failed (status 0x8). Run manually!按提示加入--rebuild-sb参数执行命令:# fsck.reiserfs --rebuild-sb -y /dev/scpdg/lvscu3.如果经过上述步骤仍然不能修复,那么文件系统已经严重损坏,无法恢复完整的数据,此时建议重建文件系统,从备份中恢复数据。
软件数据还原操作步骤如您对SQL数据库不了解,请先认真仔细阅读三遍以上这个操作教程,然后再进行实操。
第一步:双击电脑右下角绿色三角Sql200图标1 .双击电脑右下角SqI图标第二步:点击锁图标,在弹出窗口输入密码:abcd&1234后点确定按钮第三步:点数据库选项卡,然后选中dbmember数据库名, 按鼠标右键,在弹出菜单点删除数据库。
W 贝4 J 自动开启服务守护 0关闭C J 开机启动 服务日志界认夯例服务窗口射据库2 I 连接与防火墙3计划任务1内存管理5 SQL Tips6工量 2∩9∩-nΛ-^∩ 17 16:38 D:\Program . . D:\Program迷你SQL20∞ v1.29任攵砍 住木 建÷τRd 同 ,加据▽侏地让,R 吉▽件地址日志2 .选中数据库按鼠修复效据库C 联机数据库H 标右键查询分析器Q 养牛探查器A 查看我的表X 主删除JJSS 座D2020-07.08 1 i * * * 分恚R S 库 T .M缶冷却*度R3.删除数据库第四步:点还原按钮找到备份的文件。
(默认文件夹:DAProgram Files'帮管家收银管理系统∖dbbak ) f 如果不是默认安装,请根据自己安装的位置上查找。
实例名称:瓯服务谈口:瓯ObmemDer 0 打开目录F 清赊日志E收缩数据库S GaSter nodel・sdbtempdb附加LV i 还原B ?.密码书迷%QL2000"∙29 JL ® K实例名称:际一 一] 0自动开启「照务守护联务端口: ∣8829 Ij 默认实例□眠芬奇口Ii⅛l 数据摩2连接与防火墙3计划任务1内存管理5fsQlΓτip s y1 •点还原按钮,找到备份的文件2020-07-08 11:01:57用户取消还原数搠份.第五步:直接点OK 按钮还原成功;注:数据库名不要修改,按默认的dbmember.© J JJ J数据库名称naster Bodel »sdb tempdb态常常常常 状正正正正建立时间200CH)8-06 2000-08-06 2000-08-06 2020-07-08 01:29:12 01:40:52 01:40:5608:45:15数据文件地址日志文件地址 D :∖Program. . . D : XPrograa... D:'Program. . D: ∖Progr⅛Λ.. D: ∖Progr⅛ιn . . D:\Program.D : ∖Program. . . D : ∖PrograΛ...向刷新B 3新建A闺附加E 卜J 还加B ]q 迷你SQL2000 V1.29J 自动开启服务守护0关闭£ J 开机启动隔务日志 电认实例 服务窗口日志L 数据库2连搔与防火墙3计划任务1内存管理5 SQLTi P r状态灌立时间数据文件地址I 日志文件地址正常 2000-08-06 01:29:12 D:\Program . DAProgram 正常 2000-0846 01:40:52D:\Progr ⅛m DAPro δra∙,grs >gra∙..一周]解实例名称:ISttr5 服务谓口: ∣8829|不要修改这个名7直接点击OK按钮切■库名称naster nodel士刷新B ?新建A j圉附加E 晶还原B) I-密码D2020-07-08 11:05:49 还象J7≡ 瘴中……9:12 D: ∖Program . D: \Progra»B:52 D:∖Prograπ> . D:\Program0:56 D:∖Program. . . D: \Progra»D:∖Program. . . D: ∖Program。
操作系统的错误处理和故障恢复处理和解决系统错误和故障操作系统是计算机系统中最核心的软件之一,负责管理和控制计算机的硬件资源,提供给用户和其他软件运行环境和服务。
然而,由于各种原因,操作系统在运行过程中可能会出现错误和故障,这就需要操作系统具备有效的错误处理和故障恢复机制,以解决系统错误和故障,确保系统的正常运行和稳定性。
一、错误处理1. 异常处理在操作系统的运行过程中,可能会出现各种意外情况,比如除以零、内存访问错误等。
这些异常情况会导致程序的中断或崩溃,严重影响系统的稳定性和可靠性。
因此,操作系统需要具备异常处理的能力,及时检测并处理这些异常情况,以避免系统崩溃。
异常处理的基本思路是通过中断机制,将出现异常的程序暂停,并跳转到异常处理程序进行处理。
异常处理程序可以采取一些措施,比如给出提示信息、执行默认操作、进行错误修复等,从而保证系统的正常运行。
2. 错误诊断当系统发生错误时,操作系统需要能够对错误进行诊断,找出错误的原因和位置。
错误诊断是通过对系统状态的监控和分析来实现的。
操作系统可以收集系统运行时的各种信息,比如日志记录、性能统计等,从而提供给管理员进行错误诊断。
错误诊断的目的是准确地找出错误的根源,以便进行下一步的故障恢复处理。
3. 错误恢复当发生错误时,操作系统需要能够尽快地进行错误恢复,以避免错误的扩散和影响系统的正常运行。
错误恢复的基本策略是回滚操作或重新执行操作。
回滚操作是指将系统状态恢复到错误发生之前的状态,放弃错误操作的结果。
重新执行操作是指对错误操作进行重试,直到操作成功或达到最大重试次数为止。
错误恢复的具体策略和方法可以根据不同的错误类型和系统需求来确定。
二、故障恢复处理故障是指系统发生严重错误或故障,导致系统无法正常工作。
故障恢复处理是指对系统故障进行快速和有效的处理,以使系统尽快恢复正常工作状态。
1. 故障检测故障检测是指通过监控和检测系统的状态和性能来判断系统是否发生故障。
设备异常解决与恢复设备在使用过程中,由于各种原因可能会出现各种异常情况,给用户带来使用困扰。
本文将针对常见设备异常进行描述,并提供解决方法和恢复步骤,以帮助用户快速排除设备问题。
一、电脑系统异常1. 电脑无法启动若电脑无法启动,首先确保电源正常连接,并检查电源线的插头是否松动。
如果电源工作正常,可能是主板或其他硬件故障。
此时,建议联系专业人员进行检修。
2. 蓝屏死机当电脑出现蓝屏死机时,可按以下步骤进行处理:1) 重启电脑,看是否能够恢复正常。
若蓝屏问题多次出现,请尝试下一步。
2) 进入安全模式,通过安全模式运行杀毒软件扫描系统文件,确保系统没有受到病毒感染。
3) 更新或回滚驱动程序,驱动程序的冲突可能导致蓝屏问题。
可通过设备管理器查找并更新或回滚相关驱动程序。
4) 若以上方法无法解决问题,可尝试进行系统恢复或重装操作系统。
二、网络异常1. 无法连接到无线网络若无法连接到无线网络,用户可按照以下步骤解决:1) 检查无线路由器是否正常连接,并确保无线网络是否开启。
2) 确认设备的Wi-Fi开关是否开启,并检查Wi-Fi设置是否正确。
3) 将设备移动至无线信号覆盖范围内。
4) 尝试重新启动设备和无线路由器。
2. 网络速度缓慢当用户遇到网络速度缓慢问题时,可尝试以下解决方法:1) 检查网络连接质量,确保无线信号强度良好。
2) 关闭非必要的网络应用程序,以避免网络带宽被占用。
3) 清理浏览器缓存和临时文件,以提高网络访问速度。
4) 若仍然存在问题,可以联系网络服务提供商,检查网络线路质量。
三、手机设备异常1. 手机充电异常当手机无法正常充电时,可尝试以下解决方法:1) 更换充电器和数据线,确保配件没有故障。
2) 清理手机充电口,以防止灰尘等物质影响充电效果。
3) 关闭手机后重新插入充电器,并等待片刻,观察是否正常充电。
4) 若问题仍然存在,可以检查手机电池是否老化,如有需要更换电池。
2. 手机操作卡顿当手机操作变得卡顿时,用户可尝试以下解决方法:1) 清理手机内存,关闭不必要的后台应用程序。
数据库异常处理与恢复的说明书一、引言数据库在现代信息系统中起着至关重要的作用,然而,由于各种原因,数据库可能会出现异常情况,如数据丢失、损坏、操作错误等。
为了确保数据安全和系统的可靠性,我们需要采取有效的措施来处理和恢复数据库异常。
本说明书将详细介绍数据库异常处理与恢复的方法和步骤。
二、数据库异常处理1. 异常类型分类数据库异常可分为以下几种类型:- 数据库损坏:数据库文件损坏导致数据丢失或无法正常读取。
- 操作错误:误删除、误修改等操作导致数据错误。
- 数据冲突:并发操作引发数据不一致。
- 宕机故障:服务器断电、磁盘故障等导致数据库无法正常工作。
2. 异常处理策略针对不同的异常类型,我们采取相应的处理策略:- 数据库损坏:使用数据库备份与恢复工具,从备份中恢复数据。
- 操作错误:通过日志回滚、事务回滚等方式撤销误操作。
- 数据冲突:采用锁机制、事务隔离级别等控制并发操作,确保数据一致性。
- 宕机故障:定期备份数据库,并采用冗余服务器等高可用性配置来应对故障。
3. 异常处理流程数据库异常处理的一般流程如下:- 检测异常:通过监控系统、日志记录等方式及时发现数据库异常情况。
- 诊断异常:对异常进行诊断,确定异常类型和具体原因。
- 处理异常:根据具体异常类型,采取合适的处理策略进行修复。
- 恢复数据:在处理异常后,需要进行数据的恢复操作,确保数据库完整性。
- 测试与验证:对处理后的数据库进行测试和验证,确保异常已被解决。
三、数据库异常恢复1. 备份与恢复定期进行数据库备份是保障数据安全的重要手段。
在数据损坏或丢失时,可以使用备份文件进行恢复。
- 完全备份:将数据库的所有数据都备份,并定期更新。
- 增量备份:仅备份自上次完全备份以来的新增或修改数据。
- 差异备份:备份上一次完全备份以来的所有修改数据。
2. 日志恢复数据库的日志记录能够帮助恢复错误操作或意外损坏的数据。
通过数据库的事务日志,可以回滚误操作,还原数据库至正确状态。
Was nc双机安装手册安装目标:数据库db2与应用web进行双机互备。
安装的软件:需要solaris 10下安装:DB2、WAS中间件、东方通中间件.DB2版本:9.1.5WAS中间件版本:6.1打上6.1.0.11的补丁东方通中间件版本:tongweb 4.6环境:双机:A机m8000-p3 B机m8000-p2准备工作:解压缩*.gz --- gunzip *.gz*.zip --- unzip *.zip*.tar --- tar xvf *.tar压缩方法:tar cvf 压缩包名目录名在A机和B机上都安装WAS,并将安装目录存放在相同的目录下首先安装盘需要和系统及系统位数对应,先安装应用,在安装补丁文件。
安装步骤:一、 WAS 产品安装,打补丁。
1)执行/soft/was/WAS目录下的install命令(./install)安装WAS,点击下一步,不选择安装样本应用程序,继续下一步,选择路径,一般要修改,使用df -h命令检查安装空间是否足够,确定空间足够再进行下面的操作。
(注意:安装盘路径不能含有中文)安装文件包括:was , HIS , PLUGIN , UPDATA工具2)安装apache(IHS)在/soft/was/IHS目录下安装,执行命令install 安装过程中不加认证。
3)安装插件(plugin)在/soft/was/plugin目录下安装,执行命令install。
Unzip4)安装相应系统下的Update Installer,执行Update Installer目录下的install命令(./install),选择相应的路径,直至安装结束。
安装结束后提示安装补丁,可以先不安装,也可以先安装,但只能安装AppServer下面的含有WAS和WASSDK的补丁,完成。
Kill5)安装补丁,在/home/IBM/WebSphere/UpdateInstaller目录下,执行update.sh命令,进行补丁的安装。
回制出中心ats服务器双机故障诊断检修流程
1、接收故障报告:一旦接收到中心ATS服务器双机故障的报告,立即进行记录并确认报告的准确性。
2、呼叫维修人员:通知相关的维修人员,确保他们迅速响应并前往现场。
3、制定检修计划:由资深的技术人员根据故障描述和相关资料制定检修计划,确保检修过程有条不紊。
4、故障现场勘测:维修人员到达现场后,首先进行故障现场的勘测和评估,确保了解故障的具体情况和范围。
5、故障排除和修复:根据勘测结果,对中心ATS服务器双机进行故障排除和修复。
此过程中可能涉及软件调试、硬件更换或其他维修操作。
6、故障测试:完成修复后,对中心ATS服务器双机进行全面的功能测试,确保修复后的设备正常工作。
7、故障确认和验收:通过验证测试结果,确认中心ATS服务器双机故障已成功修复。
与使用者进行沟通,确保其满意的确认和验收。
8、编写维修报告:维修人员应记录整个检修过程中的每个步骤、所采取的措施和更换的部件,并编写详细的维修报告。
9、故障预防和改进:根据故障的原因和修复过程中的经验,评估和采取必要的措施,以预防类似故障的再次发生,并确保系统的可
靠性和稳定性。
富士通双机软件异常恢复过程
在分析富士通双机软件过程中,跟踪发现XX平台的两台服务器的syslog
均没有正常输出,日志输出最后时间点为服务器重启的时间点,查看守护进程不
存在,从直觉判断,应该是syslog异常导致PLC软件不能正常工作:
# ps -ef | grep syslog
root 7656 6142 0 11:18:53 pts/4 0:00 grep syslog
通过Solaris的SMF(Service Management Facility)对syslog进行跟踪
分析,发现异常,syslog没有正常启动的原因时有两个关联服务disable
# svcs -l svc:/system/system-log:default
fmri svc:/system/system-log:default
名称 system log
启用 是
状态 offline
next_state none
state_time 2014年04月03日 星期四 16时48分48秒
重启程序 svc:/system/svc/restarter:default
dependency require_all/none svc:/milestone/sysconfig (online)
dependency require_all/none svc:/system/filesystem/local (online)
dependency optional_all/none svc:/system/filesystem/autofs (disabled)
dependency require_all/none svc:/milestone/name-services (disabled)
dependency require_all/none svc:/system/fjsvmadm-evhandsd (online)
将disable的程序启动
# svcadm enable svc:/system/filesystem/autofs
# svcadm enable svc:/milestone/name-services
重新启动syslog服务
svcadm enable svc:/system/system-log:default
查看进程,syslog启动
# ps -ef | grep syslog
root 655 1 0 10:50:58 ? 0:01 /usr/sbin/syslogd
root 7656 6142 0 11:18:53 pts/4 0:00 grep syslog
后续双机软件自动启动,在132服务器上重新进行上述操作,双机软件也恢
复正常启动,查看状态如下:
# XXX.XXX.XXX.XXX
# XXX.XXX.XXX.XXX
由于在132上看不到节点2的机器状态,想尝试进行切换,发现失败,可能
和程序原来是手工通过root或其他账号启动有关,合适的时候找时间对132进
行重启动:
观察到PCL工作异常的日志,后续需要跟踪下:
main(1): Got SIGALRM
writemsg(2): Logging msg 'Apr 3 16:07:24 hanet: [ID 361421 user.error] WARNING: 87500:
standby interface failed. (sha0)' to CONSOLE /dev/sysmsg
writemsg(9): Logging msg 'Apr 3 16:07:24 hanet: [ID 361421 user.error] WARNING: 87500:
standby interface failed. (sha0)' to FILE /var/opt/FJSVmadm/evh/evh_pipe
writemsg(3): Logging msg 'Apr 3 16:07:24 hanet: [ID 361421 user.error] WARNING: 87500:
standby interface failed. (sha0)' to FILE /var/adm/messages
writemsg(2): Logging msg 'Apr 3 16:07:24 hanet: [ID 960721 user.error] INFO: 88500: standby
interface recovered. (sha0)' to CONSOLE /dev/sysmsg
writemsg(9): Logging msg 'Apr 3 16:07:24 hanet: [ID 960721 user.error] INFO: 88500: standby
interface recovered. (sha0)' to FILE /var/opt/FJSVmadm/evh/evh_pipe
writemsg(3): Logging msg 'Apr 3 16:07:24 hanet: [ID 960721 user.error] INFO: 88500: standby
interface recovered. (sha0)' to FILE /var/adm/messages
#
# ifconfig -a
lo0: flags=2001000849
inet 127.0.0.1 netmask ff000000
e1000g1: flags=1000863
index 5
inet # XXX.XXX.XXX.XXX netmask ffffff80 broadcast 10.235.156.255
ether 0:21:28:13:65:2b
#
#
#
# /opt/FJSVhanet/usr/sbin/dsphanet
[IPv4,Patrol]
Name Status Mode CL Device
+----------+--------+----+----+------------------------------------------------+
sha1 Inactive d ON e1000g1(ON),e1000g0(OFF)
sha0 Active p OFF sha1(ON)
[IPv6]
Name Status Mode CL Device
+----------+--------+----+----+------------------------------------------------+
#
ARNING: 87500: standby interface failed. (sha0)
资料:
http://docs.oracle.com/cd/E19424-01/820-4809/log_syslog/index.html
http://unix.ittoolbox.com/groups/technical-functional/solaris-l/how-to-run-the-syslogd-server-on
-solaris-10-2351469
http://unix.derkeiler.com/Newsgroups/comp.unix.solaris/2006-04/msg01071.html
http://www.oracle.com/technetwork/articles/servers-storage-admin/intro-smf-basics-s11-17291
81.html
https://community.oracle.com/thread/1921656?tstart=0
http://www.fujitsu.com/global/services/computing/server/primequest/documents/pcl-manuals.
html
http://software.fujitsu.com/jp/manual/manualfiles/m120009/j2uz7781/03enz201/j7781-f-03-02.
html