WAS关键性能参数配置及异常分析

合集下载

性能测试题库(优选.)

........................................................................................................................................................................................性能测试题库答案一、低难度类：1、理论类选择类1) 通过疲劳强度测试，最容易发现问题的问题是:BA．并发用户数B．内存泄露C．系统安全性D．功能错误2) 如下那些工具不属于压力测试工具:DA．LoadRunnerB．Logiscope（嵌入式测试工具）C．WAS(WebSphere Application Server(WAS)) (中间件服务器)D．Rational Robot(用于的G UI脚本、用于的V U以及V B脚本)3) 如下哪些测试场景不属于负载压力测试:AA．恢复测试B．疲劳强度测试C．大数据量测试D．并发性能测试4) LINUX 下，解压缩文件的命令为:BA. tar zxvf 文件名B. unzip 文件名C. CAT 文件名D. VI 文件名5) 对abcd 文件赋予所有者和组许可的读和执行权限，命令正确的是:BA. chmod 033 abcdB. chmod 550 abcdC. chmod 770 abcd........................................................................................................................................................................................D. chmod u+rx abcd6）在软件性能测试中，下列指标中哪个不是软件性能的指标DA）响应时间C）资源利用率D）并发进程数B）吞吐量7）下列关于软件性能测试的说法中，正确的是BA）性能测试的目的不是为了发现软件缺陷B）压力测试与负载测试的目的都是为了探测软件在满足预定性能需求的情况下所能负担的最大压力C）性能测试通常要对测试结果进行分析才能获得测试结论D）在性能下降曲线上，最大建议用户数通常处于性能轻微下降区与性能急剧下降区的交界处8）下列关于软件可靠性测试的说法中，错误的是AA）发现软件缺陷是软件可靠性测试的主要目的B）软件可靠性测试通常用于有可靠性要求的软件C）在一次软件可靠性测试中，执行的测试用例必须完全符合所定义的软件运行剖面D）可靠性测试通常要对测试结果进行分析才能获得测试结论问答类1) 什么是性能测试，其应用领域分别是什么？性能测试是通过自动化的测试工具模拟多种正常、峰值以及异常负载条件来对系统的各项性能指标进行测试，应用领域有四个：能力验证、能力规划、性能调优、缺陷发现。

WAS常见问题处理与系统维护建议

内存问题响应慢/线程挂起高CPU crash宕机
系统维护建议
健康检查问题管理补丁管理
Q&A
Page 3
<Document Title> | <Date>
IBM Confidential
© 2008 IBM Corporation
Global Technology Services
Page 8
Global Technology Services
Client Focus Commitment Collaboration
WAS的基本组件
Page 9
<Document Title> | <Date>
IBM Confidential
© 2008 IBM Corporation
Global Technology Services
Client Focus Commitment Collaboration
Java堆内存溢出 – 内存泄漏

正常情况下堆内存的大小应该是均值稳定的锯齿状图形
Page 19
<Document Title> | <Date>
IBM Confidential
堆内存耗尽
内存泄漏内存使用量短时间内达到最大值（如很大的数据库查询结果集）
大对象分配
即为大对象可添加JVM参数找出大对象：-Xdump:stack:events=allocation,filter=#5m
>64KB
堆内存碎片化（主要是V6.0及以前的版本）
pinned
Page 5
<Document Title> | <Date>

设备维保的技术参数和性能评价方法

设备维保的流程与内容
设备维保的流程
包括日常巡检、定期保养、故障修理等步骤。
设备维保的内容
包括清洁、润滑、检查、调整、更换磨损件等作业。
设备维保的常见问题与解决方案
设备维保的常见问题
如保养不及时、操作不当、维修技术不过关等。
解决方案
加强设备管理制度建设、提高操作人员素质、加强维修技术培训等。
设备安全性、稳定性、耐久性等
定期检查设备运行状况，评估设备故障率、维修次数等数据，评估设备性能。
定期进行设备保养，更换磨损部件，调整设备参数等，确保设备正常运行，提高设备使用寿命。
THANKS
感谢观看
02 技术参数分析
设备性能参数
设备性能参数是指设备的核心功能和性能指标，如机械设备的转速、功率、精度等，电气设备的电压、电流、频率等。这些参数决定了设备的基本性能和功能，是设备正常运行的必要条件。
设备性能参数的测量和监控对于设备的维护和保养至关重要，通过对设备性能参数的监测和分析，可以及时发现设备的异常和故障，采取相应的措施进行维修和保养，保证设备的正常运行和使用寿命。
要点二
详细描述
根据设备环境适应性制定维保策略
设备的环境适应性对设备的运行和维护具有重要影响。在制定维保策略时，需要考虑设备在不同环境条件下的适应性，如温度、湿度、压力、腐蚀等，并根据设备的适应性要求制定相应的维护和保养措施，确保设备在不同环境下的正常运行和使用寿命。
05 案例分析
案例一：某工厂生产线设备的维保案例
维护和保养。
基于设备安全性能的维保策略
总结词
基于设备安全性能制定维保策略
详ቤተ መጻሕፍቲ ባይዱ描述
设备的安全性能是维保策略的重要考虑因素。在制定维保策略时，需要评估设备的安全性能，并针对可能存在的安全隐患制定相应的预防措施和紧急处理方案，确保设备在运

无线网络优化与性能分析案例研究

无线网络优化与性能分析案例研究无线网络优化与性能分析是现代通信领域的重要课题之一。

在无线网络中，如何提高网络的性能和优化其运行是关键问题。

本文将通过分析一个实际案例来探讨无线网络优化与性能分析的相关内容。

案例背景：某高校校园内部署了无线网络，供学生和教职员工使用。

然而，近期网络的性能出现问题，许多用户反映连接速度慢、丢包率高等问题，给正常的使用带来了很大的困扰。

为了解决这一问题，校方决定进行无线网络的优化与性能分析。

问题分析：首先，我们需要对目前的无线网络进行一些初步的性能分析。

通过对网络设备的配置和性能参数的查看，可以了解当前的网络状况，包括无线信道的利用率、干扰情况、无线信号强度以及设备的负载情况等。

在对网络进行初步分析后，我们发现一些潜在的问题。

首先，由于高校校园内的用户密度较大，无线信道的利用率较高。

其次，因为无线信号的传播受到建筑物、树木等物理障碍物的影响，导致一些区域信号质量不佳。

最后，由于部分设备配置不当或老化，设备负载过高，无法满足用户的需求。

基于以上问题，我们需要采取相应的优化措施。

优化措施：针对以上问题，我们提出了以下的优化措施，希望能够改善无线网络的性能和用户体验。

1. 网络规划与信道优化：针对用户密度较大的问题，我们可以进行网络规划，将校园划分为不同的区域，并为每个区域选用不同的无线信道。

这样可以减少信道间的干扰，提高无线网络的整体性能。

同时，可以通过对信道的频谱分析来确定干扰源，并采取相应的措施来消除干扰。

2. 信号增强与覆盖优化：针对信号质量不佳的区域，可以采取一些技术手段来增强信号和优化覆盖。

比如，可以增加无线接入点的数量，提高信号覆盖范围；可以采用天线优化技术，改善信号的穿透能力等。

此外，对于一些特殊区域，如教室、图书馆等，可以考虑单独设置专用的无线接入点，以提高信号的专属性和稳定性。

3. 设备升级与负载均衡：针对设备配置不当或老化导致的负载过高问题，我们建议对相关设备进行升级或更换。

运行维护管理体系和制度规范

运行维护管理体系和制度规范目录1、总则32、编制方法33、运维工作职责34、运维服务管理体系54.1运维服务管理对象64.2运维系统功能框架64.3运维管理组织结构74。

3.1项目负责人84.3.2项目经理84。

3。

3技术主管94。

3.4服务台94.3。

5网络管理员104。

3。

5应用、数据库管理员104。

3。

7终端管理员114。

4运维服务流程114.4.1项目运维服务工作流程图124。

4.2服务台- 8 -3。

4.3事件管理- 9 -4。

4。

4工单管理- 9 -4。

4。

5问题管理- 9 -4。

4.6变更管理- 10 -4。

4。

7配置管理- 10 -4.4。

8知识库管理- 10 -4。

4.9统计及工作报告- 11 -5、运维服务内容- 11 -5。

1服务目标-11-5。

2资产统计服务-12-5。

3网络、安全系统运维服务-12-5。

4主机、存储系统运维服务-13-5.5数据库系统运维服务-15-5。

6中间件运维服务-16-5。

7终端、外设运维服务-17-6、应急服务响应措施- 20 -6。

1应急预案实施基本流程206.2突发事件应急策略207、服务管理制度规范217。

1服务时间217.2行为规范221、总则第一条为保障实验室系统软硬件设备的良好运行，使员工的运维工作制度化、流程化、规范化，特制订本制度。

第二条运维工作总体目标：立足根本促发展,开拓运维新局面。

在企业发展壮大时期,通过网络、桌面、系统等的运维，促进企业稳定可持续性发展。

第三条运维管理制度的适用范围：运维人员。

2、编制方法本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。

本实施细则以ITIL/ISO20000为基础，以信息化项目的运维为目标，以管理支撑工具为手段，以流程化、规范化、标准化管理为方法，以全生命周期的PDCA循环为提升途径，体现了对运维服务全过程的体系化管理.3、运维部工作职责一、负责网站运维和技术支持(一）根据网站运营战略和目标,负责网站整体架构、栏目、应用系统等技术开发方案制定和组织开发,保障网站技术的稳定性和先进性。

IBM Websphere培训——JVM相关参数配置和问题诊断

1.Websphere JVM相关问题诊断：由JVM引起的Websphere问题主要有应用服务器宕机和性能下降，JVM相关问题的特征如下：(1).Websphere应用服务器停止响应：a.Websphere服务器宕机。

b.Websphere进程挂起。

c.JVM内存溢出。

(2).性能下降：JVM进程号(process Id)不停地改变。

2.诊断JVM相关问题所需文件：(1).核心文件(Core files)：a.进程快照或者系统的核心文件。

b.完整的JVM内存快照等。

注意：文件非常庞大，需要ISA(IBM Support Assistant)的日志分析工具解析。

(2).javacore文件：a.正在运行的java进程的快照。

b.Websphere应用服务器发生错误时自动生成的文件。

存储路径为：<WAS_install_root>/profiles/<profile>。

(3).JVM详细的垃圾回收器日志。

(4).JVM堆快照。

3.JVM垃圾回收器日志：(1).设置Websphere中JVM垃圾回收器步骤：在Websphere管理控制窗口点击：Servers->Applicationservers-><server_name>->Java and Process Management ->Process Definition->Java Virtual Machine, 勾选” Verbose Garbage Collection ”复选框，重启Websphere即可。

(2).JVM详细的垃圾回收器日志写在系统错误日志文件中(native_stderr)。

(3).在产品发布以后，推荐将Websphere的JVM垃圾回收器日志打开，它消耗资源非常的少。

4.JVM关于堆的相关参数设置：(1).JVM最大的堆内存大小(maximum heap, -Xmx)：设置合理的最大堆有助于JVM优化性能，最大堆越大，JVM垃圾回收器收集一次垃圾花费的时间越长；最大堆越小，JVM垃圾回收器运行很频繁。

WAS宕机常见问题及参考解决方案

WAS宕机问题总结起来有以下几类：一、线程挂起导致线程池满（Thread Hang）:Hangs refer to the JVM locking up or refusing to respond.A hang can occur when:1）Your application entered an wait leak2）Excessive Synchronization cause performance problems3）A deadlock has occurred收集日志：生成JAVA CORE分析工具：IBM Thread and Monitor Dump Analyzer1、线程等待泄漏(Wait Leaks)常见的情况就是，有很多线程使用wait()方法，等待被唤醒notify（）。

但是，存在某一个线程获取到锁并且进行业务处理完成后，忘记去唤醒等待执行的进程。

这样导致的等待泄漏，从而线程挂起。

When you use the wait/notify mechanism, you typically have one or more threads blocked in the wait() call, waiting to be notified. The notifying thread is supposed to call notify() or notifyAll() to signal that waiting threads can wake up and carry on processing.A problmatic situation could occur that the notify() call is invoked before the threads go into the wait() method. In this case, the waiting threads would not be notified anymore and become stuck.So, do not forget to notify the waiting theads in you application and maks sure that the Notify action is performed after all the waiting threads are started.应对策略：notify必须发生在所有wait之前。

VOLTE关键性能指标优化.

案例: EPC
现象描述:
UE2占用844199 PCI：69，RSRP=-97 SINR=7，收到主叫INVITE呼叫建立流程走到被叫上发180 ringing，网络层未下发Modify EPS Bearer Context Request，同时终端在做A3切换（目标小区417950 PCI:61），可能网络侧发送Modify EPS Bearer Context Request到源小区导致终端切换到目标小区收不到。20s网络侧返回503 Service Unavailable，主叫call blocked 。
S1AP: INITIAL UE MESSAGE + EMM ATT_REQ + ESM PDN CONN_REQ
NAS Security Establishment (Authentication + NAS security start)
案例: 异常RRC连接释放
问题描述：被叫UE占用PCI：61，收到来自主叫的BYE后,回BYE200,紧接着发生切换,1S后RRC连接释放. 问题原因： 1、为什么被叫收到BYE 后1S在没有回复去专载接收情况下，网络又下发RRC连接释放。
处理进展：已抓取LOG，定位中
14
案例: IMS注册引起掉话
问题处理: 正常情况下，终端会在注册周期前完成注册，或者注册不应影响正在进行的本次通话，联系终端厂家,待终端厂家解决
15
案例: 异常去激活QCI9
现象描述:
UE1通话过程中接收来自网络数据业务寻呼，去激活QCI9 ，但是无BYE上报，还是在通话结束后上发BYE，不影响用户感知。
问题分析：发生这个问题是因为UE建立了两个承载,一个为ipv4承载给正常上网用的，另一个是ipv6承载，这个ipv6承载是无法上ipv6网(因为没有对接ipv6 骨干网), UE得到的ipv6地址与其他UE有冲突触发UPCC删除这个多余的ipv6承载，这个不会影响正常业务(IPV4的承载还在)。另外不是所有的UE都会建两个承载，和UE的终端类型有关，当前大部分的终端都只是建一个ipv4承载。刚也和测试人员陈斌(18850356626)电话确认，这种现象不影响正常上网。核心网可以根据测试号只让ue建立ipv4承载,如果只是为了测试的话，可以按这个方案先规避。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

WAS关键性能参数配置及异常分析目录WAS关键性能参数配置及异常分析 (1)1.WAS性能关键参数配置 (3)1.1 JVM（Java虚拟机） (3)1.2 GC（详细垃圾回收） (3)1.3 Web Container (5)1.4 Data Source数据源 (6)1.4.1安装数据源驱动 (6)1.4.2配置全局数据源变量 (6)1.4.3配置数据源驱动 (6)1.4.4配置数据源 (7)1.4.5 Database连接池的参数配置 (10)1.5 其它关键参数 (11)1.5.1 EJB分发共享内存参数 (11)2.WAS性能分析工具 (11)2.1 WAS性能监控配置 (11)2.2 WAS性能监控 (11)3.WAS异常分析 (11)3.1 关键日志文件 (11)3.1 javacore、heapdump分析 (13)3.1.1 javacore的分析 (13)3.1.2 heapdump的分析 (19)1.WAS性能关键参数配置1.1 JVM（Java虚拟机）Heapsize（-Xms和-Xmx）：heapsize的大小依赖于系统平台和具体的应用等多种因素。

最大heapsize需要小于机器的物理内存，一般来说，默认最小heapsize为256m。

例如NG 设置的JVM为-Xms 512m，-Xmx 2048m。

如果在WAS应用服务器未设置JVM参数或者设置JVM参数不合理，会有可能告成应用服务器处理效率低或者造成OutOfMemoryError的情况。

备注：2m代表是2m的程序对象1.2 GC（详细垃圾回收）GC（Garbage Collection）：当需要分配的内存空间不再使用的时候，JVM将调用垃圾回收机制来回收内存空间。

一般来说，良好的GC状态需要保证相邻两次垃圾回收的平均间隔时间应当是单次垃圾回收所需时间的至少5-6倍。

GC的调优是通过在模拟压力的情况下不断调整最大最小heapsize来实现的，并不是heapsize设置越大越好。

通过在WAS应用服务器配置详细垃圾回收，从而可以使WAS在运行时生成native_stderr.log，native_stderr.log日志帮助分析JVM在进行GC垃圾回收时的数据，包括回收时间（频率）、长存区（tenured）在收回前、收回中、收回后的对比。

在实际的应用中可通过native_stderr.log来发现WAS JVM的性能问题并做出相应的JVM参数调整。

回收前一次：回收最新一次前后两次GC运行对比，可看行回收间隔为7S，一次GC运行时间不到1S，JVM的设置在较理想的状态值。

例如出现OOM的情况，可通过WAS产生的javacore及heapdump进行分析定位，并结合GC产生的native_stderr.log进行分析确认：GC耗时超过21S ，GC内存回收前的可用内存为0，GC内存回收后的可用内存为0%，可用JVM内存已耗尽，说明系统使用存在内存泄露（OOM）现象。

1.3Web ContainerWeb容器J2EE标准的实现，为serverlet和jsp提供运行环境。

例如，当一个HTTP请求通过要访问一个web组件（通常是一个serverlet或者是jsp），通常是将这个请求转发给web container处理完毕后再返回到web server。

Web Container的调优是通过对Web Container传输链中各个通道（TCP、HTTP、WebContainer）的参数调整进行的。

这些参数包括诸如ThreadPool的最大最小值，buffer 大小，timeout时间的大小，keep-alive的值等等。

一般配置WebContainer即可，需根据业务的实际使用情况进行值的配置，主要业务在WAS 达到的应用连接数，其它值为默认值即可：1.4 Data Source数据源1.4.1安装数据源驱动拷贝驱动JAR包到/usr/websphere/AppServer/lib目录，如：cp ojdbc6.jar /usr/websphere/AppServer/lib1.4.2配置全局数据源变量登陆控制台：https://WAS IP:9043/ibm/console/logon.jsp（1）“环境”—> “WebSphere变量”，选择作用域为：集群=所有域（2）增加全局变量：ORACLE_JDBC_DRIVER_PATH“新建”—>名称：ORACLE_JDBC_DRIVER_PATH值：/usr/websphere/AppServer/lib备注：NG未用到全局变量。

1.4.3配置数据源驱动增加ORACLE驱动：资源—>JDBC—>JDBC提供程序1.4.4配置数据源根据系统规划需求，按规划配置数据源。

（1）登陆控制台：https://WAS IP:9043/ibm/console/logon.jsp；（2）资源->JDBC->数据源新增数据源（“名称和JDNI名称”与规划的ID和VALUE对应）；备注：建议数据库地址不直接使用IP而用主机名代替，方便后续维护（3）J2C认证数据配置登陆账号信息；备注：修改完数据源需要重启动WAS服务（重启动应用也不能生效）1.4.5 Database连接池的参数配置在各自的数据源可配置该数据源的连接池大小配置，选择资源->JDBC->数据源->连接池，可配置连接池最小、最大连接数及连接超时时限等。

1.5 其它关键参数1.5.1 EJB分发共享内存参数用root用户登录命令行修改每个WebSphere安装路径的$WasIntallPath/AppServer/deploytool/itp/ejbdeploy.sh内容，根据主机资源情况将EJB 分发共享内存上限从默认256M修改为更大的值。

“$JAVA_CMD \-Xbootclasspath/a:$ejbd_bootpath \-Xms256m –Xmx256m”2.WAS性能分析工具2.1 WAS性能监控配置后续补写2.2 WAS性能监控后续补写3.WAS异常分析3.1 关键日志文件（1）SystemOut.log、SystemErr.log、was_server/logs/ffdc目录的日志查看最新WAS异常时段的SystemOut.log、SystemErr.log日志，搜索Error、Exception、Thread、OutOfMemory等相关关键字进行分析定位异常情况。

查看保留ffdc目录的日志文件，ffdc工具试图在发生非正常的情况时，自动获取并保留关键信息，其中包含堆栈跟踪、异常发生时的环境等相关信息。

可结合SystemOut.log、SystemErr.log等相关日志进行异常的定位。

NGBOSS的SystemOut.log、SystemErr.log日志存放位置：/waslogs目录（2）native_stderr.log、native_stdout.lognative_stderr.log日志可查看出JVM垃圾回收的记录及每次GC的间隔时间及运行时间，如下图所示：红色标识分别为：GC运行时间点、垃圾回收前内存情况、垃圾回收后内存情况、GC运行时间长。

从结果可看出JVM中已无内存可再回收，JVM处于OOM的状态。

可以看出java/lang/OutOfMemoryError：(3) 收集Web server服务器日志收集IHS日志（access_log、error_log）及插件Plug-in（plugin-cfg.xml and http_plugin.log）的日志及配置文件，查看是否出现异常信息。

例如http_plugin.log，可能提示一个连接无法正常发送到相关WAS Server，不过尝试连接其它WAS Server，这种情况可能是无法连接的Server处理较繁忙的状态或者网络中断。

3.1 javacore、heapdump分析java程序在遇到致命异常时，为了能够保留java应用发生致命错误前的运行状态，jvm 在无法工作前产生两个文件，分别为javacore及heapdump文件。

3.1.1 javacore的分析Javacore文件是一个java进程的快照，javacore文件中可以显示当时运行这个java 进程的所有线程的运行情况。

➢我们可以利用javacore来分析和判断一些故障，如：（1）100% CPU Usage （2）Crash或OOM（3）Hang/Performance ➢Javacore目录的设置在环境条目分别填入：➢Javacore的文件名Javacore文件的命名是根据系统的计算得来的，如javacore24802.1026159146.txt，而且是唯一的。

下列是根据操作系统的不同产生的名字不同：NG现AIX环境下产生的javacore文件：javacore.20130128.180057.13041766.0024➢Javecore的产生Javacore的产生有两种方式，一种是自动产生，一种是通过kill -3 PID进行生成。

自动产生Javacore，一般都是出现OOM的情况。

➢Javacore的分析（1）直接打开Javacore文件查看直接打开后，可以看到关键信息，可以看到每一个线程的执行栈，以stacktrace的方式显示。

通过对javacore的分析可以得到应用是否“卡”在某一点上，即在某一点运行的时间太长。

例如：可看出有java/lang/OutOfMemoryError的异常信息。

（2）运用javacore分析工具下载javacore运行工具jca:运行java –Xmx1024m –jar jca.jar:可看线程运行情况：请求线程可分为以下几种状态：死锁，Deadlock（重点关注）执行中，Runnable（重点关注）等待资源，Waiting on condition（重点关注）等待监控器检查资源，Waiting on monitor暂停，Suspended对象等待中，Object.wait()阻塞，Blocked（重点关注）停止，ParkedDeadlock：死锁线程，一般指多个线程调用间，进入相互资源占用，导致一直等待无法释放的情况。

Runnable：一般指该线程正在执行状态中，该线程占用了资源，正在处理某个请求，有可能正在传递SQL到数据库执行，有可能在对某个文件操作，有可能进行数据类型等转换。

Waiting on condition：等待资源，如果堆栈信息明确是应用代码，则证明该线程正在等待资源，一般是大量读取某资源，且该资源采用了资源锁的情况下，线程进入等待状态，等待资源的读取。