Linux运维经验总结
linux运维项目总结

linux运维项目总结一、前言Linux运维是一门重要的事业,可以更好的解决服务器的运行问题。
它不仅提高了服务器的稳定性,而且还可以加强信息安全。
本项目主要研究如何使用Linux系统来提高服务器的运行状况,保障信息安全,以及解决Linux系统中的一些常见问题,如软件更新、日志管理、账户管理等。
二、运维项目1、服务器搭建在搭建Linux服务器之前,我们需要先安装Linux系统,并配置服务器基本参数,如IP地址、账号和密码等。
然后,我们可以在服务器上安装常见的应用软件,如Apache、MySQL、PHP等,以满足不同的服务需求。
2、系统维护当我们在服务器上安装和配置好了基本的软件之后,就需要定期对服务器进行维护,以保证服务器的稳定性和安全性。
维护的内容包括:安装补丁、检查服务器的日志、定期备份数据等。
3、账户管理当我们定期维护服务器之后,我们还需要对用户的账号进行管理,即管理用户的账号和权限。
这样可以有效的防止恶意用户攻击我们的系统,同时还可以有效的提高系统的安全性。
4、日志管理服务器日志管理是提高服务器安全性的重要环节。
我们可以通过监控日志来及时发现和查找一些用户操作的异常行为,以及服务器出现的一些故障等。
5、软件更新系统软件越来越多,定期更新软件对于系统的安全性和稳定性都有很重要的作用。
更新软件除了可以增强系统的安全性外,还可以提高应用软件的性能,让系统的运行更加流畅。
三、总结本文介绍了Linux运维的内容,包括服务器搭建、系统维护、账户管理、日志管理和软件更新等。
通过上述项目,可以更好的解决服务器运行问题,加强信息安全,提升服务器的稳定性,从而让服务器的运行更加顺畅。
Linux运维经验总结

Linux运维经验总结一、线上操作规范1、测试使用当初学习Linux的使用,从基础到服务到集群,都是在虚拟机做的,虽然老师告诉我们跟真机没有什么差别,可是对真实环境的渴望日渐上升,不过虚拟机的各种快照却让我们养成了各种手贱的习惯,以致于拿到服务器操作权限时候,就迫不及待的想去试试,记得上班第一天,老大把root密码交给我,由于只能使用putty,我就想使用xshell,于是悄悄登录服务器尝试改为xshell+密钥登录,因为没有测试,也没有留一个ssh连接,所有重启sshd服务器之后,自己就被挡在服务器之外了,幸好当时我备份sshd_config文件,后来让机房人员cp过去就可以了,幸亏这是一家小公司,不然直接就被干了……庆幸当年运气比较好。
第二个例子是关于文件同步的,大家都知道rsync同步很快,可是他删除文件的速度大大超过了rm -rf,在rsync中有一个命令是,以某目录为准同步某文件(如果第一个目录是空的,那么结果可想而知),源目录(有数据的)就会被删除,当初我就是因为误操作,以及缺乏测试,就目录写反了,关键是没有备份……生产环境数据被删了没备份,大家自己想后果吧,其重要性不言而喻。
2、Enter前再三确认关于rm -rf / var 这种错误,我相信手快的人,或者网速比较慢的时候,出现的几率相当大,当你发现执行完之后,你的心至少是凉了半截。
大家可能会说,我按了这么多次都没出过错,不用怕,我只想说当出现一次你就明白了,不要以为那些运维事故都是在别人身上,如果你不注意,下一个就是你。
3、切忌多人操作我在的上一家公司,运维管理相当混乱,举一个最典型的例子吧,离职好几任的运维都有服务器root密码。
通常我们运维接到任务,都会进行简单查看如果无法解决,就请求他人帮忙,可是当问题焦头烂额的时候,客服主管(懂点linux),网管,你上司一起调试一个服务器,当你各种百度,各种对照,完了发现,你的服务器配置文件,跟上次你修改不一样了,然后再改回来,然后再谷歌,兴冲冲发现问题,解决了,别人却告诉你,他也解决了,修改的是不同的参数……这个,我就真不知道哪个是问题真正的原因了,当然这还是好的,问题解决了,皆大欢喜,可是你遇到过你刚修改的文件,测试无效,再去修改发现文件又被修改的时候呢?真的很恼火,切忌多人操作。
Linux运维经验总结

Linux运维经验总结一、线上操作规1、测试使用当初学习Linux的使用,从基础到服务到集群,都是在虚拟机做的,虽然老师告诉我们跟真机没有什么差别,可是对真实环境的渴望日渐上升,不过虚拟机的各种快照却让我们养成了各种手贱的习惯,以致于拿到服务器操作权限时候,就迫不及待的想去试试,记得上班第一天,老大把root密码交给我,由于只能使用putty,我就想使用xshell,于是悄悄登录服务器尝试改为xshell+密钥登录,因为没有测试,也没有留一个ssh连接,所有重启sshd服务器之后,自己就被挡在服务器之外了,幸好当时我备份sshd_config文件,后来让机房人员cp过去就可以了,幸亏这是一家小公司,不然直接就被干了……庆幸当年运气比较好。
第二个例子是关于文件同步的,大家都知道rsync同步很快,可是他删除文件的速度大大超过了rm -rf,在rsync中有一个命令是,以某目录为准同步某文件(如果第一个目录是空的,那么结果可想而知),源目录(有数据的)就会被删除,当初我就是因为误操作,以及缺乏测试,就目录写反了,关键是没有备份……生产环境数据被删了没备份,大家自己想后果吧,其重要性不言而喻。
2、Enter前再三确认关于rm -rf / var 这种错误,我相信手快的人,或者网速比较慢的时候,出现的几率相当大,当你发现执行完之后,你的心至少是凉了半截。
大家可能会说,我按了这么多次都没出过错,不用怕,我只想说当出现一次你就明白了,不要以为那些运维事故都是在别人身上,如果你不注意,下一个就是你。
3、切忌多人操作我在的上一家公司,运维管理相当混乱,举一个最典型的例子吧,离职好几任的运维都有服务器root密码。
通常我们运维接到任务,都会进行简单查看如果无法解决,就请求他人帮忙,可是当问题焦头烂额的时候,客服主管(懂点linux),网管,你上司一起调试一个服务器,当你各种百度,各种对照,完了发现,你的服务器配置文件,跟上次你修改不一样了,然后再改回来,然后再谷歌,兴冲冲发现问题,解决了,别人却告诉你,他也解决了,修改的是不同的参数……这个,我就真不知道哪个是问题真正的原因了,当然这还是好的,问题解决了,皆大欢喜,可是你遇到过你刚修改的文件,测试无效,再去修改发现文件又被修改的时候呢?真的很恼火,切忌多人操作。
linux运维项目经验范例怎么写

linux运维项目经验范例怎么写Linux运维项目经验范例怎么写在Linux运维的工作中,积累并总结经验是非常重要的。
通过撰写经验范例,不仅可以对自己的工作经验进行梳理和总结,也可以与他人分享和交流,促进整个行业的进步和发展。
下面将从五个方面介绍如何写出一篇高质量的Linux运维项目经验范例。
一、项目概述在写作经验范例时,首先要对所参与的项目进行简要的介绍和概述。
包括项目的背景、目标、规模、所用技术等。
这部分应该既简明扼要,又具体清晰,方便读者快速了解项目的整体情况。
二、问题与挑战接下来要详细描述在项目中所遇到的问题和挑战。
可以按照时间顺序或者按照问题的重要性进行排序。
对每个问题,要说明具体的情况、原因以及对业务和系统的影响。
同时,要展示解决问题的过程,包括自己的思考和分析,以及最终的解决方案。
这部分应该具体实际,重点突出,方便读者从中获得启示和经验。
三、技术方案在解决问题的过程中,往往会用到各种技术和工具。
这一部分应该展示你在解决问题中采用的具体技术方案和工具,并对其实施和效果进行详细说明。
同时,要给出具体的配置和部署过程,以及可能遇到的问题和解决方法。
这部分应该注重实践性,以便读者能够在实际工作中借鉴和应用。
四、总结与反思经验范例的最后一部分是总结与反思。
在总结中,要对整个项目的经验进行归纳和概括,提炼出核心的教训和经验。
在反思中,要深入思考自己在项目中所遇到的问题和困难,不仅从技术上找寻解决方法,还要从自身的不足和性格特点来寻找原因和改进方向。
这部分要言简意赅、深入透彻,给读者留下有价值的思考和启示。
五、分享和交流一篇好的经验范例应该与他人分享和交流,促使整个行业的进步和发展。
可以将经验范例发表在个人博客、技术论坛或者各种社交媒体平台上,也可以通过参加技术大会、培训班或者交流会来进行口头分享。
通过分享和交流,可以获得其他人的反馈和建议,拓宽自己的思路和视野,进而提高自己的技术水平和解决问题的能力。
linux实训个人总结8篇

linux实训个人总结8篇篇1一、实训背景与目标本次Linux实训旨在通过实践操作加深我对Linux操作系统的理解与应用能力,提升我在Linux环境下的软件开发和系统管理能力。
在为期XX周的实训过程中,我针对Linux系统的基本配置、软件开发、系统管理等方面进行了系统学习与实践。
二、实训内容1. Linux系统基础操作在实训初期,我重点学习了Linux系统的基本操作,包括文件与目录管理、常用命令的使用、软件包的安装与管理等。
通过实践操作,我掌握了Linux系统下的基本命令和操作技巧,能够熟练进行文件的增删改查以及软件的安装与配置。
2. 软件开发环境的搭建与实践本次实训中,我学习了如何在Linux环境下搭建软件开发环境,包括编译器的安装与配置、代码编辑器的使用、版本控制系统的实践等。
通过搭建开发环境,我能够自主进行软件的开发与调试,提升了我的软件开发能力。
3. 系统管理与维护实践在实训过程中,我还学习了Linux系统的管理与维护知识,包括系统监控、用户管理、进程管理、磁盘管理等。
通过实践操作,我掌握了系统管理的基本技巧,能够独立完成系统的日常管理与维护工作。
三、实训收获与体会1. 深入了解Linux系统架构与运行机制通过本次实训,我深入了解了Linux系统的架构和运行机制,对Linux系统的内核、文件系统、进程管理等方面有了更加清晰的认识。
2. 提升动手实践能力与问题解决能力在实训过程中,我通过大量的实践操作,提升了动手实践能力。
同时,在遇到问题时,我学会了独立思考和解决问题的方法,增强了问题解决能力。
3. 学会团队协作与沟通在实训过程中,我与团队成员紧密合作,共同完成任务。
通过团队协作,我学会了与队友沟通的技巧,提升了团队协作能力。
四、问题与解决方案在实训过程中,我也遇到了一些问题,如软件包安装失败、系统配置出错等。
针对这些问题,我通过查阅相关资料、请教老师同学等方式,找到了解决问题的方法。
同时,我也总结了问题的原因和解决方案,避免类似问题再次发生。
linux运维项目经验范例

linux运维项目经验范例在IT领域中,Linux作为一种开源操作系统,得到了广泛的应用和推崇。
作为一位Linux运维人员,项目经验的积累对于提高工作效率和技术水平至关重要。
本文将分享一些关于Linux运维项目的经验范例,希望对读者有所帮助。
一、服务器部署与配置在服务器部署阶段,合理的配置是非常重要的。
为保证服务器的安全性,我们通常会关闭不必要的服务和端口,并设置安全访问策略。
另外,为了提高服务器的性能,我们会合理分配硬件资源,例如分配适当的CPU内核数和内存容量。
此外,还可以使用RAID技术来提供磁盘冗余和性能优化。
二、监控与日志管理在Linux运维中,及时掌握服务器的运行状态是非常重要的。
为了实现服务器的监控,我们通常会使用监控工具,如Zabbix或Nagios。
通过设置合适的监控参数,我们可以实时监测服务器的CPU使用率、内存使用率、网络流量等指标。
另外,我们还会配置日志管理系统,例如使用Elasticsearch和Kibana收集和分析服务器的日志信息,以便及时发现和解决问题。
三、疑难问题的诊断与解决在Linux运维过程中,经常会遇到一些疑难问题,例如服务器性能下降、网络不稳定等。
针对这些问题,我们通常会通过以下方法进行诊断与解决:1. 查看系统日志:通过查看系统日志文件,我们可以获取一些关键信息,如错误日志、警告信息等。
这些信息可以帮助我们定位问题所在,并采取相应措施。
2. 性能分析工具:Linux提供了一些性能分析工具,如sar、top、vmstat等。
通过这些工具,我们可以查看系统的负载情况、进程状态、内存使用情况等。
借助这些信息,我们可以找到系统性能问题的原因,并采取相应的优化措施。
3. 网络诊断工具:在网络不稳定的情况下,我们可以使用诸如ping、traceroute等工具来诊断网络问题。
通过检测网络延迟、丢包情况,我们可以找到网络故障的原因,并进行相应的调整和修复。
四、自动化运维与CI/CD随着云计算和DevOps的兴起,自动化运维和持续集成/持续交付(CI/CD)成为了Linux运维的重要趋势。
linux实训心得_linux实习心得体会范文

linux实训心得_linux实习心得体会范文你知道linux是什么系统吗?Linux操作系统是基于UNIX操作系统发展而来的一种克隆系统,进行linux实训的时候,认真写一写linux实训心得。
下面是小编给大家带来的linux实训心得_linux实习心得体会范文五篇,以供大家参考,我们一起来看看吧!linux实训心得一为期一周的LINUX课程实训已经结束。
现在我把这次收获丰富的实训自我总结一下。
我们的实训有许多的项目,首先由老师指导然后分小组独立完成老师布置的实验内容,实训的内容十分丰富详实,课程很实用。
主要的大项有:认识网络设备与组网拓扑,交换机的配置,路由器交换机的配置命令,静态路由的配置。
现在首先回顾一下网络设备与组网拓扑这节有趣的课程。
在这个实验中我们必须记住了解很多网络物理设备,例如:交换机,路由器等设备;还有很多通信接口,例如:AUI(粗同轴电缆连接接口),RJ45(双绞线以太网接口),SC接口(网络接口)。
不同的设备之间的需要连接需要不同的线缆,必须使用正确的接法和线缆才能保证设备之间的正常通信。
了解拓扑结构图是十分重要的课程,无论什么样的网络都是从最基本的拓扑结构中研究出来的,基本的网咯拓扑结构是十分重要的基础,很多网咯工程都需要设计拓扑结构图,了解拓扑结构图十分必要。
在这节课程中我们知道了拓扑的广泛应用,无论是广域网还是局域网都是由拓扑结构设计出来的,这节课程我学到了很多有用的,例如:单位内的网络设计,家庭内的网络扩展,Modem和路由器的连接,双网介入局域网,计费管理拓扑结构,无线局域网拓扑结构,3G网络的拓扑结构等设计方案和案例。
网络中很重要的一个设备是交换机,这节实训课说实话比较枯燥,交换机的线路连接很容易,可是线路连接只是很轻松的一环,交换机的配置主要在于交换机的设置,其中有很多命令,从登陆,设置各种参数,运行指令,到最后退出,命令很多,需要十分用心的记忆。
在为期一周的LINUX课程实训中,我每天跟随老师一起做实验,与同学们一起观看PPT教程,对网络有了更深刻的认知,在自己做实验中不断与老师的教学内容相比较,尽力独立完成各种实验内容,虽然困难很多,但是实训很高兴。
运维技术个总结范文

运维技术个总结范文运维技术个人总结范文在运维行业耕耘多年,我深知技术的重要性。
在此,我根据自己的工作经验,总结了一些运维技术的要点,与大家分享,希望能为同行提供一些参考。
一、技能提升1.熟练掌握各类操作系统(如Windows、Linux等)的安装、配置及优化。
2.熟悉网络协议(如TCP/IP、HTTP、HTTPS等)及网络设备(如交换机、路由器等)的基本原理和配置。
3.掌握常见的数据库(如MySQL、Oracle、SQL Server等)的安装、配置、优化及故障处理。
4.熟悉虚拟化技术(如VMware、KVM等)的原理和实施。
5.了解云计算(如AWS、Azure、阿里云等)的基本概念和架构。
6.掌握自动化运维工具(如Ansible、Puppet、SaltStack等)的使用。
7.熟悉容器技术(如Docker、Kubernetes等)的原理和应用。
8.了解网络安全知识,能进行基本的防护和应对。
二、工作实践1.负责公司服务器、网络设备的运维工作,确保系统稳定、安全、高效运行。
2.参与项目实施,负责环境搭建、系统部署、故障排查等工作。
3.编写自动化脚本,提高工作效率。
4.定期对系统进行优化,提高资源利用率。
5.参与公司内部培训,分享运维经验,提升团队整体技术水平。
6.跟踪业界动态,研究新技术,为公司的技术选型提供参考。
三、经验与教训1.重视基础知识的积累,不断提升自己的技能水平。
2.善于总结和归纳,形成自己的知识体系。
3.注重团队协作,与同事分享经验和技能。
4.勇于承担责任,遇到问题主动解决。
5.保持良好的学习习惯,紧跟行业发展趋势。
6.注意细节,避免因疏忽导致故障。
四、展望未来1.深入学习新技术,提升自己的专业能力。
2.参与开源项目,贡献自己的力量。
3.优化现有运维流程,提高工作效率。
4.关注网络安全,为公司的业务保驾护航。
5.培养更多优秀的运维人才,助力公司发展。
总结:运维工作涉及多个领域,要求技术人员具备广泛的知识和技能。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Linux运维经验总结
一、线上操作规范
1、测试使用
当初学习Linux的使用,从基础到服务到集群,都是在虚拟机做的,虽然老师告诉我们跟真机没有什么差别,可是对真实环境的渴望日渐上升,不过虚拟机的各种快照却让我们养成了各种手贱的习惯,以致于拿到服务器操作权限时候,就迫不及待的想去试试,记得上班第一天,老大把root密码交给我,由于只能使用putty,我就想使用xshell,于是悄悄登录服务器尝试改为xshell+密钥登录,因为没有测试,也没有留一个ssh连接,所有重启sshd服务器之后,自己就被挡在服务器之外了,幸好当时我备份sshd_config文件,后来让机房人员cp过去就可以了,幸亏这是一家小公司,不然直接就被干了……庆幸当年运气比较好。
第二个例子是关于文件同步的,大家都知道rsync同步很快,可是他删除文件的速度大大超过了rm -rf,在rsync中有一个命令是,以某目录为准同步某文件(如果第一个目录是空的,那么结果可想而知),源目录(有数据的)就会被删除,当初我就是因为误操作,以及缺乏测试,就目录写反了,关键是没有备份……生产环境数据被删了没备份,大家自己想后果吧,其重要性不言而喻。
2、Enter前再三确认
关于rm -rf / var 这种错误,我相信手快的人,或者网速比较慢的时候,出现的几率相当大,当你发现执行完之后,你的心至少是凉了半截。
大家可能会说,我按了这么多次都没出过错,不用怕,我只想说当出现一次你就明白了,不要以为那些运维事故都是在别人身上,如果你不注意,下一个就是你。
3、切忌多人操作
我在的上一家公司,运维管理相当混乱,举一个最典型的例子吧,离职好几任的运维都有服务器root密码。
通常我们运维接到任务,都会进行简单查看如果无法解决,就请求他人帮忙,可是当问题焦头烂额的时候,客服主管(懂点linux),网管,你上司一起调试一个服务器,当你各种百度,各种对照,完了发现,你的服务器配置文件,跟上次你修改不一样了,然后再改回来,然后再谷歌,兴冲冲发现问题,解决了,别人却告诉你,他也解决了,修改的是不同的参数……这个,我就真不知道哪个是问题真正的原因了,当然这还是好的,问题解决了,皆大欢喜,可是你遇到过你刚修改的文件,测试无效,再去修改发现文件又被修改的时候呢?真的很恼火,切忌多人操作。
4、先备份后操作
养成一个习惯,要修改数据时,先备份,比如.conf的配置文件。
另外,修改配置文件时,建议注释原选项,然后再复制,修改
再者说,如果第一个例子中,有数据库备份,那rsync的误操作不久没事了吧,所以说丢数据库非一朝一夕,随便备份一个就不用那么惨。
二、涉及数据
1、慎用rm -rf
网上的例子很多,各种rm -rf /,各种删除主数据库,各种运
维事故……一点小失误就会造成很大的损失。
如果真需要删除,一定要谨慎。
2、备份大于一切
本来上面都有各种关于备份,但是我想把它划分在数据类再次强调,备份非常之重要哇,我记得我的老师说过一句话,涉及到数据何种的谨慎都不为过,我就职的公司有做第三方支付网站和网贷平台的,第三方支付是每两个小时完全备份一次,网贷平台是每20分钟备份
一次,我不多说了,大家自己斟酌吧
3、稳定大于一切
其实不止是数据,在整个服务器环境,都是稳定大于一切,不求最快,但求最稳定,求可用性,所以未经测试,不要再服务器使用新的软件,比如nginx+php-fpm,生产环境中php各种挂啊,重启下就好了,或者换apache就好了。
4、保密大于一切
现在各种艳照门漫天飞,各种路由器后门,所以说,涉及到数据,不保密是不行的。
三、涉及安全
1、ssh
更改默认端口(当然如果专业要黑你,扫描下就出来了),禁止root登录,使用普通用户+key认证+sudo规则+ip地址+用户限制,使用hostdeny类似的防爆里破解软件(超过几次尝试直接拉黑),筛选/etc/passwd中login的用户。
2、防火墙
防火墙生产环境一定要开,并且要遵循最小原则,drop所有,然后放行需要的服务端口。
3、精细权限和控制粒度
能使用普通用户启动的服务坚决不使用root,把各种服务权限控制到最低,控制粒度要精细。
4、入侵检测和日志监控
使用第三方软件,时刻检测系统关键文件以及各种服务配置文件的改动,比如,/etc/passwd,/etc/f,
/etc/httpd/con/httpd.con等;使用集中化的日志监控体系,监控/var/log/secure,/etc/log/message,ftp上传下载文件等报警错误日志;另外针对端口扫描,也可以使用一些第三方软件,发现被扫描就直接拉入host.deny。
这些信息对于系统被入侵后排错很有帮助。
有人说过,一个公司在安全投入的成本跟他被安全攻击损失的成本成正比,安全是一个很大的话题,也是一个很基础的工作,把基础做好了,就能相当的提高系统安全性,其他的就是安全高手做的了
四、日常监控
1、系统运行监控
好多人踏入运维都是从监控做起,大的公司一般都有专业24小时监控运维。
系统运行监控一般包括硬件占用率常见的有,内存,硬盘,cpu,网卡,os包括登录监控,系统关键文件监控定期的监控可以预测出硬件损坏的概率,并且给调优带来很实用的功能
2、服务运行监控
服务监控一般就是各种应用,web,db,lvs等,这一般都是监控一些指标在系统出现性能瓶颈的时候就能很快发现并解决。
3、日志监控
这里的日志监控跟安全的日志监控类似,但这里一般都是硬件,os,应用程序的报错和警报信息监控在系统稳定运行的时候确实没啥用,但是一旦出现问题,你又没做监控,就会很被动了
五、性能调优
1、深入了解运行机制
其实按一年多的运维经验来说,谈调优根本就是纸上谈兵,但是我只是想简单总结下,如果有更深入的了解,我会更新。
在对软件进行优化之前,比如要深入了解一个软件的运行机制,比如nginx和apache,大家都说nginx快,那就必须知道nginx为什么快,利用什么原理,处理请求比apache,并且要能跟别人用浅显易懂的话说出
来,必要的时候还要能看懂源代码,否则一切以参数为调优对象的文档都是瞎谈。
2、调优框架以及先后
熟悉了底层运行机制,就要有调优的框架和先后顺序,比如数据库出现瓶颈,好多人直接就去更改数据库的配置文件,我的建议是,先根据瓶颈去分析,查看日志,写出来调优方向,然后再入手,并且数据库服务器调优应该是最后一步,最先的应该是硬件和操作系统,现在的数据库服务器都是在各种测试之后才会发布的
适用于所有操作系统,不应该先从他入手。
3、每次只调一个参数
每次只调一个参数,这个相比大家都了解,调的多了,你就自己就迷糊了。
4、基准测试
判断调优是否有用,和测试一个新版本软件的稳定性和性能等方面,就必须要基准测试了,测试要涉及很多因素,测试是否接近业务真实需求这要看测试人的经验了,相关资料大家可以参考《高性能mysql》第三版相当的好,我的老师曾说过,没有放之四海皆准的参数,任何参数更改任何调优都必须符合业务场景,所以不要再谷歌什么什么调优了,对你的提升和业务环境的改善没有长久作用。
六、运维心态
1、控制心态
很多rm -rf /data都在下班的前几分钟,都在烦躁的高峰,那
么你还不打算控制下你的心态么,有人说了,烦躁也要上班,可是你可以在烦躁的时候尽量避免处理关键数据环境越是有压力,越要冷静,不然会损失更多。
大多人都有rm -rf /data/mysql的经历,发现删除之后,那种
心情你可以想象一下,可是如果没有备份,你急又有什么用,一般这种情况下,你就要冷静想下最坏打算了,对于mysql来说,删除了物理文件,一部分表还会存在内存中,所以断开业务,但是不要关闭mysql数据库,这对恢复很有帮助,并使用dd复制硬盘,然后你再
进行恢复,当然了大多时候你就只能找数据恢复公司了。
试想一下,数据被删了,你各种操作,关闭数据库,然后修复,不但有可能覆盖文件,还找不到内存中的表了。
2、对数据负责
生产环境不是儿戏,数据库也不是儿戏,一定要对数据负责。
不备份的后果是非常严重的。
3、追根究底
很多运维人员比较忙,遇到问题解决就不会再管了,记得去年一个客户的网站老是打不开,经过php代码报错发现是session和whos_online损坏,前任运维是通过repair修复的,我就也这样修
复了,但是过了几个小时,又出现了反复三四次之后,我就去谷歌数
据库表莫名损坏原因:一是myisam的bug,二是mysqlbug,三是mysql 在写入过程中被kill,最后发现是内存不够用,导致OOM kill了mysqld进程并且没有swap分区,后台监控内存是够用的,最后升级物理内存解决。
4、测试和生产环境
在重要操作之前一定要看自己所在的机器,尽量避免多开窗口。