• 进入"运维那点事"后,希望您第一件事就是阅读“关于”栏目,仔细阅读“关于Ctrl+c问题”,不希望误会!

标签:故障总结

一次数据误删除操作后的觉悟

一、背景 前天不小心把服务器的/usr/bin目录删了,当时那种感觉(你可以操作一次试试),当然这个问题不大,也很好解决,就是找一个相同的系统把/usr/bin打包传到此服务器即可。但是,不幸的是,你所知道的scp、rz、wget、rsync等可以传输的命令都在/usr/bin目录下;但还好,rpm命令不在此目录下,所以你可以挂在一个光盘,把以上的包强制重新……

记录一次服务器被攻击时的处理过程

特此声明,此篇文章只是分享一下服务器被攻击时的处理思路,并没有什么技术含量的东西。此次攻击是服务器被当成肉鸡了一直DDOS外部网站,事情不大,但影响甚大,因为此主机不光负载过高,并且跑了1G的带宽,影响可想而知。 故事开始:2016:10:27 17:14 接收到反馈出口带宽异常,同时接收到服务器带宽占用报警,我们所有主机都是加有基础监控模板的(Zabbix……

PHP程序连接Redis报read error on connection问题

线上PHP程序动不动就报PHP Fatal error: Uncaught RedisException: read error on connection错误,就是连接Redis在那么1秒钟有问题,我们的架构是: PHP程序—>twemproxy代理—>Redis实例(5个节点) PHP-FPM的超时时间是1s钟,也就是……

Linux service无法使用系统环境变量问题

故事起因 一个朋友有一个openfire(开源即使通信工具)服务器,openfire是java写的,当然也就需要jdk环境了。服务器的系统是CentOS6,自己写了一个启动openfire的脚本/etc/init.d/openfire,然后注册为service可以管理的服务,但是在启动时遇到一个小问题,使用/etc/init.d/openfire start……

Linux下删除正在使用的文件后空间不释放问题解决

1、错误现象 运维的监控系统发来通知,报告一台服务器空间满了,登陆服务器查看,根分区确实没有空间了,如下图所示: [root@localhost~ ]# df -h Filesystem Size Used Avail Use% Mounted on /dev/vda1 20G 18G 1.8……

让Linux bind支持带下划线域名的解析

故事起因 公司内部使用的一台使用Linux Bind做的DNS服务器,上面跑着一个域名(abc.com),一直运行的好好的。今天又要添加一个域名,不就是把配置文件复制一份,然后在主配置文件中添加一个域就好了。配置如下: zone "def.com" { type master; file "……

全网故障,我只是插入一根网线

在我们日常运维工作中,会遭遇各种各样,甚至乱七八糟的故障。而且有些故障刚开始会让你莫名其妙,但结果却让人苦笑不得。本文作者通过阐述个人运维生涯中的其中两个故障作为引子,进而聊聊发生故障之前和之后,我们应该怎么办。 作者简介 赵舜东,江湖人称赵班长,曾负责武警某部指挥自动化架构和运维工作,2008年退役后一直从事互联网运维工作。UnixHot运维社区创始人、《……

理解memcached为什么会丢数据?

分享一个memcached丢失数据后的解决办法 在看这篇文章之前,最起码要知道memcached系列前三篇的知识,最重要的就是memcached的命令以及memcached内存管理策略,这是理解memcached为什么会丢数据的基础。 01-Memcached缓存数据库介绍 02-Memcached安装使用详解 03-Memcached内存分配策略 04-M……

请记住,rm -fr /不会再删除系统了

前几天相信做运维的同学都知道的一个新闻,那就是让你心惊胆战的”rm -fr /”命令。没错,那个新闻就是国外一哥们据说是Ansible的bug,导致执行”rm -fr $foo/$bar”时,$foo/$bar变量并没有获取到值,所以你懂的,命令就变成了”rm -fr /”,但是”rm ……