专职做DBA已经6年多的事件了,看同行、同事犯了太多的错误,自己也犯了非常多的错误。一路走来,感触非常深。然而绝大多数的错误其实都是很低级的错误。有的是因为不了解某个引擎的特性导致;有的是因为对线上环境不了解导致;有的是因为经验不足导致;一路上,跌跌撞撞,从小公司DBA,到腾讯高级DBA,再到现在的金融数据库DBA。 不由得想起5年前的我,刚进入DBA行业,缺乏经验,经常犯错误,不是我不够努力,更多的是初来咋到的我根本不知道应该在哪方面下功夫。本文就是基于这方面的考虑,根据自己在DBA这个职业上走过的弯路,总结一些方法给DBA的同行。希望本文能给同行DBA或者运维的朋友们带来一些改变,让大家知道作为一个DBA需要在哪些方面下功夫。下面主要从环境、数据安全、常规操作、预案、架构、心态等层面,同时也会介绍一些实用的经验。
<1>环境篇
毫无疑问,DBA是需要综合技能最多的一个职业,需要你有网络、操作系统、文件系统、数据库、安全、编程等知识。作为DBA,为了少犯错误,你首先得非常熟悉你负责的数据库环境,大到网络环境、系统环境、数据库环境(这里主要以mysql为例)。如果不熟悉环境,很容易因为自身操作考虑不周而导致线上的故障。想想就知道,有多少DBA因为alter操作导致的线上故障?有多少DBA忽略了字符集的问题导致了线上的乱码?又有多少DBA由于迁移的时候没有备份触发器或者event导致的故障?太多的教训足以让我们所有的DBA认识到熟悉环境的重要性。另外DBA对线上环境如果足够了解,在处理故障、讨论处理方案等,都能极大地增强我们的自信,更好地提升自己的影响力。我们可以说不熟悉环境的DBA不是好DBA。下面来介绍环境部分我们DBA应该注意的问题:
1、软件环境
1.1 操作系统环境
针对操作系统部分,你可能需要了解的是使用的操作系统类型,linux or windows,该系统做了哪些内核的优化,尤其是针对数据库,比如文件描述符、配置ntp、raid的写cache模式等,另外你还要对系统的运行状态有大致的了解,CPU使用、内存使用、IO使用以及网络带宽和包量的情况。
1.2 数据库环境