Sep 112012
当你机器数量多的时候,一个头痛的事情就是害怕硬盘坏了。那么怎么知道硬盘的运行状况呢?其实很早以前硬盘就有一个Smart的技术,用来检测硬盘的运行状况。
如何可以做到预测硬盘马上要坏掉和硬盘坏掉后,马上知道,这目前来说,还是比较高难度,作法还是比较白痴,依靠人工去机器前面看灯.
不过这个工具,很少资料介绍如何使用。尤其在服务器端,基本都是做Raid。这样也就导致查看硬盘信息更加困难。
上次和搜狐交流,专门提到Smart监控硬盘的运行状况。今天刚好有朋友在群里发了一个资料
http://jianlee.ylinux.org/Computer/SystemAdmin/smarttools.html
我比较关心是否能透过Raid查看。官方网站查看了一下,可以,http://sourceforge.net/apps/trac/smartmontools/wiki/Supported_RAID-Controllers
不过好像我手头上的测试机器,不支持这个。
root@node08:~# smartctl -a /dev/sda smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-30-generic] (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net Vendor: LSI Product: MegaRAID 8708EM2 Revision: 1.40 User Capacity: 896,998,047,744 bytes [896 GB] Logical block size: 512 bytes Logical Unit id: 0x600605b00350d8b017c4c7570751a04f Serial number: 004fa0510757c7c417b0d85003b00506 Device type: disk Local Time is: Tue Sep 11 14:42:30 2012 CST Device does not support SMART Error Counter logging not supported Device does not support Self Test logging
不过至少通过这个命令,可以看到阵列卡信息。已经不容易了。
看来这个和IPMI一样,都是一个比较有意思的技术。继续关注。
HP server有套管理工具:System Management可以查看硬件状态。
现在厂商的管理工具,基本没客户使用。厂商的技术人员,销售人员也不知道。
也不是完全没人使用,比如在linux下安装一个软件包“hpacucli-*.rpm”,使用一些相关命令,基本硬盘状态都可以查到。很多做硬件监控的都在用。
陈老大,几乎每天都来您的博客,通过您的博客,很长见识。在linux下看raid状态,不错,我给您转走了。老规矩,必须写明您的博客地址。
汗~,多年经验告诉我 S.M.A.R.T utility基本不靠谱
分享一下,有啥办法检测硬盘的状态。