╋艺 镇╋╋论坛の释疑╋┣◇玩转系统 → 如何知道我的硬盘的健康状况


  共有19773人关注过本帖树形打印复制链接

主题:如何知道我的硬盘的健康状况

美女呀,离线,留言给我吧!
admin
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信 司令 亲民勋章
等级:管理员 帖子:3027 积分:27521 威望:0 精华:7 注册:2003/12/30 16:34:32
如何知道我的硬盘的健康状况  发帖心情 Post By:2015/5/30 10:11:05 [只看该作者]

 服务器的硬盘都保存有重要的资料,经常对硬盘的健康状况进行检查就显得十分重要。大家都知道硬盘有价,数据无价。一旦硬盘出现坏道或硬盘彻底“罢工”,不仅仅是你的业务中断,可能你的宝贵数据都无法挽救,到那时,你纵有再高的“法力”也无力回天了。
    如何知道我的硬盘的健康状况?你可以从网上下载一个工具-----HDtune或HDtunePro,这个工具使用非常方便。运行HDtune工具,选择你要查看的硬盘,再选择“健康”标签,你将看到该硬盘的SMART参数,如下图:
    图片点击可在新窗口打开查看
    上图中SMART的参数有很多项,你只需要重点关注以下几项参数:
    (05)重映射扇区计数,
    (C5)当前待映射的扇区数,
    (C6)脱机无法校正的扇区数,
    (C7)Ultra DMA CRC错误计数,
    (BE)气流温度。

    详解以上几个参数:
    (05)数据列应为0。一旦出现值,表明你的硬盘已出现了物理坏道,物理坏道无法修复。这种情况,请快快备份数据。此数据值超过阀值,硬盘的容量开始减少,如果不通过一些软件工具屏蔽坏道,有可能坏道进一步扩大,该数值继续增加,你的硬盘离“罢工”不远了,最好的办法是尽快更换硬盘。
    (C5)数据列应为0。当遇到停电、死机、蓝屏的次数比较多时,这一项值出现的机率就较大了。这一项值的出现,会表现为,拷贝时出现CRC冗余校验错误。一旦你在使用硬盘时出现CRC冗余校验错误,该(C5)值,肯定不是0了。发生了这种情况,表明有逻辑坏道,逻辑坏道一般来说是可以修复的。如果不重视这个值,长期不修复的话,当再次写入错误,系统会把它写到(05)值里,一旦形成物理坏道就无法再修复了。
    (C6)这项值应为0。它是(C5)向(05)过渡的值,是累计了读写扇区时发生的无法校正的错误总数,该数据值上升表明盘片表面介质或机械子系统出现问题,有些扇区肯定已经不能读取,如果有文件正在使用这些扇区,操作系统会返回读盘错误的信息。下一次写操作时会对该扇区执行重映射,即向05进数。

    (C7)这项值经常容易出现增加,原因多为SATA数据线有问题或与硬盘接口接触不良所至,你换根好的数据线修复接口接触不良就会解决此问题。
 
    (BE)这一项表示的是硬盘内部盘片表面的气流温度。在希捷公司的某些硬盘中,当检测到这一项显示警告时,硬盘的读写性能明显下降。资料说该项没有实际意义,但在实际使用中,系统运行会变得很卡,建议还是考虑做好数据备份,并更换硬盘,同时解决硬盘的散热问题。

    附:SMART部分参数详解(摘自互联网)

01(001)底层数据读取错误率 Raw Read Error Rate
  数据为0或任意值,当前值应远大于与临界值。
  底层数据读取错误率是磁头从磁盘表面读取数据时出现的错误,对某些硬盘来说,大于0的数据表明磁盘表面或者读写磁头发生问题,如介质损伤、磁头污染、磁头共振等等。不过对希捷硬盘来说,许多硬盘的这一项会有很大的数据量,这不代表有任何问题,主要是看当前值下降的程度。
  在固态硬盘中,此项的数据值包含了可校正的错误与不可校正的RAISE错误(UECC+URAISE)。

  注:RAISE(Redundant Array of Independent Silicon Elements)意为独立硅元素冗余阵列,是固态硬盘特有的一种冗余恢复技术,保证内部有类似RAID阵列的数据安全性。

  02(002)磁盘读写通量性能 Throughput Performance
  此参数表示硬盘的读写通量性能,数据值越大越好。当前值如果偏低或趋近临界值,表示硬盘存在严重的问题,但现在的硬盘通常显示数据值为0或根本不显示此项,一般在进行了人工脱机SMART测试后才会有数据量。

  03(003)主轴起旋时间 Spin Up Time
  主轴起旋时间就是主轴电机从启动至达到额定转速所用的时间,数据值直接显示时间,单位为毫秒或者秒,因此数据值越小越好。不过对于正常硬盘来说,这一项仅仅是一个参考值,硬盘每次的启动时间都不相同,某次启动的稍慢些也不表示就有问题。
  硬盘的主轴电机从启动至达到额定转速大致需要4秒~15秒左右,过长的启动时间说明电机驱动电路或者轴承机构有问题。旦这一参数的数据值在某些型号的硬盘上总是为0,这就要看当前值和最差值来判断了。
  对于固态硬盘来说,所有的数据都是保存在半导体集成电路中,没有主轴电机,所以这项没有意义,数据固定为0,当前值固定为100。

  04(004)启停计数 Start/Stop Count
  这一参数的数据是累计值,表示硬盘主轴电机启动/停止的次数,新硬盘通常只有几次,以后会逐渐增加。系统的某些功能如空闲时关闭硬盘等会使硬盘启动/停止的次数大为增加,在排除定时功能的影响下,过高的启动/停止次数(远大于通电次数0C)暗示硬盘电机及其驱动电路可能有问题。
  这个参数的当前值是依据某种公式计算的结果,例如对希捷某硬盘来说临界值为20,当前值是通过公式“100-(启停计数/1024)”计算得出的。若新硬盘的启停计数为0,当前值为100-(0/1024)=100,随着启停次数的增加,该值不断下降,当启停次数达到81920次时,当前值为100-(81920/1024)=20,已达到临界值,表示从启停次数来看,该硬盘已达设计寿命,当然这只是个寿命参考值,并不具有确定的指标性。
  这一项对于固态硬盘同样没有意义,数据固定为0,当前值固定为100。

  05(005)重映射扇区计数 Reallocated Sectors Count/ 退役块计数 Retired Block Count
  数据应为0,当前值应远大于临界值。
  当硬盘的某扇区持续出现读/写/校验错误时,硬盘固件程序会将这个扇区的物理地址加入缺陷表(G-list),将该地址重新定向到预先保留的备用扇区并将其中的数据一并转移,这就称为重映射。执行重映射操作后的硬盘在Windows常规检测中是无法发现不良扇区的,因其地址已被指向备用扇区,这等于屏蔽了不良扇区。
  这项参数的数据值直接表示已经被重映射扇区的数量,当前值则随着数据值的增加而持续下降。当发现此项的数据值不为零时,要密切注意其发展趋势,若能长期保持稳定,则硬盘还可以正常运行;若数据值不断上升,说明不良扇区不断增加,硬盘已处于不稳定状态,应当考虑更换了。如果当前值接近或已到达临界值(此时的数据值并不一定很大,因为不同硬盘保留的备用扇区数并不相同),表示缺陷表已满或备用扇区已用尽,已经失去了重映射功能,再出现不良扇区就会显现出来并直接导致数据丢失。
  这一项不仅是硬盘的寿命关键参数,而且重映射扇区的数量也直接影响硬盘的性能,例如某些硬盘会出现数据量很大,但当前值下降不明显的情况,这种硬盘尽管还可正常运行,但也不宜继续使用。因为备用扇区都是位于磁盘尾部(靠近盘片轴心处),大量的使用备用扇区会使寻道时间增加,硬盘性能明显下降。
  这个参数在机械硬盘上是非常敏感的,而对于固态硬盘来说同样具有重要意义。闪存的寿命是正态分布的,例如说MLC能写入一万次以上,实际上说的是写入一万次之前不会发生“批量损坏”,但某些单元可能写入几十次就损坏了。换言之,机械硬盘的盘片不会因读写而损坏,出现不良扇区大多与工艺质量相关,而闪存的读写次数则是有限的,因而损坏是正常的。所以固态硬盘在制造时也保留了一定的空间,当某个存储单元出现问题后即把损坏的部分隔离,用好的部分来顶替。这一替换方法和机械硬盘的扇区重映射是一个道理,只不过机械硬盘正常时极少有重映射操作,而对于固态硬盘是经常性的。
  在固态硬盘中这一项的数据会随着使用而不断增长,只要增长的速度保持稳定就可以。通常情况下,数据值=100-(100×被替换块/必需块总数),因此也可以估算出硬盘的剩余寿命。
  Intel固态硬盘型号的第十二个字母表示了两种规格,该字母为1表示第一代的50纳米技术的SSD,为2表示第二代的34纳米技术的SSD,如SSDSA2M160G2GN就表示是34nm的SSD。所以参数的查看也有两种情况:
  50nm的SSD(一代)要看当前值。这个值初始是100,当出现替换块的时候这个值并不会立即变化,一直到已替换四个块时这个值变为1,之后每增加四个块当前值就+1。也就是100对应0~3个块,1对应4~7个块,2对应8~11个块……

  34nm的SSD(二代)直接查看数据值,数据值直接表示有多少个被替换的块。
 
  06(006)读取通道余量 Read Channel Margin
  这一项功能不明,现在的硬盘也不显示这一项。

  07(007)寻道错误率 Seek Error Rate
  数据应为0,当前值应远大于与临界值。
  这一项表示磁头寻道时的错误率,有众多因素可导致寻道错误率上升,如磁头组件的机械系统、伺服电路有局部问题,盘片表面介质不良,硬盘温度过高等等。
  通常此项的数据应为0,但对希捷硬盘来说,即使是新硬盘,这一项也可能有很大的数据量,这不代表有任何问题,还是要看当前值是否下降。

  08(008)寻道性能 Seek Time Performance
  此项表示硬盘寻道操作的平均性能(寻道速度),通常与前一项(寻道错误率)相关联。当前值持续下降标志着磁头组件、寻道电机或伺服电路出现问题,但现在许多硬盘并不显示这一项。

  09(009)通电时间累计 Power-On Time Count (POH)
  这个参数的含义一目了然,表示硬盘通电的时间,数据值直接累计了设备通电的时长,新硬盘当然应该接近0,但不同硬盘的计数单位有所不同,有以小时计数的,也有以分、秒甚至30秒为单位的,这由磁盘制造商来定义。
  这一参数的临界值通常为0,当前值随着硬盘通电时间增加会逐渐下降,接近临界值表明硬盘已接近预计的设计寿命,当然这并不表明硬盘将出现故障或立即报废。参考磁盘制造商给出的该型号硬盘的MTBF(平均无故障时间)值,可以大致估计剩余寿命或故障概率。
  对于固态硬盘,要注意“设备优先电源管理功能(device initiated power management,DIPM)”会影响这个统计:如果启用了DIPM,持续通电计数里就不包括睡眠时间;如果关闭了DIPM功能,那么活动、空闲和睡眠三种状态的时间都会被统计在内。

  0A(010)主轴起旋重试次数 Spin up Retry Count
  数据应为0,当前值应大于临界值。
  主轴起旋重试次数的数据值就是主轴电机尝试重新启动的计数,即主轴电机启动后在规定的时间里未能成功达到额定转速而尝试再次启动的次数。数据量的增加表示电机驱动电路或是机械子系统出现问题,整机供电不足也会导致这一问题。

  0C(012)通电周期计数 Power Cycle Count
  通电周期计数的数据值表示了硬盘通电/断电的次数,即电源开关次数的累计,新硬盘通常只有几次。
  这一项与启停计数(04)是有区别的,一般来说,硬盘通电/断电意味着计算机的开机与关机,所以经历一次开关机数据才会加1;而启停计数(04)表示硬盘主轴电机的启动/停止(硬盘在运行时可能多次启停,如系统进入休眠或被设置为空闲多少时间而关闭)。所以大多情况下这个通电/断电的次数会小于启停计数(04)的次数。
  通常,硬盘设计的通电次数都很高,如至少5000次,因此这一计数只是寿命参考值,本身不具指标性。

  B7(183)串口降速错误计数 SATA Downshift Error Count
  这一项表示了SATA接口速率错误下降的次数。通常硬盘与主板之间的兼容问题会导致SATA传输级别降级运行。

  B8(184)I/O错误检测与校正 I/O Error Detection and Correction(IOEDC)
  “I/O错误检测与校正”是惠普公司专有的SMART IV技术的一部分,与其他制造商的I/O错误检测和校正架构一样,它记录了数据通过驱动器内部高速缓存RAM传输到主机时的奇偶校验错误数量。
  B8(184)点到点错误检测计数 End to End Error Detection Count
  Intel第二代的34nm固态硬盘有点到点错误检测计数这一项。固态硬盘里有一个LBA(logical block addressing,逻辑块地址)记录,这一项显示了SSD内部逻辑块地址与真实物理地址间映射的出错次数。
  B8(184)原始坏块数 Init Bad Block Count(Indilinx芯片)
  硬盘出厂时已有的坏块数量。

  BB(187)无法校正的错误 Reported Uncorrectable Errors(希捷)
  报告给操作系统的无法通过硬件ECC校正的错误。如果数据值不为零,就应该备份硬盘上的数据了。
  报告给操作系统的在所有存取命令中出现的无法校正的RAISE(URAISE)错误。

  BC(188)命令超时 Command Timeout
  由于硬盘超时导致操作终止的次数。通常数据值应为0,如果远大于零,最有可能出现的是电源供电问题或者数据线氧化致使接触不良,也可能是硬盘出现严重问题。

  BD(189)高飞写入 High Fly Writes
  磁头飞行高度监视装置可以提高读写的可靠性,这一装置时刻监测磁头的飞行高度是否在正常范围来保证可靠的写入数据。如果磁头的飞行高度出现偏差,写入操作就会停止,然后尝试重新写入或者换一个位置写入。这种持续的监测过程提高了写入数据的可靠性,同时也降低了读取错误率。这一项的数据值就统计了写入时磁头飞行高度出现偏差的次数。
   BD(189)出厂坏块计数 Factory Bad Block Count(Micron 镁光芯片)

  BE(190)气流温度 Airflow Temperature
  这一项表示的是硬盘内部盘片表面的气流温度。在希捷公司的某些硬盘中,当前值=(100-当前温度),因此气流温度越高,当前值就越低,最差值则是当前值曾经到达过的最低点,临界值由制造商定义的最高允许温度来确定,而数据值不具实际意义。许多硬盘也没有这一项参数。

  C2(194)温度 Temperature
  温度的数据值直接表示了硬盘内部的当前温度。硬盘运行时最好不要超过45℃,温度过高虽不会导致数据丢失,但引起的机械变形会导致寻道与读写错误率上升,降低硬盘性能。硬盘的最高允许运行温度可查看硬盘厂商给出的数据,一般不会超过60℃。
  不同厂家对温度参数的当前值、最差值和临界值有不同的表示方法:希捷公司某些硬盘的当前值就是实际温度(摄氏)值,最差值则是曾经达到过的最高温度,临界值不具意义;而西部数据公司一些硬盘的最差值是温度上升到某值后的时间函数,每次升温后的持续时间都将导致最差值逐渐下降,当前值则与当前温度成反比,即当前温度越高,当前值越低,随实际温度波动。

  C3(195)硬件ECC校正 Hardware ECC Recovered
  ECC(Error Correcting Code)的意思是“错误检查和纠正”,这个技术能够容许错误,并可以将错误更正,使读写操作得以持续进行,不致因错误而中断。这一项的数据值记录了磁头在盘片上读写时通过ECC技术校正错误的次数,不过许多硬盘有其制造商特定的数据结构,因此数据量的大小并不能直接说明问题。
  C3(195)实时无法校正错误计数 On the fly ECC Uncorrectable Error Count
  这一参数记录了无法校正(UECC)的错误数量。
  C3(195)编程错误块计数 Program Failure block Count(Indilinx芯片)

  C5(197)当前待映射扇区计数 Current Pending Sector Count
  数据应为0,当前值应远大于临界值。
  这个参数的数据表示了“不稳定的”扇区数,即等待被映射的扇区(也称“被挂起的扇区”)数量。如果不稳定的扇区随后被读写成功,该扇区就不再列入等待范围,数据值就会下降。
  仅仅读取时出错的扇区并不会导致重映射,只是被列入“等待”,也许以后读取就没有问题,所以只有在写入失败时才会发生重映射。下次对该扇区写入时如果继续出错,就会产生一次重映射操作,此时重映射扇区计数(05)与重映射事件计数(C4)的数据值增加,此参数的数据值下降。
  C5(197)读取错误块计数(不可修复错误)Read Failure block Count(Indilinx芯片)

  C6(198)脱机无法校正的扇区计数 Offline Uncorrectable Sector Count
  数据应为0,当前值应远大于临界值。
  这个参数的数据累计了读写扇区时发生的无法校正的错误总数。数据值上升表明盘片表面介质或机械子系统出现问题,有些扇区肯定已经不能读取,如果有文件正在使用这些扇区,操作系统会返回读盘错误的信息。下一次写操作时会对该扇区执行重映射。
  C6(198)总读取页数 Total Count of Read Sectors(Indilinx芯片)

  C7(199)Ultra ATA访问校验错误率 Ultra ATA CRC Error Rate
  这个参数的数据值累计了通过接口循环冗余校验(Interface Cyclic Redundancy Check,ICRC)发现的数据线传输错误的次数。如果数据值不为0且持续增长,表示硬盘控制器→数据线→硬盘接口出现错误,劣质的数据线、接口接触不良都可能导致此现象。由于这一项的数据值不会复零,所以某些新硬盘也会出现一定的数据量,只要更换数据线后数据值不再继续增长,即表示问题已得到解决。
  C7(199)总写入页数 Total Count of Write Sectors(Indilinx芯片)
 
  F0(240)磁头飞行时间 Head Flying Hours / 传输错误率 Transfer Error Rate(富士通)
  磁头位于工作位置的时间。
  富士通硬盘表示在数据传输时连接被重置的次数。

  F1(241)LBA写入总数 Total LBAs Written
  LBA写入数的累计。
  F1(241)写入剩余寿命 Lifetime Writes from Host
  自硬盘启用后主机向硬盘写入的数据总量,以4个字节表示,每写入64GB字节作为一个单位。

  F2(242)LBA读取总数 Total LBAs Read
  LBA读取数的累计。某些SMART读取工具会显示负的数据值,是因为采用了48位LBA,而不是32位LBA。
  F2(242)读取剩余寿命 Lifetime Reads from Host
  自硬盘启用后主机从硬盘读取的数据总量,以4个字节表示,每读取64GB字节作为一个单位。

 本文来源于 中科兴联(http://www.cbdcn.com/),原文地址:http://help2.cbdcn.com/news/web/201504/873_2.html

[此贴子已经被作者于2015-5-30 10:14:29编辑过]


  
“艺镇”官方站:www.zyzsky.com QQ群:1221854  回到顶部