返回列表 回复 发帖

关于花屏显卡故障部位分析(讨论)

大家说了这么多显卡维修但没几个说到重点问题,不知是因为保密还是其它什么,反正我不知道。其实我们在修显卡时,问题最多的就是花屏,不信在坛子上走一遍看看。花屏的原因也有很多种,大家都喜欢对花屏的显卡首先用软件测试,测试后看结果虽然结果出来了,但能看明白的人却没几个。本人对显卡维修也不在行,不过就是喜欢修点小东东。前不久在坛子里泡来泡去,对显卡维修感兴趣了于是找来两块显卡学着修一修,首先也是用测试软件测试,一看结果什么的什么一点都看不明白,后来坛子中有人说加焊什么什么的,但原因(也就是如何分析)没一个人说明白,虽然后来修好一块,另一块故障也其本找到,但没工具及配件也就放在那而了。现在坛子中也有人做了点分析但不是很全面,如果我没记错,有人测试出结果叫大家帮看看,多数是叫补焊的,也有能指出是那一位显存出问题的,但是你要问是如何知道的,他会说看图纸,而后不会再说什么。
        可能有很多人都不明白是为什么,起初我也不明白,后来在坛子上下了几张显卡电路图来看看,不过坛子中的显卡图纸实在太少了,以至于很多显卡在没图纸的情况下我们这么菜鸟们只能动不动就吹,除此之外好象就没有别的办法了。说实在的看图纸这东西不认真看却实看不出什么来,打开图纸四面八方都是线。反反复复的看而后又反反复复的在坛子中泡来泡去好象看出点东西来了,举个例子:
       以下为一显卡的测试结果:
Tested from 0 MB to 128 MB.
    LANE     E_BANK0 ERRORS  
------------ ----------------
FBA[31: 0]        25893378   
FBA[63:32]               0   

External Bank 0 Failing bits:
   A00 A01 A02 A03 A04 A05 A06 A07 A08 A09 A10 A11 A12 A13 A14 A15
   A16 A17 A18 A19 A20 A21 A22 A23 A24 A25 A26 A27 A28 A29 A30 A31

Read    Error Count: 457033
Write   Error Count: 25436345
Unknown Error Count: 0

从这一结果中我们看到出问题的是FBA[31: 0]        25893378    这一段,但我们如何知道这是那一个显存有问题呢?请再看下面出错位:
A00 A01 A02 A03 A04 A05 A06 A07 A08 A09 A10 A11 A12 A13 A14 A15
   A16 A17 A18 A19 A20 A21 A22 A23 A24 A25 A26 A27 A28 A29 A30 A31
这才是真正出问题的地方,但有了这些数据对我们菜鸟来说根没测试没什么区别,因为看不明白其中的意思。其实在图纸中我们会发现每一颗显存都有其标记号,其也有如上所看到的什么A00 ~A~~什么什么的,这一点可能对我们没什么用,但有一个数字请大家注意,(为了大家能详细也能明白请看下面这张图:)

      我们会发现在显存脚位中有一些数据(DQ0~DQ7)这些连接线所对应的(FBA—-D<40~47>)在显卡图纸上是不会重复的,而这些FBA-D<0~N>也正我们测试结果中显示的A00 A01 A02 A03 A04~~~与之对应的,这才是真正去找出问题显存是哪一颗的方法,其实主要是有了图纸知道了脚位号所对应的显存位列号难道你还找不出是哪一颗显存吗!
       这只是本人在N天学习中的体会至于正不正确还望大家指点。不过还有一点大家要注意的是在我测试发现的显卡花屏中如果数据位出错的很多很可能是GPU出问题的机会要大些,可以试加焊GPU。我们可以这样想一下,如果显存出问题其出错的数据位应不会这么多可能就几个当然也不全是这样,只是这是在维修中的一些思路,因某种原因也许也会有很多出错的数据位。GPU某一具脚虚焊也会有一个或两个之类的数据位出错,至少通过以上分析我们可以定位于某一颗显存先进行处理或测试,而后再考虑GPU下面这个测试就GPU虚焊的 一个实例:
Tested from 0 MB to 128 MB.
    LANE     E_BANK0 ERRORS  
------------ ----------------
FBA[31: 0]        25893378   
FBA[63:32]               0   

External Bank 0 Failing bits:
   A00 A01 A02 A03 A04 A05 A06 A07 A08 A09 A10 A11 A12 A13 A14 A15
   A16 A17 A18 A19 A20 A21 A22 A23 A24 A25 A26 A27 A28 A29 A30 A31

Read    Error Count: 457033
Write   Error Count: 25436345
Unknown Error Count: 0

    下面这个是取了一颗显存的结果:
FBA[31: 0]        42428130   
FBA[63:32]               0   

External Bank 0 Failing bits:
   A16 A17 A18 A19 A20 A21 A22 A23 A24 A25 A26 A27 A28 A29 A30 A31
   
Read    Error Count: 3802942
Write   Error Count: 38625188
Unknown Error Count: 0

取了一颗显存其结果也只是(A16~A31)而GPU虚焊的结果却是(A0~A31)。

   此测试为一颗显存出错测试结果:
Tested from 0 MB to 128 MB.
    LANE     E_BANK0 ERRORS  
------------ ----------------
FBA[31: 0]        16937216   
FBA[63:32]               0   

External Bank 0 Failing bits:
   A22
Read    Error Count: 0
Write   Error Count: 16937216
Unknown Error Count: 0
此结果中只有A22出错,显存虚焊的可能很大,不过实际维修中此卡对显存吹过两次,对GPU也吹过两次,故障一样,从而确定显存坏的可能性很大,取下此显存结果为A16~A31,其A22在其测试数据位中,所以显存坏,但因为没有显存所以也没再去确认。

        以上是本人对修显卡花屏的一点总结,持别是如何去判断测试结果所对应的显存,其实有了结果只要有此显卡的图纸应能准确找出显存故障处理方法,只是最重要的是我们很难找到图纸,这才是显卡维修的难点吧!
        本人学历不精,以上分析只是个人意愿,感觉好象是对的,因从无老师教过不对之处大家见谅!!别见笑!如果对你有用请多多指点,实践出真知!!!相互学习!!
2

评分次数

  • 学员5701-01:精品文章,感谢分享!学习了!

  • zt1141:今后希望有志同道合的会员共同研究共同提高

谢谢楼主,学习了。
返回列表