Dit zijn zaken die ik opgestoken heb bij het bekijken van tientallen GPU repair video's op Youtube. Mocht hier onzin tussen staan, verbeter mij dan aub. Want ik ben absoluut geen specialist.
1. Koude diagnose:
een vermoedelijke defecte kaart steek ik niet direct in een PC. Eerst wat testen:
- Kaart uit elkaar halen en reinigen. Ik begin met de warmtegeleidende pasta op de GPU. Vaak is die vanonder de GPU geperst en ligt op andere componenten. De samenstelling is onbekend, dus wie weet is die pasta wel geleidend. Dat wil je natuurlijk niet. Dus eerst goed opkuisen: wat Isopropyl Alcohol (IPA) en een zachte tandenborstel of een (iets hardere) penseelborstel doe wonderen. Let goed op dat je de componenten niet beschadigt naast de die !
Voor de rest wordt de kaart goed ontstoft, hardnekkig vuil ook met IPA verwijderd. Keukendoekje of voor de moeilijk bereikbare plaatsen een oorstokje.
De heatpads van memory en soms mosfets blijven meestal aan de koeler hangen. Als die nog redelijk zijn, laat ik ze.
Dit is ook het ideale moment om de koeler te reinigen, want vaak zit die vol stof. Compressor to the rescue.
tip: vijsjes goed bijhouden ! - Nu de kaart proper is, is ze ook gemakkelijker visueel te inspecteren. Zichtbare beschadigingen (doorgebrande component, component die gewoon weg is) zijn natuurlijk de meest voor de hand liggende indicatoren.
Omdat smd componenten zeer klein kunnen zijn (soms niet groter dan 1 op 0.5 mm) kan een vergrootglas handig zijn).
Let op, het is niet omdat solder pads leeg zijn, dat er per se een component ontbreekt. De pcb's worden vaak voor meerdere reeksen kaarten gemaakt, soms zijn de componenten er, soms niet. Dus je moet eerder letten op solder pads waar duidelijk iets van afgebroken is. Soldeersel is daar vaak minder glanzend dan een solder pad met soldeersel waar geen component op zit. - Tijd om de multimeter erbij te halen. Eerst meten of er geen kortsluiting (short) is tussen ground en de voltage rails. Een short wijst bijna zeker op een defecte component. Als je zo'n kaart in je PC steekt en aanlegt, dan kan er nog meer kapot gaan op de kaart of misschien zelfs je moederbord of voeding.
In dezelfde beweging kan je ineens de weerstand meten tussen ground en de voltage rails. In feite meet je dus de weerstand doorheen de belangrijke componenten zoals GPU en memory. Er moet weerstand zijn (>0 ohm). Weerstand over de GPU is erg klein, dus let erop dat je dit niet met een short verwart.
Welke voltage rails (of VRM's, voltage regulator modules) zijn er zoal ?
- VCore (stroomvoorziening GPU)
- VMem (stroomvoorziening memory)
- meestal minstens 2 secundaire (Aux), om bijv. BIOS, sturing IC's en display outputs van stroom te voorzien - Als je zekeringen herkent, kan je die gemakkelijk meten. In principe moeten die 0 weerstand hebben, in beide richtingen. Grote weerstand of helemaal geen continuïteit wijst op een doorgebrande zekering.
Soms worden in de plaats van zekeringen zogenaamde nul-weerstanden gebruikt, soms smd inductoren. Zelfde principe.
Je vindt meestal een zekering nabij de PCIE power connector, daar komt 12V binnen. En meestal een tweede nabij de PCIE slot (stukje dichtst bij de monitoruitgangen), daar komt zowel 12V als 3,3V binnen. - Nog iets dat je heel gemakkelijk kan meten, zijn de grote vierkante of rechthoekige inductoren of chokes. Net als de zekeringen, moeten die 0 weerstand hebben. Logisch, want het zijn gewoon koperspoelen.
- Zijn er diodes te herkennen, meet die dan ook ineens. Een diode moet in één richting bijna geen weerstand hebben, in de andere richting mag die geen continuïteit hebben (of toch zeker een heel grote weerstand)
- Je kan wat metingen doen op de condensatoren (zowel de grotere als de smd). 90% van de condensatoren hangt met één kant aan ground. Een condensator die met 2 poten ground meet, kan een indicatie zijn op een defect. Zeker weet je het echter niet omdat ze in een circuit zitten. Dus om zeker te weten, zou je ze moeten lossolderen. Niet zo handig, want er zijn er vaak tientallen.
Omdat er geen lijn in zit, moet je kijken of er een patroon is. Condensatoren die allemaal lijken hetzelfde te doen (allemaal op één rij) gedragen zich ook meestal hetzelfde. - MOSFET's meten. Hiervoor ga je al het type moeten opzoeken. Staat gedrukt op de MOSFET, maar is soms moeilijk te lezen: MOSFET's worden warm, waardoor de opdruk wat wegbakt. Goed reinigen met IPA en dan schuin tegen het licht houden kan helpen. Als je het type weet, zoek je de datasheet op. Je moet weten welk type MOSFET het is en waar elk contact voor dient, anders heeft meten weinig zin. Enkele tips hoe je kan meten hier.
Maar hou er ook hier rekening mee dat de MOSFET's in een circuit zitten. Op grafische kaarten bijna altijd in een buck converter circuit dat aangestuurd wordt door een aparte IC. Per circuit (fase) vind je daarom meestal minimum 2 MOSFET's (high side en low side). Maar het kunnen er ook meer zijn (in parallel, meer MOSFET's is meer power).
De Drain van de low side MOSFET is altijd verbonden (= geen weerstand) met de Source van de high side MOSFET.
Als de koude diagnose niet direct fundamentele problemen aantoont, dan is het tijd om het "spannend" te maken...
1. "Hot" diagnose:
Concreet: Grafische kaart in moederbord steken, PCIE power aansluiten, monitor output in.
Met uitzondering van de GPU en geheugen (en wat kleinere zaken), dienen de meeste componenten op een grafische kaart simpelweg voor stroomvoorziening. Als je geen goeie stroomvoorziening hebt, dan gaat het nooit werken. Ik schat dat 80% van de defecten gewoon problemen met de stroomvoorziening zijn.
We gaan in deze stap voelen en meten aan de kaart terwijl ze onder spanning staat. Aangezien de contacten allemaal erg dicht staan, moet je ook heel precies kunnen werken. Een krappe behuizing is dus niet handig. Beter is een vrije test rig.
Een vaste hand is essentieel. Je wil met je multimeter probe niet uitschieten, want dan ga je heel snel kortsluitingen (mogelijk met onmiddellijke rookhinder) veroorzaken.
Dit kan in principe allemaal zonder de koeler. Maar hou misschien toch een ventilator op de GPU gericht...
Trek evt. boot media (SSD) uit zodat je kan diagnose doen zonder dat er een OS start.
Voelen doe je met je hand. We spreken over laagspanning, dus elektrocutie is vrijwel uitgesloten. Dergelijke voltages ga je hooguit voelen met je tong, maar dat lijkt me niet erg handig
- Zet je multimeter op DC voltagemeting tot 20V. Sluit de common/ground/zwart probe aan op ground op de grafische kaart. De bracket waar de monitor outputs in zitten, biedt veel plaats. Ik gebruik een probe met een krokodilklem, daarmee zit ground stevig vast.
- Opstarten maar. Het kan zijn dat je beeld op je monitor krijgt, maar laat dat niet teveel afleiden nu.
Voel aan de GPU die. Als die wat warm wordt: meestal al een eerste goed teken: dat betekent dat hij stroom krijgt. Voel af en toe terwijl je bezig bent. Als de die te warm wordt, schakel dan je voeding uit en laat even afkoelen. - Base voltages checken:
- Nabij de PCIE power connector moet je sowieso 12V hebben. Meet even voor en na de zekering.
- 3,3V moet je ook hebben, dat komt dus binnen via de PCIE slot. Meet op de zekering of op een condensator in die buurt. - Als de base voltages goed zijn, kan je de VRM’s meten. De verschillende VRM’s converteren de base voltages naar andere voltages. Deze meet je gemakkelijkst aan de inductoren (omdat die zo groot zijn).
- 5V wordt vaak geleverd door een eenvoudige voltage regulator, die lijkt op een grote transistor (maar is het dus niet). Op de input pin meet je 12V, op de output ping zou je 5V moeten meten. Nothing fancy.
- VCore wordt geleverd door de grootste VRM op de pcb. De GPU core heeft nu eenmaal meeste power nodig. Die VRM zal bestaan uit meerdere fases, dus meerdere buck converter circuits. Meestal één inductor per fase (maar er kunnen dus meer zijn). De fases zijn parallel met elkaar verbonden. Dus in principe zou je op meerdere punten hetzelfde voltage moeten meten. Voor VCore ligt het voltage meestal rond 1V.
- De VMem circuits liggen meestal in het verlengde van de VCore (niet altijd). Meestal 1 of 2 fases. Voltage zit meestal rond 1,35 – 1.5 V.
- Verder ga je wellicht nog een 1,2V (PEX, voor communicatie via PCI-Express) en 1,8V (Aux) circuit vinden. - De secundaire voltages worden aangestuurd. Ze komen dus in een bepaalde volgorde voor. Dat wil bijv. zeggen: als je geen 5V hebt, dan ga je waarschijnlijk ook geen 1,8V hebben. En met 1,8V worden diverse andere VRM’s aangestuurd. Dus dan ga je ook geen VCore, VMem en Aux/Pex voltages hebben.
Volgorde:
1. 5V
2. 1,8V
3. VCore
4. a. PEX
5. b. VMem - Ontbreekt één van deze voltages, dan ga je moeten uitzoeken hoe het komt. Je kan als eens voelen. Een MOSFET of voltage regulator mag wat warm worden. Zonder load (we zijn geen games aan het spelen) gaan die normaal niet doorbranden.
Voel je toch een component die erg warm wordt (as in: OUCH !), dan is die component bijna zeker defect. - Een VRM circuit zit iets complexer in elkaar dan een simpele voltage regulator. Een VRM moet een heel precies voltage kunnen aanhouden bij een hoog vermogen. In zo’n circuit zitten meer componenten en wordt er vaak meer warmte gegenereerd, dus grotere kans op een defect.
Een PWM controller stuurt een low side en een high side MOSFET aan. In feite worden de MOSFET’s heel snel (hoge frequentie) aan en uit geschakeld. Op die manier wordt de 12V input verlaagd naar bijv. 1V. Dat voltage wordt continu gemeten en de PWM controller stuurt constant de frequentie bij.
Dat output voltage (1V) is nog erg “ruw”. Mocht je de spanning met een oscilloscoop bekijken, ga je een lelijke sinus zien. Niet ideaal voor een GPU. Dus dat signaal wordt verder afgevlakt door een inductor en 1 of meer condensatoren (vaak grote en kleine samen). Het voltage dat je dan krijgt, is zeer “zuiver” (vlakke lijn op oscilloscoop).
Aan de Source van de low side MOSFET moet je uiteraard een input voltage meten, meestal 12V.
Aan de Source van de high side MOSFET meet je een lager voltage. Maar dat is gelijk aan het voltage van de Drain van de low side MOSFET (zie eerder).
Tenslotte moet er uiteraard ook een voltage meetbaar zijn aan de Drain van de high side MOSFET. Dat meet je gemakkelijkst aan de inductor. Dat zou dicht bij het voltage moeten zitten dat je verwacht van de respectievelijke component (dus bijv. 1V voor GPU, 1,35V voor Mem).
Misschien meet je ook iets aan de Gate van de MOSFET, want daar komt het signaal binnen dat de MOSFET aanstuurt. Maar dit is met een multimeter mogelijk lastig te weten, omdat het een signaal met hoge frequentie is.
Als de MOSFET geen signaal krijgt, dan schakelt hij gewoon niet. Probleem kan dus ook de PWM controller zijn. Die zit vaak in een heel kleine IC in de buurt van de MOSFET’s. Vaak stuurt één controller meerdere fasen aan. Ook hier ga je de datasheets moeten raadplegen. Je kan om te beginnen al zien of de controller zelf wel stroom krijgt (Vin). Is dat niet het geval, dan kan die uiteraard ook niet werken. Dan zit het probleem verderop. De werking van de controller zelf meten is zonder oscilloscoop lastig, zoals al gezegd (signaal naar Gate van MOSFET).