GPU Repair Café

Wil je iets weten over de hardware van een computer? Draait je CPU fan niet meer? Je printer wil niet meer mee? Dan moet je hier zijn.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Hoe doe ik diagnose van defecte grafische kaart ?
Dit zijn zaken die ik opgestoken heb bij het bekijken van tientallen GPU repair video's op Youtube. Mocht hier onzin tussen staan, verbeter mij dan aub. Want ik ben absoluut geen specialist.

1. Koude diagnose:
een vermoedelijke defecte kaart steek ik niet direct in een PC. Eerst wat testen:
  • Kaart uit elkaar halen en reinigen. Ik begin met de warmtegeleidende pasta op de GPU. Vaak is die vanonder de GPU geperst en ligt op andere componenten. De samenstelling is onbekend, dus wie weet is die pasta wel geleidend. Dat wil je natuurlijk niet. Dus eerst goed opkuisen: wat Isopropyl Alcohol (IPA) en een zachte tandenborstel of een (iets hardere) penseelborstel doe wonderen. Let goed op dat je de componenten niet beschadigt naast de die !
    Voor de rest wordt de kaart goed ontstoft, hardnekkig vuil ook met IPA verwijderd. Keukendoekje of voor de moeilijk bereikbare plaatsen een oorstokje.
    De heatpads van memory en soms mosfets blijven meestal aan de koeler hangen. Als die nog redelijk zijn, laat ik ze.
    Dit is ook het ideale moment om de koeler te reinigen, want vaak zit die vol stof. Compressor to the rescue.
    tip: vijsjes goed bijhouden !
  • Nu de kaart proper is, is ze ook gemakkelijker visueel te inspecteren. Zichtbare beschadigingen (doorgebrande component, component die gewoon weg is) zijn natuurlijk de meest voor de hand liggende indicatoren.
    Omdat smd componenten zeer klein kunnen zijn (soms niet groter dan 1 op 0.5 mm) kan een vergrootglas handig zijn).
    Let op, het is niet omdat solder pads leeg zijn, dat er per se een component ontbreekt. De pcb's worden vaak voor meerdere reeksen kaarten gemaakt, soms zijn de componenten er, soms niet. Dus je moet eerder letten op solder pads waar duidelijk iets van afgebroken is. Soldeersel is daar vaak minder glanzend dan een solder pad met soldeersel waar geen component op zit.
  • Tijd om de multimeter erbij te halen. Eerst meten of er geen kortsluiting (short) is tussen ground en de voltage rails. Een short wijst bijna zeker op een defecte component. Als je zo'n kaart in je PC steekt en aanlegt, dan kan er nog meer kapot gaan op de kaart of misschien zelfs je moederbord of voeding.
    In dezelfde beweging kan je ineens de weerstand meten tussen ground en de voltage rails. In feite meet je dus de weerstand doorheen de belangrijke componenten zoals GPU en memory. Er moet weerstand zijn (>0 ohm). Weerstand over de GPU is erg klein, dus let erop dat je dit niet met een short verwart.
    Welke voltage rails (of VRM's, voltage regulator modules) zijn er zoal ?
    - VCore (stroomvoorziening GPU)
    - VMem (stroomvoorziening memory)
    - meestal minstens 2 secundaire (Aux), om bijv. BIOS, sturing IC's en display outputs van stroom te voorzien
  • Als je zekeringen herkent, kan je die gemakkelijk meten. In principe moeten die 0 weerstand hebben, in beide richtingen. Grote weerstand of helemaal geen continuïteit wijst op een doorgebrande zekering.
    Soms worden in de plaats van zekeringen zogenaamde nul-weerstanden gebruikt, soms smd inductoren. Zelfde principe.
    Je vindt meestal een zekering nabij de PCIE power connector, daar komt 12V binnen. En meestal een tweede nabij de PCIE slot (stukje dichtst bij de monitoruitgangen), daar komt zowel 12V als 3,3V binnen.
  • Nog iets dat je heel gemakkelijk kan meten, zijn de grote vierkante of rechthoekige inductoren of chokes. Net als de zekeringen, moeten die 0 weerstand hebben. Logisch, want het zijn gewoon koperspoelen.
  • Zijn er diodes te herkennen, meet die dan ook ineens. Een diode moet in één richting bijna geen weerstand hebben, in de andere richting mag die geen continuïteit hebben (of toch zeker een heel grote weerstand)
  • Je kan wat metingen doen op de condensatoren (zowel de grotere als de smd). 90% van de condensatoren hangt met één kant aan ground. Een condensator die met 2 poten ground meet, kan een indicatie zijn op een defect. Zeker weet je het echter niet omdat ze in een circuit zitten. Dus om zeker te weten, zou je ze moeten lossolderen. Niet zo handig, want er zijn er vaak tientallen.
    Omdat er geen lijn in zit, moet je kijken of er een patroon is. Condensatoren die allemaal lijken hetzelfde te doen (allemaal op één rij) gedragen zich ook meestal hetzelfde.
  • MOSFET's meten. Hiervoor ga je al het type moeten opzoeken. Staat gedrukt op de MOSFET, maar is soms moeilijk te lezen: MOSFET's worden warm, waardoor de opdruk wat wegbakt. Goed reinigen met IPA en dan schuin tegen het licht houden kan helpen. Als je het type weet, zoek je de datasheet op. Je moet weten welk type MOSFET het is en waar elk contact voor dient, anders heeft meten weinig zin. Enkele tips hoe je kan meten hier.
    Maar hou er ook hier rekening mee dat de MOSFET's in een circuit zitten. Op grafische kaarten bijna altijd in een buck converter circuit dat aangestuurd wordt door een aparte IC. Per circuit (fase) vind je daarom meestal minimum 2 MOSFET's (high side en low side). Maar het kunnen er ook meer zijn (in parallel, meer MOSFET's is meer power).
    De Drain van de low side MOSFET is altijd verbonden (= geen weerstand) met de Source van de high side MOSFET.

Als de koude diagnose niet direct fundamentele problemen aantoont, dan is het tijd om het "spannend" te maken...

1. "Hot" diagnose:
Concreet: Grafische kaart in moederbord steken, PCIE power aansluiten, monitor output in.
Met uitzondering van de GPU en geheugen (en wat kleinere zaken), dienen de meeste componenten op een grafische kaart simpelweg voor stroomvoorziening. Als je geen goeie stroomvoorziening hebt, dan gaat het nooit werken. Ik schat dat 80% van de defecten gewoon problemen met de stroomvoorziening zijn.
We gaan in deze stap voelen en meten aan de kaart terwijl ze onder spanning staat. Aangezien de contacten allemaal erg dicht staan, moet je ook heel precies kunnen werken. Een krappe behuizing is dus niet handig. Beter is een vrije test rig.
Een vaste hand is essentieel. Je wil met je multimeter probe niet uitschieten, want dan ga je heel snel kortsluitingen (mogelijk met onmiddellijke rookhinder) veroorzaken.
Dit kan in principe allemaal zonder de koeler. Maar hou misschien toch een ventilator op de GPU gericht...
Trek evt. boot media (SSD) uit zodat je kan diagnose doen zonder dat er een OS start.
Voelen doe je met je hand. We spreken over laagspanning, dus elektrocutie is vrijwel uitgesloten. Dergelijke voltages ga je hooguit voelen met je tong, maar dat lijkt me niet erg handig :-)
  • Zet je multimeter op DC voltagemeting tot 20V. Sluit de common/ground/zwart probe aan op ground op de grafische kaart. De bracket waar de monitor outputs in zitten, biedt veel plaats. Ik gebruik een probe met een krokodilklem, daarmee zit ground stevig vast.
  • Opstarten maar. Het kan zijn dat je beeld op je monitor krijgt, maar laat dat niet teveel afleiden nu.
    Voel aan de GPU die. Als die wat warm wordt: meestal al een eerste goed teken: dat betekent dat hij stroom krijgt. Voel af en toe terwijl je bezig bent. Als de die te warm wordt, schakel dan je voeding uit en laat even afkoelen.
  • Base voltages checken:
    - Nabij de PCIE power connector moet je sowieso 12V hebben. Meet even voor en na de zekering.
    - 3,3V moet je ook hebben, dat komt dus binnen via de PCIE slot. Meet op de zekering of op een condensator in die buurt.
  • Als de base voltages goed zijn, kan je de VRM’s meten. De verschillende VRM’s converteren de base voltages naar andere voltages. Deze meet je gemakkelijkst aan de inductoren (omdat die zo groot zijn).
    - 5V wordt vaak geleverd door een eenvoudige voltage regulator, die lijkt op een grote transistor (maar is het dus niet). Op de input pin meet je 12V, op de output ping zou je 5V moeten meten. Nothing fancy.
    - VCore wordt geleverd door de grootste VRM op de pcb. De GPU core heeft nu eenmaal meeste power nodig. Die VRM zal bestaan uit meerdere fases, dus meerdere buck converter circuits. Meestal één inductor per fase (maar er kunnen dus meer zijn). De fases zijn parallel met elkaar verbonden. Dus in principe zou je op meerdere punten hetzelfde voltage moeten meten. Voor VCore ligt het voltage meestal rond 1V.
    - De VMem circuits liggen meestal in het verlengde van de VCore (niet altijd). Meestal 1 of 2 fases. Voltage zit meestal rond 1,35 – 1.5 V.
    - Verder ga je wellicht nog een 1,2V (PEX, voor communicatie via PCI-Express) en 1,8V (Aux) circuit vinden.
  • De secundaire voltages worden aangestuurd. Ze komen dus in een bepaalde volgorde voor. Dat wil bijv. zeggen: als je geen 5V hebt, dan ga je waarschijnlijk ook geen 1,8V hebben. En met 1,8V worden diverse andere VRM’s aangestuurd. Dus dan ga je ook geen VCore, VMem en Aux/Pex voltages hebben.
    Volgorde:
    1. 5V
    2. 1,8V
    3. VCore
    4. a. PEX
    5. b. VMem
  • Ontbreekt één van deze voltages, dan ga je moeten uitzoeken hoe het komt. Je kan als eens voelen. Een MOSFET of voltage regulator mag wat warm worden. Zonder load (we zijn geen games aan het spelen) gaan die normaal niet doorbranden.
    Voel je toch een component die erg warm wordt (as in: OUCH !), dan is die component bijna zeker defect.
  • Een VRM circuit zit iets complexer in elkaar dan een simpele voltage regulator. Een VRM moet een heel precies voltage kunnen aanhouden bij een hoog vermogen. In zo’n circuit zitten meer componenten en wordt er vaak meer warmte gegenereerd, dus grotere kans op een defect.
    Een PWM controller stuurt een low side en een high side MOSFET aan. In feite worden de MOSFET’s heel snel (hoge frequentie) aan en uit geschakeld. Op die manier wordt de 12V input verlaagd naar bijv. 1V. Dat voltage wordt continu gemeten en de PWM controller stuurt constant de frequentie bij.
    Dat output voltage (1V) is nog erg “ruw”. Mocht je de spanning met een oscilloscoop bekijken, ga je een lelijke sinus zien. Niet ideaal voor een GPU. Dus dat signaal wordt verder afgevlakt door een inductor en 1 of meer condensatoren (vaak grote en kleine samen). Het voltage dat je dan krijgt, is zeer “zuiver” (vlakke lijn op oscilloscoop).
    Aan de Source van de low side MOSFET moet je uiteraard een input voltage meten, meestal 12V.
    Aan de Source van de high side MOSFET meet je een lager voltage. Maar dat is gelijk aan het voltage van de Drain van de low side MOSFET (zie eerder).
    Tenslotte moet er uiteraard ook een voltage meetbaar zijn aan de Drain van de high side MOSFET. Dat meet je gemakkelijkst aan de inductor. Dat zou dicht bij het voltage moeten zitten dat je verwacht van de respectievelijke component (dus bijv. 1V voor GPU, 1,35V voor Mem).
    Misschien meet je ook iets aan de Gate van de MOSFET, want daar komt het signaal binnen dat de MOSFET aanstuurt. Maar dit is met een multimeter mogelijk lastig te weten, omdat het een signaal met hoge frequentie is.
    Als de MOSFET geen signaal krijgt, dan schakelt hij gewoon niet. Probleem kan dus ook de PWM controller zijn. Die zit vaak in een heel kleine IC in de buurt van de MOSFET’s. Vaak stuurt één controller meerdere fasen aan. Ook hier ga je de datasheets moeten raadplegen. Je kan om te beginnen al zien of de controller zelf wel stroom krijgt (Vin). Is dat niet het geval, dan kan die uiteraard ook niet werken. Dan zit het probleem verderop. De werking van de controller zelf meten is zonder oscilloscoop lastig, zoals al gezegd (signaal naar Gate van MOSFET).
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

***reserved***
Ernie
Elite Poster
Elite Poster
Berichten: 838
Lid geworden op: 08 jun 2011, 06:35
Uitgedeelde bedankjes: 228 keer
Bedankt: 45 keer

Kudos!
Gelukkig & gezond 2022!
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

De GTX 970 van @Marsmillo (https://userbase.be/forum/viewtopic.php ... ad#p878378):

Een heel nette ASUS GTX 970 4GB Strix kaart. Strix, dus dat zouden kwalitatieve componenten moeten zijn. Je ziet dat Marsmillo goed voor de kaart gezorgd heeft: uiterlijk in perfecte staat, nauwelijks stof :thumbs:

Koude metingen duiden niet direct op een probleem. Ok, van bepaalde MOSFET's verschilt de Drain-Source weerstand van andere (zelfs binnen dezelfde fase), maar dat hoeft nog niet per se op een probleem te wijzen. Voor de rest dus geen shorts en vrij normale weerstanden over alle rails...

Dan maar inpluggen. PC start op (altijd een goed teken). Er is zelfs even beeld, maar na enkele seconden valt het weg. GPU wordt warm, ook een goed teken.
Valt op dat de voltages net na start er ongeveer allemaal zijn. Voltages vallen bijna allemaal weg op hetzelfde moment dat beeld uitvalt. Duidelijk een probleem met de basisstroomvoorziening dus.

Even aan de kaart voelen. MOSFET's vrij normaal (maar aangezien ze uitvallen na enkele seconden, is dat geen goeie indicatie).
En dan OUCH!, bijna vingers verbrand aan een TO-252 component ! Can't be right.
(TO-252 is een type aanduiding van een "verpakking" van een component, bijv. https://www.tomsonelectronics.com/blogs ... ns-details )

Markering is AS7805A. Datasheet. Het is de 5V voltage regulator.
Nog even output voltage gemeten: zit ruim onder 5V. Waarschijnlijk wordt die te warm en verliest zijn werking. Best vervangen dus. Spare part is besteld.


edit:
Afbeelding

Het is de voltage regulator links onder, gemarkeerd met een geel streepje.




De GTX 770 van @Marsmillo
(https://userbase.be/forum/viewtopic.php ... ad#p878378):

Ook dat is een nette kaart. Eveneens een ASUS, maar dus een GTX 770 OC 2GB.

Om een idee te geven hoeveel thermal paste fabrikanten vaak op de die doen:
Afbeelding
Wellicht 3x zoveel als nodig is voor goeie heat transfer...

Visuele inspectie: Op de achterkant zie je dat er wat stof plakt op een plaats waar wat vocht lijkt te zitten.
Afbeelding
Dat is op de achterkant van de VCore en VMem VRM's. En ook de MOSFET's zijn vochtig. In de gaten houden dus... Kan echter ook gewoon wat vocht van de thermal pad zijn die tussen de memory chips en de koeler zit...

Koude metingen tonen niets abnormaals.

Ingeplugd. Kaart geeft zowaar beeld. Maar het beeld lijkt ingezoomd en verschoven. En die verschuiving verspringt af en toe.
Zou me niet verwonderen dat Windows deze kaart correct detecteert. Maar als ik me goed herinner zei Marsmillo dat de PC crashte van zodra er een driver geïnstalleerd werd.

Het eerste dat ik ga doen is kijken of het probleem opgelost is (of de symptomen veranderen) na een BIOS flash. Hiervoor wacht ik nog op levering van deze programmer.
Als dat het probleem niet oplost, dan ga ik de kaart gewoon eerst reflowen (sjiek woord voor enkele minuten in de oven bakken ;-) )



edit, omdat dubbelposten niet kan... :roll: Totaal niet handig omdat ik dan constant deze zelfde post moet editen. @meon ? ;-)

een R9 280X gekocht op marktplaats.nl:

Deze is een Sapphire Radeon R9 280X 3GB Dual-X. Je zag dat deze kaart al wat had afgezien. Erg veel stof, tot in de diepste hoekjes op de kaart.

Eens goed gekuist, geen zichtbare gebreken vastgesteld. Cold metingen allemaal goed. Ingeplugd zijn alle normale voltages aanwezig, maar geen display output. Met monitor op de onboard aangesloten, bootte de PC wel. En Windows herkende zelfs de R9.
Driver installeren en lo and behold de kaart werkte en gaf output ! Zelfs wat stresstests gaven geen problemen.

Sommigen zouden het daarbij laten. Maar een kaart die geen output geeft zonder OS, vind ik toch niet helemaal correct werken. Je moet al wachten tot Windows geladen is, om beeld te hebben. Probeer dan maar eens in je BIOS settings iets te wijzigen. Maar ik had geen idee wat ik verder nog zou kunnen testen.

Een vriendelijke user op het eevblog.com forum wees me erop dat de kaart wel eens gebruikt kon zijn om te minen. Vaak wordt daarvoor een andere BIOS geflashed, waarvoor geen VESA VGA nodig is. Ik heb een aantal BIOS files van techpowerupgeprobeerd (met de tool AtiWinFlash), maar zonder resultaat.
Diezelfde user op eevblog gaf ook de raad om BIOS niet vanuit OS te flashen. Dat was trouwens voor mij de trigger om de BIOS flasher te bestellen.

Dus ook deze: wordt vervolgd.
Marsmillo
Plus Member
Plus Member
Berichten: 129
Lid geworden op: 16 jul 2009, 15:06
Uitgedeelde bedankjes: 13 keer
Bedankt: 10 keer

didi79 schreef:...
Wow, dat ziet er indrukwekkend uit. Leuk dat je er al mee bezig geweest bent en zo uitgebreid je bevindingen neerschrijft. Ik volg geboeid mee en leer ondertussen misschien ook weer iets bij. Maar door mijn gebrek aan kennis ziet het er wel allemaal ingewikkeld en zelfs stukje afschrikwekkend uit. Toch kan ik niet wachten wat de toekomst zal brengen.

Je bevindingen van de GTX970 kloppen met wat ik mij nog herinner van toen hij kapot ging. Dacht dat ik met wat vrienden online was. Mijn beeld viel weg maar de computer was niet vastgelopen. Ik kon hun nog horen, had enkel geen beeld. Bij de volgende herstarts ging het meestal oké voor een paar min, waarna terug geen beeld. Voor zover ik mij herinner (is al paar jaar terug) werkt er wel nog een ledje op het bord, de fan is wel uit (maar dat is een instelling dacht ik). Benieuwd of het AS7805A dingetje de boosdoener is, hoe het komt dat het kapot is en/of er nog andere problemen zijn. Wachten tot je volgende update.

Betreft de GTX770 heb ik even navraag gedaan. Maar er is geen water of ander vochtprobleempje geweest... Wat er op de achterkant te zien is, moet van iets anders komen. Ook wel benieuwd wat dat kan zijn. Mijn vriend gaf wel nog aan dat voor het doodgaan hij regelmatig spontane herstarts van het systeem geweest zijn. Toen ik zelf de kaart in mijn systeem stak, kreeg ik ook herstarts. Als ik al in windows kwam, was dat altijd maar van zeer korte duur, als er een fatal error kwam, was het altijd iets met de GPU driver. In het BIOS scherm van mijn moederbord of in Linux (via een live usb) ging het wel aardig, totdat er een zwaardere belasting van de GPU gevraagd werd. Ook hier ben ik benieuwd wat je verder stappen zijn. En of een bios flash helpt.

Keep us updated.
Je wakkert een interesse in elektronica bij mij aan die ik al jaren aan het negeren ben :)
*-*
SpecialK
Elite Poster
Elite Poster
Berichten: 1374
Lid geworden op: 22 mei 2013, 09:04
Uitgedeelde bedankjes: 3 keer
Bedankt: 105 keer

didi79 schreef: Markering is AS7805A. Datasheet. Het is de 5V voltage regulator.
Nog even output voltage gemeten: zit ruim onder 5V. Waarschijnlijk wordt die te warm en verliest zijn werking. Best vervangen dus. Spare part is besteld.
Dit strookt niet meteen met mijn ervaring; een spanningsregelaar werkt, of werkt niet. Als die gloeiend heet wordt betekent dat doorgaans dat die te zwaar belast wordt door een probleem verderop. Ik ben benieuwd wat er gebeurt als je die vervangt...
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Never too old, Marsmillo.

Eigenlijk zijn de bevindingen van een vorige eigenaar erg waardevol, besef ik nu. Ik heb al enkele andere kaartjes gehad van ebay, 2dehands, marktplaats, tweakers... maar zonder backstory weet je eigenlijk niet van waar ze komen.

Neem nu het - somewhat funny - verhaal van de 1080 waar de kat op gepist heeft van cyberbug. Zonder die info, is het gissen wat je in handen hebt en wat het probleem veroorzaakt zou kunnen hebben.


SpecialK schreef: Dit strookt niet meteen met mijn ervaring; een spanningsregelaar werkt, of werkt niet. Als die gloeiend heet wordt betekent dat doorgaans dat die te zwaar belast wordt door een probleem verderop. Ik ben benieuwd wat er gebeurt als je die vervangt...
Interessant. Maar als er geen 5V uit komt, dan werkt hij in mijn ogen niet. Veel belasting kan er niet op zitten, 5V wordt maar voor secundaire circuits gebruikt en de kaart doet eigenlijk nog helemaal niets.
Eigenlijk simel te testen: ik haal de regelaar eraf en zet hem in een breadboard - testcircuit zonder load. Als ik dan geen 5V meet aan de output, dan is hij voor mij defect. Maar dat zal niet meer voor vandaag zijn. Ik hou je op de hoogte.
edwin.d
Member
Member
Berichten: 87
Lid geworden op: 14 sep 2012, 23:15
Uitgedeelde bedankjes: 3 keer
Bedankt: 8 keer

Ik ben ook benieuwd.

Een spanningsregelaar die heet wordt werkt meestal wel.
Vaak zit er ook een temperatuursbeveiliging in en schakels deze de uitgang uit als die te warm wordt.
Maar je weet nooit,

Ik zou hem eerst getest hebben voor ik een nieuwe bestelde.

Trouwens componenten van een videokaart desolderen doe je niet zonder risico.

Als de print uit verschillende lagen bestaat kan je eventuele verbindingen in en van de lagen beschadigen en dan werkt er niets meer.

Controleer zeker tantaal condensatoren. Die durven wel eens in kortsluiting gaan.
Elco's die langs een koelplaat staan durven hun waarde ook nog al eens verliezen.

Mvg
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Geen echte update vandaag...

Volgende youtube channels zijn al erg leerrijk gebleken voor mij:
Eli Tech
Tech Cemeter
NorthridgeFix


Gisteren werd deze ATX testbench geleverd. Heb die dan maar ineens in elkaar gestoken.
Ondanks dat in de titel Mini ATX staat, is het wel degelijk een full size ATX. En op moment van bestelling stond die maar aan de helft van de prijs (€ 33).

Afbeelding
Afbeelding

mobo Asrock Z77 Extreme4 + Intel I5 3570K + cooler + 8GB DDR3 RAM recent voor een goeie prijs overgenomen op beyondgaming. Blijkt een zeer goeie test bed te zijn.
BIOS setup heeft een grafische weergave van bezetting slots, dus daarmee kan ik (met onboard video) al zien of een discrete GPU in de PCIE slot gedetecteerd wordt. Verder heeft het mobo een power knopje on board, handig om snel op te starten. En ook erg handig is het onboard display dat de boot (error) code weergeeft.

Voeding is een Coolermaster Masterwatt Lite 600W. Heb deze samen met nog een andere 600W voeding als "defect" voor een prijsje overgenomen van een tweaker. Defect was beschreven als extreme coil whine... heb er nog niets van gemerkt. Voedingen doen het beide perfect :D

Bootdisk is een oude Intel SSD van 80GB, voor het geval ik Windows nodig heb voor verdere tests (driver install, benchmark, stresstest). Maar tijdens het meten van voltages, gaat de SATA kabel eruit, want dan wil ik geen OS.

Ook nog op de foto zie je een PCIE riser kabel, in geval ik lastige metingen moet doen waardoor de kaart niet op het bord kan. En nog een gemakkelijk verplaatsbare fan om toch wat koeling te hebben op een "blote" grafische kaart.

Erg tevreden van bijn extreme budget test bench :banana:

On display op de bench de GTX 770 van Marsmillo ;-)
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

edwin.d schreef:Ik ben ook benieuwd.

Een spanningsregelaar die heet wordt werkt meestal wel.
SpecialK schreef: Dit strookt niet meteen met mijn ervaring; een spanningsregelaar werkt, of werkt niet. Als die gloeiend heet wordt betekent dat doorgaans dat die te zwaar belast wordt door een probleem verderop. Ik ben benieuwd wat er gebeurt als je die vervangt...
Heb hem toch maar vervangen. Maar jullie zouden wel eens gelijk kunnen hebben . De nieuwe regelaar gedraagt zich net als de andere: Bij opstart is er 5V out, maar dat voltage begint vrij snel te droppen. Tot voltage te laag valt, waardoor andere componenten uitvallen en beeld wegvalt.

De enige tantaal condensatoren op de pcb zijn 5 zitten ter hoogte van de GPU die, aan de andere kant van de pcb. Ik kan ze nog niet meten (andere multimeter met capacitance meting is onderweg). Maar zou me verwonderen dat deze de oorzaak zijn. Want de VCore en VMem VRM's doen het in principe en die zitten op de 12V input rail.

Dus, zoals je zei SpecialK, probleem zal verderop zijn. Volgende VRM is normaal de 1,8 V. Alleen heb ik die nog niet kunnen vinden. Ook niet zo simpel als voltage constant wegvalt :p

Suggesties welkom ! Foto's van de voor en achterkant van de pcb's kan je trouwens ook hier vinden https://www.techpowerup.com/gpu-specs/a ... i-oc.b3049 .
SpecialK
Elite Poster
Elite Poster
Berichten: 1374
Lid geworden op: 22 mei 2013, 09:04
Uitgedeelde bedankjes: 3 keer
Bedankt: 105 keer

Je moet geen capaciteitsmeter hebben om die condensatoren te testen. Zet uw multimeter op bv 20 kOhm en meet de "weerstand" over de condensator. Bij een goede condensator zal die weerstand laag beginnen en vrij snel oplopen. Hoe hoger de capaciteit van de condensator, hoe trager die oploopt.
Is die weerstand bijna 0, dan is de tantaalcondensator kapot.

En om elektrolytische condensatoren te meten heb je eigenlijk eerder een ESR-meter nodig dan een capaciteitsmeter. Want meestal is het probleem de inwendige weerstand die te hoog oploopt; dat gebeurt vroeger dan dat de capaciteit begint af te nemen.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Moet ze dan wel eerst desolderen natuurlijk.

De 4 input condensatoren (271µF 16V; type https://www.nichicon.co.jp/english/prod ... /e-rs8.pdf) die de VCore VRM voeden worden wel vrij warm. Input voltage dus 12V.
Ze worden duidelijk warmer dan andere condensatoren op de pcb. En ook warmer dan die op een andere graka. Misschien de moeite om deze eens eraf te halen om te meten?
Gebruikersavatar
tomw
Premium Member
Premium Member
Berichten: 573
Lid geworden op: 04 sep 2008, 13:32
Uitgedeelde bedankjes: 10 keer
Bedankt: 10 keer

Condensatoren horen niet echt warm te worden, maar kan ook het gevolg zijn van te grote stroom door de regulator. Een methode dat ik dikwijls toepas is voltage injection. Dus in dit geval met een lab voeding zelf 5V aanleveren op de uitgang van regulator en dan alles goed in het oog houden en met warmtecamera meten.
Een capaciteits meter heb je in dit geval inderdaad niet nodig.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Ik ga de GTX 970 even laten voor wat ze is, tot er inspiratie of suggesties komen.


Intussen een RX 570 van 2dehands onder handen genomen.
Het defect is vrij duidelijk, neem ik aan ?
Afbeelding
Afbeelding
Afbeelding

Ontplofte power stage in een fase van de Vcore VRM. Vrij dramatisch, want je ziet zelfs de sporen op de achterkant.
Dit heeft een kortsluiting veroorzaakt waardoor de zekering nabij de pcie stroomaansluiting doorgebrand is.

Zelfs na verwijderen van de power stage, blijft weerstand tussen ground en 12V input erg klein. We spreken over 0,4 ohm, voor zover je zo'n lage meting als nauwkeurig kan beschouwen. Nagenoeg 0 dus. Dit is een short door de pcb layers heen. Nagenoeg onmogelijk te herstellen.

Wellicht zou je die ene fase kunnen isoleren van de rest. Maar met maar 3 fasen voor VCore gaat dit vroeg of laat toch opnieuw problemen geven. Ik ga er niet aan beginnen. Die kaart zal dienen als donor voor andere herstellingen.



Nog eentje dan...
Een MSI GeForce GTX 780 Lightning

Heel nette kaart, duidelijk kwalitatieve componenten. Zeer zware koeler.
Afbeelding
Afbeelding
Stylo for scale

Metingen tonen geen defecten aan. Kaart start op, geeft beeld.
Wordt herkend in Windows, maar in device manager staat een uitroeptekentje: befaamde error 43 . Resolutie kan niet hoger van 1024x768.

Dan eerst even drivers helemaal herinstalleren. DDU om alle drivers volledig te verwijderen. Reboot en dan recente driver installeren met NVCleannstall. Nog altijd hetzelfde probleem. Deze keer wordt de kaart in GPU-z wel correct uitgelezen, wat eerder niet het geval was.

Ok, dus geen driver issue. Dan maar een professionele reflow doen... in de oven. 10 minutjes op 210°C en cake GPU is klaar. Terwijl die afkoelt, cooler gereinigd.
Alles terug in elkaar gestoken (met verse thermal compound uiteraard). En dan nog eens testen.
Probleem blijft exact hetzelfde !? :?

Dan nog maar eens de cycle DDU en driver install. Geen verschil. Wat gegoogled naar mogelijke oorzaken. Ergens gelezen dat je de kaart eens moet disablen in device manager, reboot en enable. :think: Geloof het of niet: maar dat het hem: beeldscherm gaat onmiddellijk naar native resolutie, error code in device manager weg !! Whodathunk!!

Meerdere keren gereboot, kaart blijft perfect werken. De laatste uren allerlei stress tests en benchmarks (Furmark, Heaven, Superposition, GpuMemTest) op losgelaten. Kaart doet het perfect !

Afbeelding
Niet slecht voor een kaart die 8 jaar geleden uitkwam.

Ok rare, maar uiteindelijk dus een easy fix. Beetje jammer dat er hardwarematig niet meer aan was, maar goed. Ik beschouw de kaart als in orde.

Nog een leuke feature: Lightning logo verandert van kleur naarmate GPU meer belast wordt: groen = eco, rood is zware belasting. Verder zie je aan de achterkant LEDs die weergeven welke VRM's actief zijn. Die worden dus dynamisch ingeschakeld indien nodig:
Afbeelding
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Even terug naar de GTX 970: voor VCore zijn er 6 fasen
Afbeelding

Op 2 van de 6 low side MOSFETs meet ik een erg lage weerstand tussen Source en Gate. 0,5 en 2,2 Ω.
Op de andere 4 meet ik 12 kΩ.

Dus op die 2 is dat nagenoeg niets, wat kan wijzen op een defecte MOSFET. Ze zitten wel nog op de pcb...

Is het de moeite om die er eens van te halen om te zien of er iets verandert ?
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

didi79 schreef:Even terug naar de GTX 970: voor VCore zijn er 6 fasen
Afbeelding

Op 2 van de 6 high side MOSFETs meet ik een erg lage weerstand tussen Source en Gate. 0,5 en 2,2 Ω.
Op de andere 4 meet ik 12 kΩ.

Dus op die 2 is dat nagenoeg niets, wat kan wijzen op een defecte MOSFET. Ze zitten wel nog op de pcb...

Is het de moeite om die er eens van te halen om te zien of er iets verandert ?
Als ik er verder over nadenk doet het er op dit moment niet toe: PWM controller (multi phase buck controller ASP1212) verliest zijn input voltage (3.3V). Normaal komt 3.3V rechtstreeks van de pcie slot. Dus ergens tussenin zit een schakeling die 3.3V schakelt op basis van 5V. Als out voltage van de 5V regulator te laag dropt, dus ook geen 3.3V meer. (zelfde gedrag trouwens op een LDO die normaal 0.8V levert).

Dus dat VCore uitvalt is gewoon een gevolg daarvan.

Dus iets haalt het voltage van de 5V naar omlaag naarmate die "iets" het warmer krijgt. Op de tast niet direct iets gevonden en ook de methode met alcohol (laag kookpunt, dus waar het warm is, verdampt de alcohol sneller) toont geen duidelijke boosdoener aan.

Warmtebeeldcamera gaat nog de enige optie zijn, maar heb ik dus niet...



edit: Did some more digging around

Even prentje ter illustratie:
Afbeelding

Bovenste 12V inductor: spanning komt van de PCIE power plug.
onderste 12V inductor: spanning komt van PCIE slot. De 5V spanningsregelaar is daarop aangesloten.

Tussen de aparte rails en ground geen shorts. MAAR blijkbaar erg lage weerstand tussen 5V output en bovenste 12V inductor !! Ik weet niet of men dat ook een kortsluiting noemt ?

Welke componenten hebben zowel 5V als 12V nodig ? De MOSFET drivers. Dat zijn die kleine vierkantjes naast de MOSFETs (datasheet). Dat zijn in feite dubbele, dus ze bedienen elk 2 fasen.

Drivers 5V op VCC. VDRV pin verwacht "a separate supply voltage between 4.0V and 13.2V to vary the drive voltage on both the high side and low side MOSFET’s". Dus most likely 12V, want de MOSFET's zitten op de 12V rail.
En ja hoor, op de bovenste 2 drivers is de weerstand tussen VCC en VDRV bijna 0. M.a.w. hier ontmoet 5V 12V ... Op de onderste driver spreken we over een acceptabele 2.1 kΩ.

Dat verklaart
1. raar gedrag van de 5V regulator
2. afwijkende weerstand op (van boven naar onder) op de 1e en de 4de high side MOSFET.

Als ik de tijd vind, ga ik de verdachte drivers eens weghalen...



edit 2:

Yes yes yes :-D

Afbeelding

Op de voorgrond: De GTX 970 van Marsmillo, met 2 drivers en 2 MOSFET's minder.
Op de achtergrond Windows met een herkende kaart, geïnstalleerde driver en GPU-Z die alles correct weergeeft.

De kaart draait nu dus op maar 2 van de 6 VCore fasen. Absoluut onvoldoende voor enige load natuurlijk. Maar toch een eerste echte succes, doet deugd !

Nu heel die kaart heropbouwen zodat ze weer volle bak kan draaien. Dus nu eerst de nodige stukken bestellen.
Marsmillo
Plus Member
Plus Member
Berichten: 129
Lid geworden op: 16 jul 2009, 15:06
Uitgedeelde bedankjes: 13 keer
Bedankt: 10 keer

Wow. Niet gedacht dat deze nog leven in ging zitten. Benieuwd of je die ook terug fullforce weekend krijgt.
*-*
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

MSI GTX 1080 Ti Gaming X 11G van @cyberbug

Kaart heeft toch wat afgezien (niet verwonderlijk als je de geschiedenis kent ;) ). Nabij de monitoruitgangen wat corrosie op de pcb. Enkele minieme smd componenten (maat 1005) vielen er gewoon af bij het reinigen, gewoon door corrosie op de solder pads... Maar goed, die paar stukken gaan het verschil niet maken, hooguit een poort die niet helemaal gaat werken. Maar zover zijn we nog niet.

Geen obvious shorts.
Voltages: 5V is er, 1,8V is er. GPU VCore is er niet en omdat die er niet is, ook geen VMem en PEX (1V). Die volgorde van opstarten wordt trouwens af en toe vermeld door de kerel van Tech Cemetry.

Geen zichtbare of meetbare gebreken op de MOSFETs en drivers (ook al zat er een beetje corrosie op enkele pinnetjes van een driver). Maar de drivers krijgen waarschijnlijk geen PWM signaal van de controller (NCP81274).
PGOOD pin van de controller blijft low, wat volgens mij betekent dat een bepaald voltage niet gehaald wordt. Dat voltage wordt bepaald door een andere PWM controller, die heb ik nog niet gevonden. De NCP81274 krijgt wel 5V op VCC en 1.8V op EN (enable).

Dit wordt opnieuw een lastige...
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Ik was blijkbaar fout met het voltage dat in de NCP81274 bepaald wordt door een PWM signaal: Ten eerste omdat er in de buurt geen component zit die een PWM signaal genereert. Zou niet logisch zijn dat dat signaal van de andere kant van de kaart komt (anders geen zuiver signaal). Ten tweede omdat er op de PWM_VID gewoon niets aangesloten is :bang:

Maar ik ben er wel vrij zeker van dat ik in de buurt van de NCP81274 moet zoeken.
Die chip zelf vervangen, doe ik alleen als ik 100% zeker ben dat die defect is. Want dat is een QFN40 package: dus 40 pinnen, voor een chip van maar 5,3 x 5,3 mm! Elke pin is maar een kwart mm breed en de afstand tussen de pinnen is maar 0,15 mm ! Zo fijn heb ik nog niet gesoldeerd (is weliswaar met een hot air station, maar toch).

Anderzijds vermoed ik wel dat de chip werkt, want hij stuurt wel degelijk een 2V signaal uit op alle PWM pins naar de fasen (wat overeenkomt met de datasheet). Ik weet alleen niet of het een PWM signaal is, want een oscilloscoop heb ik niet. Mijn redenering waarom de PGOOD (power good signaal) dan niet goed is: omdat er geen voltages terugkomen van de buck converter. Die heeft de controller nodig om bij te sturen !

En zo komen we terug bij de MOSFET drivers. (datasheet, niet 100% zeker dat het deze is, maar wel zeker van de pins en werking). Eigenlijk dezelfde component die faalde op de GTX 970, wel een ander type (bij de 970 waren het dual drivers).
Driver moet het PWM signaal ontvangen en omzetten in snel in en uitschakelen van low en high side MOSFETs.

Moeting op de pcb toont geen duidelijke fout aan. Dus zit er niets anders op dan de 8 drivers één voor één verwijderen en tussendoor kijken of iets verandert. Maar dat zal voor een volgende hobby-avond zijn :-)
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Kleine update ivm de GTX 770: BIOS flasher is er. BIOS van de 770 blijkt toch ok te zijn.
Dus ook die kaart heeft ook nog verdere "multimeter stabbing" nodig om iets abnormaals te vinden.

En ook een kleine update over de GTX 1080 Ti: Ik ben nu vrij zeker dat een MOSFET driver niet goed werkt. Trouwens die waar corrosie op zat. Weerstand op bootstrap circuit is veel lager dan bij de andere drivers. Dus ik ga (vermoedelijk in 't weekend) beginnen met die driver er eens van te halen.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

GTX 970: Ik heb beslist de VCore VRMs helemaal opnieuw op te bouwen. Waarom ?
  1. Totaal onmogelijk te weten welke fase het doet en welke niet
  2. MOSFETs die af fabriek gesoldeerd zijn, zijn erg moeilijk te verwijderen. Met als gevolg dat ongeveer de helft breekt bij het eraf halen.
    Eens eraf, heb ik dat probleem niet meer. Dan kan ik zonder problemen meermaals een MOSFET ervan halen en terugplaatsen. Dus dat maakt het makkelijker werken ook.
  3. Het type MOSFETs (QM3054M6 en QM3056M6) blijkt wat moeilijker te vinden. Daarom dat ik voor een ander type ga (vergelijkbaar qua specs), zelfde voor low en high side. Ok die QM MOSFETs zijn wél te vinden op Aliexpress, maar welke qualiteit ?? En wellicht ook lang onderweg. Voorlopig koop ik mijn componenten bij mouser.be. Wordt geleverd uit de US, maar 4 dagen later heb ik ze. En voor orders boven €50 gratis verzending.
SpecialK
Elite Poster
Elite Poster
Berichten: 1374
Lid geworden op: 22 mei 2013, 09:04
Uitgedeelde bedankjes: 3 keer
Bedankt: 105 keer

Waarschijnlijk gebruik je die techniek al, maar als componenten moeilijk los te solderen zijn helpt het vaak om er een hoop extra "hobby" tin aan toe te voegen, en ze dus bij wijze van spreken nog vaster te solderen.
In productie gebruikt men ROHS tin die geen lood bevat en daardoor een veel hoger smeltpunt heeft dan de 60/40 "hobby" tin.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

SpecialK schreef:Waarschijnlijk gebruik je die techniek al, maar als componenten moeilijk los te solderen zijn helpt het vaak om er een hoop extra "hobby" tin aan toe te voegen, en ze dus bij wijze van spreken nog vaster te solderen.
In productie gebruikt men ROHS tin die geen lood bevat en daardoor een veel hoger smeltpunt heeft dan de 60/40 "hobby" tin.
Idd doe ik al, met wisselend succes echter. MOSFETs hebben vaak en groot contactoppervlak met de pcb op één van de terminals om ook op die manier warmte kwijt te kunnen. Dus 2 metalen vlakken op elkaar met een kleine hoeveelheid soldeertin tussen. Om die los te krijgen moet je pcb op die plaats dus bijna even warm worden. Maar ik vermoed dat ze in de fabriek ook een kleefstof toevoegen (op veel kaarten komt er vanonder de MOSFETs een bruin goedje).
Laatst nog een tip tegengekomen: terwijl je aan het warmen bent met een heel scherp mesje eronder proberen te komen. Minste gaatje en dan kan de flux eronder en dan zou het snel moeten gaan. Zal dat eens proberen.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Vandaag even een andere kaart onder handen genomen. Een Gainward GTX 970 Phantom. Heb deze ruim een maand geleden op ebay op de kop getikt.
Diagnose was al eerder gebeurd: Doorgebrande zekering als gevolg van defecte VCore power stage (datasheet). Ook vermoeden van een defecte MOSFET voor de VMem.
Afbeelding

Vorige week waren de vervangstukken binnengekomen. Vandaag alles vervangen. En kaart blijkt terug in orde.
Bij belasting wel wat coil whine ! WTF ! Maar blijkbaar is dit een veelvoorkomend fenomeen bij diverse GTX 970 kaarten... Bij belasting overstemt het geluid van de ventilatoren de coil whine dus cava.
Vanavond al een paar uren aan het stress testen, so far so good. Morgen nog wat andere stress tests op loslaten voor de zekerheid.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

didi79 schreef:En ook een kleine update over de GTX 1080 Ti: Ik ben nu vrij zeker dat een MOSFET driver niet goed werkt. Trouwens die waar corrosie op zat. Weerstand op bootstrap circuit is veel lager dan bij de andere drivers. Dus ik ga (vermoedelijk in 't weekend) beginnen met die driver er eens van te halen.
Ook nog in 't weekend die driver verwijderd. En de kaart startte inderdaad ook op en werd in Windows herkend, dus daarmee zat ik wel goed. Maar bij de minste load crashte de kaart. En na enkele reboots deed ze niets meer. Nu heb ik terug een short. Dus er is meer aan de hand. Zal verdere diagnose uitstellen tot ik mijn oscilloscoop heb.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Nog een paar dagen verder gestresst: die GTX 970 Phantom is rocksolid. Coil whine is zelfs wat verminderd. Misschien had die kaart er wel deugd van om eens goed warm te krijgen. En warm wordt ze ! Na een uur volle bak kan je op de koelvinnen en het metalen frame een eitje bakken. Wat ik echter toch niet in het echt zou proberen ;-)

Repair cost:
power stage: € 2,9
MOSFET: € 0,8
zekering: € 1

Dus alles samen zelfs geen € 5 en een beetje geduld :beerchug:
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Goztow's MSI HD 7970 Lightning:

Zoals hij zei, eigenlijk niet veel aan. Kaart werkt gewoon. Maar onder stress komen er artifacts.
Artifacts wijzen volgens mij op GPU of memory die slecht werken of te warm worden. Ik zet mijn geld in op het laatste.

Eerst even gegoogled om te zien of artifacts een gekend fenomeen zijn bij die kaart. Zo kwam ik toevallig bij deze video uit: . Hierin wordt in het eerste deel van de video gezegd dat deze Lightning eigenlijk een fors opgevoerde versie is van eerdere kaarten van MSI. Zowel GPU en memory zijn af fabriek redelijk ferm overclocked. En vaak hoort bij een stabiele overclock een hoger voltage. Hogere frequentie + hoger voltage = meer warmte.

Bij het demonteren van de kaart blijkt dat bijna alle belangrijke componenten afgedekt zijn door één doorlopende heatsink. Bijna alle: één enkele memory chip staat eenzaam tussen GPU en PCIE slot en is niet bedekt. Zo helemaal "onderaan" de kaart, dicht tegen het moederbord is er volgens mij eerder weinig airflow... Zou die chip te warm worden ?!

Tijd voor een ghetto mod !

Afbeelding

Ik vond nog een klein heatsinkje op zolder van in de tijd toen custom coolers voor grafische kaarten nog een ding waren (ja, zo oud ben ik en nee, ik gooi niet snel wat weg). Beetje op maat gezaagd en nog wat materiaal weggehaald voor een uitstekende (as in: sticking out) heatpipe. Eropgeplakt met de bij de heatsinks meegeleverde hittebestendige dubbelzijdige 3M tape.

De eerste testen zijn positief. Voorlopig geen artifacts meer gezien. Eén enkele keer meldde Windows mij een driver lockup (maar geen crash, driver werd gewoon netjes herstart), maar dat kan komen omdat ik tijdens een Furmark sessie ook nog eens gelijktijdig een GpuMemTest liet draaien.

Dit lijkt dus eigenlijk gewoon een ontwerpfout te zijn. Maar om zeker te zijn, ga ik de komende dagen nog wat stresstest doen.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Diagnose op de EVGA GTX1080 FTW3 van OpThaCop:

Duidelijke short to ground op de rechtse PCIE power connector. Het is dus NIET veilig om er direct spanning op te zetten.
Afbeelding

Geen short op andere 12V of 3.3V base powers, dus dat is op zich wel goed nieuws.

Hoe weet ik nu waar het probleem is ?
Verder meten. Zie afbeelding:
Afbeelding
  • short zit dus op de PCIE power connector marked X.
    Je wil weten wat daar allemaal op aangesloten is.
  • Welke zaken kom je meestal als eerste tegen op een power rail ?
    Zekeringen om te ... zekeren
    Inductors/coils/spoelen om de inkomende stroom te kalmeren
    Condensatoren, eveneens om pieken af te vlakken

    Dus we meten gewoon waar we dezelfde short to ground vinden:
  • Weerstand 1 dient in feite als zekering. Heeft een lage weerstand, maar is vrij groot (want er moeten veel amperekes door). Op beide contacten van de weerstand meet ik ongeveer dezelfde hoge weerstand. Dat wil zeggen: 1. de zekering/weerstand is niet doorgebrand en 2. hier zit niet de short.
    En gezien de nabijheid vermoed ik dat inductor 3 rechtstreeks verbonden is met weerstand 1. Ongeveer dezelfde meting ook langs beide kanten op de inductor. Dus die 12V rail kunnen we uitsluiten.
  • Weerstand 2: langs beide kanten short to ground. En ook op inductor 4.
    Dat betekent eigenlijk dat de zekering intact is. Maar belangrijker: onze short zit zeker in deze 12V rail.
    En dan meten we even verder, we gaan gewoon alle VRM's af die we tegenkomen. Simpelste is gewoon telkens meten op inductors.
  • Je ziet enkele losstaande inductors: hier geen shorts, dus die zitten op een goeie rail.
  • We zien een lange rij inductors. Dat zijn niet allemaal dezelfde: de bovenste 2 hebben een markering R33, al de andere R22. En ook zie je dat de MOSFETs naast de bovenste 2 anders zijn dan de rest. Kans is groot dat de bovenste de VMem VRM is. En de rest is allemaal VCore.

    Meten we op een inductor van VMem: geen short. Weerstand van ongeveer 70Ω over de memory chips is vrij normaal (kan verschillen per merk van geheugen, bijv. Samsung DDR5 is vaak nog lager, rond de 20Ω).

    Alle inductors van VCore zijn met elkaar verbonden, dus doet er niet toe op welke we meten en jawel: 0Ω (de 0,2Ω op eerdere foto is de weerstand van mijn probes).
Dus we weten waar we moeten zoeken. Volgende stap is datasheets opzoeken van controller (op achterkant van de kaart in dit geval), drivers (kleine vierkante ICs) en power stages.
Het zijn power stages, want slechts één IC per inductor. En elke IC heeft veel meer pins dan de gemiddelde MOSFET. En een normale VRM heeft minstens één low side en minstens één high side MOSFET. Een power stage is niet meer dan in één package (soms nog met extra controle circuits).

Met de datasheets in de hand, weet je op welke punten je moet meten.


Power stage (datasheet) is maar 6 x 4 mm groot
Zelfs met mijn fijne multimeter probes, geraak ik maar moeilijk aan de pinnen. Dus even de budget usb microscoop erbij halen:
Afbeelding

Bedoeling is om te zien of er een lijntje (trace) loopt van een pin naar een andere component in de buurt. Want meten op een smd condensator of weerstand is echt wel gemakkelijker.
Soms zie je een lijntje stoppen in een circeltje: dat is een zogenaamde via. Die verbindt het lijntje met een andere laag of achterkant van de pcb

To be continued...
Gebruikersavatar
tomw
Premium Member
Premium Member
Berichten: 573
Lid geworden op: 04 sep 2008, 13:32
Uitgedeelde bedankjes: 10 keer
Bedankt: 10 keer

Leuk om deze updates te lezen. Is altijd leerrijk.
Ikzelf herstel graag TV toestellen, maar vind maar moeilijk toestellen om aan te werken helaas..
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Ik beschouw Goztow's MSI HD 7970 Lightning als hersteld: Uren furmark zonder problemen. GPU werd nooit warmer dan 80°C en fan zelfs nooit op 100%.
Af en toe gaat de GPU frequentie van 1150 naar 1070 MHz, wellicht is dat om de temperatuur onder controle te houden. Ondanks dat Rivatuner op die momenten maar 64% GPU load toont, is er geen vermindering in FPS te zien.
Potje Fortnite (op 1080P en settings medium to high vrij goed speelbaar) ook zonder problemen.

Nu eerst met Goztow afspreken wat we ermee gaan doen, hou het forum in de gaten ! :banana:




edit: nog even dit vermelden: cover van de zogenaamse "GPU reactor" op de backplate is er niet meer bij. Heb deze een beetje elektrisch geisoleerd en vastgemaakt met kapton tape.
Afbeelding

Heb dan ook niet meer de moeite gedaan om nog de LED kabel aan te sluiten (pins op de reactor zijn missing), want uiteindelijk hebben die slechts een beperkte esthetische functie.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Toch iets raars met de GTX 770 van @Marsmillo.
Zoals eerder gezegd: kaart start, geeft beeld, maar dat beeld lijkt verschoven. Heb even in bios screen laten staan om wat metingen te doen.

Voltages allemaal normaal. Dan eens gekeken of ik frequenties kon meten (voorlopig nog met een multimeter, oscilloscoop is er nog niet). En terwijl ik bij de VCore inductors aan het poken ben: opeens normaal beeld ?!

Dan maar even Windows booten zeker ? Start op, beeld is echter beperkt tot 640x480, wat voor Win10 extreem weinig is. Maar ok.
Stond nog een AMD driver geïnstalleerd (van het stresstesten van de HD 7970), dus eerst DDU laten draaien. Reboot en tenslotte een clean install met NVInstall en recente Nvidia driver. Driver installeert heel normaal en beeld gaat naar native resolutie van monitor (2560x1440). :???: :???:

GPU-Z detecteert de kaart nu ook helemaal correct. Er lijkt opeens geen vuiltje meer aan de lucht !! Voorlopig nog geen stress op losgelaten (want temp cooler erop, juist genoeg zodat de chip niet fikt, dat meet wat gemakkelijker). Maar dat is dus de volgende stap.

Ik ben curieus...


edit:
Eerst even recentere BIOS erop gezet. Kaart blijft werken.

Dan maar de cooler erop gezet. Nu al ruim een uur Furmark extreme burn in laten draaien. Geen enkel probleem. GPU temperatuur komt niet boven de 72°C, fan op max 85%.

Begrijpe wie kan
Gebruikersavatar
tomw
Premium Member
Premium Member
Berichten: 573
Lid geworden op: 04 sep 2008, 13:32
Uitgedeelde bedankjes: 10 keer
Bedankt: 10 keer

Best eens onder een microscoop controleren op slechte contacten.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

tomw schreef:Best eens onder een microscoop controleren op slechte contacten.
Heb ik idd gedaan. Helemaal niets te zien. Vandaag ook alweer ruim een uur ge-stress-test... no issues.

Ik begin meer en meer te denken dat het toch te maken heeft met dat vocht. Was wellicht net voldoende geleidend om een probleem te veroorzaken. En had misschien wat meer tijd nodig om uit in alle hoekjes uit te drogen.

Maar goed, om zeker te zijn ga ik die kaart nog een paar keer goed warm laten worden en terug afkoelen (uitzetten krimpen uitzetten krimpen enz). Als er ergens een slecht contact is, dan gaat het op die manier wel opnieuw tot uiting komen.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Vandaag werd mijn oscilloscoop geleverd. Eerste werk: kijken of ik op alle fasen van de VRM's van de GTX 770 een frequentie heb. Dat is het geval. Dus daarmee weet ik nu ook met 100% zekerheid dat de VCore en VMem VRM's in orde zijn.

Rest enkel nog de backplate terug monteren. Oeps ! Wat ligt hier nog in de doos ? blijkbaar had ik de heatsink voor de MOSFET's vergeten ! En toch al dagen zitten stresstesten zonder problemen !! Dat betekent dat ASUS voor deze kaart componenten gebruikt heeft van hoge kwaliteit, want zelfs zonder extra heat dissipation bleven ze werken. Dat bevestigt ook dat de kaart echt wel perfect in orde is.

Mijn theorie: Dat vocht op de kaart is afkomstig van de thermal pad tussen MOSFETs en heatsink. Thermal pads bevatten een vloeistof om warmtegeleidend te zijn (en wellicht helpt dat ook tegen versterving van het "rubber"). Volgens mij is die gebaseerd op olie. Die vloeistof zal wel niet geleidend zijn, maar zelfs dan komt die vloeistof normaal niet in contact met ... euh ... contacten, want zit gewoon tussen de plastic bovenkant van MOSFET en heatsink (grounded).
Maar die vloeistof is dus beginnen lekken, dat verklaart waarom die ter hoogte van de MOSFETs zat, weliswaar op de andere kant van de pcb. Niet onmogelijk, want elke pcb heeft wat gaatjes (via's).
Maar mogelijk heeft die vloeistof na verloop van tijd wat luchtvochtigheid opgenomen. Luchtvochtigheid = water. Water en olie mengen toch niet ? Misschien in deze samenstelling wél en bovendien spreken we hier over moleculair niveau...
Onzuiver water is geleidend. Een volledige kortsluiting zal het niet geweest zijn, maar wellicht tussen enkele componenten een contact met lage weerstand, wat ervoor zorgde dat "iets" niet goed werkte.

Ik zag enkele weken geleden op youtube een repair filmpje waarin iets gelijkaardigs beschreven werd, vind het nu jammer genoeg echter niet terug. Maar het zet mijn theorie wel kracht bij.
Marsmillo
Plus Member
Plus Member
Berichten: 129
Lid geworden op: 16 jul 2009, 15:06
Uitgedeelde bedankjes: 13 keer
Bedankt: 10 keer

Dat is uitstekend nieuws!
Ergens blijven aan prutsen heeft dus soms wel effect. Toch benieuwd of je theorie klopt, maar als het ding terug werkt en stabiel lijkt te zijn is dat uitstekend nieuws.
*-*
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Heb hier Gainward GTX 770 met een defecte smd condensator, een defecte gewone condensator en uiteraard een doorgebrande zekering. Maar die zaken zijn het minst van mijn zorgen.

Had al eerder een short over VMem vastgesteld, maar de oorzaak vond ik niet direct. Maar een voltage injection en warmtebeeldcamera gaven een duidelijk beeld: de short zit in één van de memory chips.
Ik heb geen reball stencil of solder balls. Zou ik het proberen zonder ? Of is dat niet te doen ?
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

De GTX 770 van Marsmillo blijkt zeer stabiel te zijn. Krijgt van mij de stempel FIXED.
En staat intussen te koop op https://www.beyondgaming.be/threads/asu ... i-oc.5481/
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Dit weekend een kleine Gigabyte GeForce GTX 1070 Mini ITX onder handen genomen.

Short over VMem. Was vrij snel opgelost met een nieuwe input condensator op de 12V lijn en een nieuwe MOSFET (high side).

Maar daarmee was de kaart blijkbaar nog niet hersteld. Geen weerstand tussen ground en VCore :( Heb dan toch een tijdje gedacht dat dit een verloren zaak ging zijn wegens defecte GPU. Even geïnformeerd bij een tweaker die reballs doet (want ik heb noch materiaal noch een vervangchip). Ging echter veel te duur zijn. De tweaker wees me er wel vriendelijk op dat het eerder uitzonderlijk is dat de GPU defect gaat. Heb dan nog maar wat metingen gedaan.

Omdat de spanning voor de VMem VRM van de pcie power plug (8pin) kwam, ging ik ervan uit dat VCore VRM ook daarop zat. VCore en VMem liggen gewoon op één lijn naast elkaar (wat vaak het geval is) en bovendien vlakbij de power plug. Toch maar even getraceerd: bleek dat dus niet het geval te zijn. Bij deze kaart komt de 12V voor VCore gewoon uit het PCIE slot ! Bijzonder, nog niet gezien bij higher end kaarten die toch wat meer stroom trekken. PCIE slot kan maar max 75W leveren... En toch...

En daar bleek dus gewoon de zekering defect :bang: Simple as that. Stomweg een basis controle overgeslagen. Ja dat was dus snel vervangen en daarna werkte de kaart terug :-D

Deze namiddag al enkele uren gestresst, voorlopig zonder problemen. De volgende dagen nog een paar keer wat goed warm laten worden. Het warme weer zorgt voor een extra uitdaging, dus als de kaart zelfs met warmere omgevingstemperatuur stabiel blijft, dan is dat toch een goed teken.

Lessons learnt:
  • de basis checks niet overslaan !
  • zeer lage weerstand over GPU niet verwarren met een kortsluiting
  • defecte kaarten niet te snel afschrijven
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Vanavond even de EVGA GTX1080 FTW3 van OpThaCop herbekeken:

Blijkbaar zat ik er bij mijn initiële diagnose een klein beetje naast. De onderste 4 VCore VRMs (tel de inductors met markering R22 vanaf beneden geteld) halen hun 12V blijkbaar van de rechtse PCIE 8pin power plug. De overige VCore VRMs én de VMem VRMs zitten op de linkse PCIE 8pin power plug.
Eerder had ik al vastgesteld dat de shot op de rechtse zat. Maar ik vond niet direct een duidelijke reden.

En dan heb ik een groot risico genomen: Ik heb de kaart in de test bench gestoken en opgestart. :evil:

Met knetterend succes ! Bijna onmiddelijk sprongen er bij de onderste VRM vonken vanaf met bijhorend gesis en rookontwikkeling !! Ow f***... :help: :bang:
Heb de boel snel weer afgelegd (duh).

Maar ... dit heeft heel duidelijk de reden van de kortsluiting aangewezen: een input condensator tussen VIN en GND op de onderste power stage. Die is gewoon opgefikt en heeft de bovenste laag van van de pcb traces beschadigd.

Het goeie nieuws ? Ik heb er toch een andere condensator op kunnen zetten. The 1080 is alive !

Ugly fix, maar who cares als 't marcheert, right ?

Op de volgende foto links een intacte cap van de power stage ernaast... hoe hij er hoort uit te zien. Rechts een nieuwe cap. Dat is een andere en ik heb ook geen idee van de exacte waarde. Heb een grotere genomen, want de solder pads waren in rook opgegaan. Dus ik heb die een beetje creatief moeten solderen. En dat ging iets makkelijker met een groter type. Groot is relatief, die is ook maar 2mm lang...
Afbeelding

De oscilloscoop bevestigt dat alle VRMs werken (PWM signaal), dus de kaart zou moeten over zijn volle vermogen beschikken.

En hier is de kaart, in werkende staat en klaar voor een paar dagen stress testing:
Afbeelding
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

De Gigabyte GeForce GTX 1070 Mini ITX blijkt gewoon heel stabiel, zelfs met deze warme temperaturen.
Echt een heel leuk kaartje, vind ik. Je ziet dat over het ontwerp goed nagedacht is. Klein van omvang en daardoor past er ook geen gigantische koeler op. En toch valt de geluidsproductie heel goed mee. En qua performance ook niets aan te merken.
Staat intussen te koop op beyondgaming.
Plaats reactie

Terug naar “Hardware”