GPU Repair Café

Wil je iets weten over de hardware van een computer? Draait je CPU fan niet meer? Je printer wil niet meer mee? Dan moet je hier zijn.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Ik begin te begrijpen waarom ik niet erg veel succes lijk te hebben met AMD grafische kaarten:
Recent AMD GPUs have a hybrid ROM which contains two images: A legacy video BIOS (vBIOS) image and a compressed graphics output protocol (GOP) driver image. In theory this allows the card to work well on both legacy systems (which will use the vBIOS image) and more modern systems with a unified extensible firmware interface (UEFI) compatible pre-boot firmware architecture (which use the GOP driver).

However some early UEFI implementations cannot cope with the hybrid BIOS, they try to load the GOP driver and fail, hanging at boot with a blank screen. I have personally experienced this with an AMD RX480 and an Alienware Aurora R3 system (other examples: RX 480 incompatibility thread on reddit, R3 with an RX580, another R3 with an RX480)
bron: https://www.win-raid.com/t4262f16-How-t ... -GPUs.html

Komt er eigenlijk op neer dat de UEFI implementatie op mijn test bench moederbord (Asrock Z77 Extreme4) mogelijk niet goed overweg kan met hybride BIOS op AMD kaarten.
Als ik Compatibility Support Module (CSM) in BIOS uitschakel, dan krijg ik zowaar beeld. Maar dan vindt BIOS mijn UEFI boot device niet (geen Windows, dus veel testen zit er niet in).
Moederbord is al wat ouder, laatste (beta) BIOS dateert van 2018 maar lost dat probleem niet op. Kans is klein dat hiervoor nog een fix uitkomt.

De BIOS mod in hierboven gelinkt artikel zou het voor mij misschien oplossen, maar zou wellicht voor problemen zorgen in een ander systeem. Dus dat vind ik geen goeie oplossing.

Dus ik denk dat ik beter op zoek ga naar een iets recenter moederbord (én CPU én RAM) voor mijn test bench... Mocht iemand iets liggen hebben, graag een berichtje :help:
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Ruim een week geleden heb ik een Palit GTX 1060 binnengekregen.
Vrij snel bleek dat een power stage ontploft was (SIC632). Ik heb de defecte eraf gehaald en er bleek wat schade aan de pcb. Op zicht waren de solder pads en traces nog bruikbaar, maar de pcb was onder de IC toch niet meer helemaal effen. Het is me toch gelukt om een nieuwe op solderen, alle contacten maken contact, geen shorts.
Maar je ziet duidelijk dat dit geen schoonheidsprijs verdient:
Afbeelding

Het probleem bleek daarmee niet opgelost. De PWM controller (NCP81174) ziet dat er nog iets niet in orde is en PGOOD (of in dit geval VR_RDY) blijft low. Deze dient als EN (enable) signaal voor de PEX rail (1V). Dus die startte ook niet. Card not detected...
Dus ik vermoed dat er ter hoogte van de power stage toch "ondergrondse" schade is, traces die gebroken zijn ofzo.

Deze kaart heeft 3 fasen. Maar de pcb is voorzien voor 5:
Afbeelding
Je ziet dat 2 plaatsen niet bezet zijn en ook een inductor ontbreekt.

Voorzien voor 5, 't is te zeggen: de PWM controller kan er maar 4 aansturen. Rare design keuze van de ontwerper... maar goed.
Van de controller naar de bovenste lege plaats blijken de traces wél voorzien (naar de onderste lege niet, heeft ook geen zin, want de controller kan geen 5 power stages aansturen).

You see a problem ? I see an opportunity ! Zou ik die fase kunnen verplaatsen naar de lege plaats ?

Vanavond heb ik uitgezocht wat dat precies inhoudt: Behalve de power stage en inductor, moeten er ook een tiental weerstanden en condensatoren verhuizen:
Afbeelding
Afbeelding
Afbeelding
Afbeelding

Geen sinecure, want al die SMD componenten zijn van package type 0402 ofwel slechts 1mm lang en een halve mm breed !

Jammer genoeg morgen geen tijd om eraan te beginnen... en daarna is 't alweer werkweek. Maar eigenlijk kan ik niet wachten om eraan te beginnen.
decat
Elite Poster
Elite Poster
Berichten: 1656
Lid geworden op: 31 jan 2007, 11:53
Locatie: Brabant
Uitgedeelde bedankjes: 93 keer
Bedankt: 104 keer

Welke microscoop gebruik je? Het beeld is mooi duidelijk ivm die van hier, nu die hier is ook maar een cheap ding van 20 EUR.
Die 0402's lijken inderdaad lastig. Hier moet er op een iMac moederbord zo eentje worden vervangen gezien de omvang ben ik er nog niet aan durven beginnen. :lol:

Recent de backlight fuse (iets groter dan 0402) op een MacBook moederbord vervangen en dat was een heel huzarenstuk,
but it's back alive. 8)
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

decat schreef:Welke microscoop gebruik je? Het beeld is mooi duidelijk ivm die van hier, nu die hier is ook maar een cheap ding van 20 EUR.
Ik gebruik deze: https://www.banggood.com/5MP-8-LED-USB- ... rrency=EUR
Dus nóg goedkoper :p

Heb er mij wel een iets deftigere stand voor geprint: https://www.thingiverse.com/thing:2783956 + dat beugeltje https://www.thingiverse.com/thing:4829043

Bij het solderen van die kleine componenten is niet zozeer het zicht een probleem. Maar die dingen willen niet blijven liggen. Met een hot air gun blaas je ze gewoon weg. Dus je moet ze kunnen vasthouden met een pincet op exact de juiste plaats. Zeer stabiele hand voor nodig...
decat
Elite Poster
Elite Poster
Berichten: 1656
Lid geworden op: 31 jan 2007, 11:53
Locatie: Brabant
Uitgedeelde bedankjes: 93 keer
Bedankt: 104 keer

Thanks, straks eens bekijken. Qua uiterlijk zijn ze hetzelfde, maar de resolutie / sensor van uwe is beter. Die hier is max. 640x480. Op een 27" QHD scherm naar zo'n hokje staren is niet ideaal. Uitvergroten kan mits inboeten aan kwaliteit.
S20201231_001.jpg
Als stand heb ik hier al vanalles geprobeerd, de laatste keer was een oude smartphonehouder voor in de wagen. Zo'n groot lomp ding maar de flexi arm ervan lijkt hiervoor wel nuttig. Dat 3D printen lijkt me ook wel leuk en kom hier ten gepaste tijde ook nog in huis. :-D
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Die van mij is ook maar 640 × 480 ... volgens mij is dat exact dezelfde. Mijn viewer (meestal gewoon de camera app van windows of Mscopes op android tablet) zoom ik dan wel wat in, maar uiteraard is dat maar softwarematig opschalen.

Ik ga me waarschijnlijk ooit wel eens een "echte" megapixel camera kopen.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Een paar kleine updates:
  • De EVGA GTX1080 FTW3 blijft stabiel. Zit nu zelfs sinds enkele dagen in mijn main PC. Heb even overwogen om ze te houden ipv mijn 1660 Super. Maar heb ze toch te koop gezet op beyondgaming.
  • De Palit 1060: power stage en componenten verplaatst naar vrije pad. Maar blijkt nog niet te werken. Nog steeds zelfde symptomen (geen VCore en VMem, en als gevolg daarvan geen PEX en dus sowieso niet detected). Zal er nog wat metingen op doen, maar ziet er eigenlijk niet zo goed uit.
  • Intussen had ik hier nog een MSI GTX780 Gaming G. 2 van de 6 sic780 power drmos (power stage) waren defect, maar kaart werkte nog. Maar dus slechts 66% van power beschikbaar.
    Afsolderen van een power stage bleek te moeilijk. Mogelijk was die IC al aan de pads gelast van de warmte. Met veel moeite eraf gekregen, maar pcb is beschadigd. Niet meer te redden :-( Gaat in de doos voor spare parts.
  • Momenteel bezig met een HD7870: alles in orde tot op moment dat je een driver installeert. Dan black screen en PC loopt vast (num lock test). BIOS reflash heeft niets opgelost. Ik ga de GPU reflowen (deze keer niet in de oven, maar gewoon met heatgun). Als dat niets verandert, is het ook een lost cause.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

didi79 schreef:GTX 970: Ik heb beslist de VCore VRMs helemaal opnieuw op te bouwen.
De Strix van Marsmillo dus...
  • Enkele doublers vervangen.
  • 2 inductors vervangen. Enkele van een donor genomen. Niet zelfde type en waarden. Maar ik had niets anders.
  • ontbrekende MOSFET's erop gesoldeerd
Afbeelding

Momenteel dus nog een mix van MOSFET's, maar alle fasen van de kaart werken wel.
En toch gaat de GPU niet hoger dan +-70% TDP. Met andere woorden de kaart wordt aanzienlijk gelimiteerd door gebrek aan power.

Hopelijk betert dat nog als ik alle MOSFET's vervangen heb door hetzelfde type. Heb er dus nog wat werk aan...



Intussen had ik nog een Gainward GTX 970 Phantom binnengekregen (had eerder al zo één hersteld, zie https://userbase.be/forum/viewtopic.php ... 21#p880612 ). Erg gelijkaardig probleem: defecte power stage en doorgebrande zekering.
Deze keer bleek het vervangen van de power stage echter niet zo gemakkelijk te gaan: zelfs met nieuwe power stage erop, bleef de kaart shorten (en de zekering springen). Had volgens mij te maken met slecht soldeerwerk: na de 4de (!) keer alles verwijderen, opkuisen en een nieuwe power stage erop, blijkt de kaart volledig hersteld :)
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

didi79 schreef: Hopelijk betert dat nog als ik alle MOSFET's vervangen heb door hetzelfde type. Heb er dus nog wat werk aan...
Geen verschil dus. Misschien moet ik toch andere inductors zoeken.
SpecialK
Elite Poster
Elite Poster
Berichten: 1374
Lid geworden op: 22 mei 2013, 09:04
Uitgedeelde bedankjes: 3 keer
Bedankt: 105 keer

Waren die originele inductors dan kapot? Da's in feite toch niet meer dan een stuk draad; ik kan me moeilijk voorstellen dat die verbrandt voor de zekering eruit gaat.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

SpecialK schreef:Waren die originele inductors dan kapot? Da's in feite toch niet meer dan een stuk draad; ik kan me moeilijk voorstellen dat die verbrandt voor de zekering eruit gaat.
Ik had ze eraf gehaald om fasen te isoleren. Inductors eraf halen is een PITA. Net omdat ze gewoon draad zijn, nemen ze alle soldeerwarmte op.
Dus werden ze brute force verwijderd en daarmee is de behuizing gebroken.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

Ik kan moeilijk geloven dat de inductoren zo'n grote impact hebben op TDP. Daarom een andere hypothese:
Voor rebuild van de VRM's van de GTX 970 Strix heb ik allemaal dezelfde MOSFET's gebruikt (CSD17310Q5A).

De standaard MOSFET's waren één UBIQ M3054 als high side en twee M3056 als low side.
De high side MOSFET's moeten 12 V erg snel kunnen schakelen. De low side MOSFET's mogen in principe trager zijn, maar moeten veel meer stroom kunnen verwerken.

Op het eerste zicht leken de specs van de CSD17310Q5A redelijk overeen te komen met die van de M3054 en M3056, nl. +- 100A continuous drain bij een temperatuur van 25°C.

MAAR: Die dingen worden natuurlijk een pak heter dan 25°C !!
EN: als je verder in de specs kijkt, blijkt er een erg groot verschil te zijn in de pulsed drain current: 180A voor de M3054 , 300A voor de M3056. En de CSD17310Q5A haalt maar 134A !!! Veel te weinig dus.

Ik zal dus op zoek moeten gaan naar andere MOSFET's.
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

didi79 schreef:MSI GTX 1080 Ti Gaming X 11G van @cyberbug

Kaart heeft toch wat afgezien (niet verwonderlijk als je de geschiedenis kent ;) ). Nabij de monitoruitgangen wat corrosie op de pcb. Enkele minieme smd componenten (maat 1005) vielen er gewoon af bij het reinigen, gewoon door corrosie op de solder pads... Maar goed, die paar stukken gaan het verschil niet maken, hooguit een poort die niet helemaal gaat werken. Maar zover zijn we nog niet.

Geen obvious shorts.
Voltages: 5V is er, 1,8V is er. GPU VCore is er niet en omdat die er niet is, ook geen VMem en PEX (1V). Die volgorde van opstarten wordt trouwens af en toe vermeld door de kerel van Tech Cemetry.

Geen zichtbare of meetbare gebreken op de MOSFETs en drivers (ook al zat er een beetje corrosie op enkele pinnetjes van een driver). Maar de drivers krijgen waarschijnlijk geen PWM signaal van de controller (NCP81274).
PGOOD pin van de controller blijft low, wat volgens mij betekent dat een bepaald voltage niet gehaald wordt. Dat voltage wordt bepaald door een andere PWM controller, die heb ik nog niet gevonden. De NCP81274 krijgt wel 5V op VCC en 1.8V op EN (enable).

Dit wordt opnieuw een lastige...
Ok, vorig weekend begonnen met herstellen van de componenten bij de monitoraansluitingen. Niet gemakkelijk, want enkele pads weggecorrodeerd.

Dan nog wat verdere metingen gedaan. Deze keer wél een short over de VCore vastgesteld ??!! Raar...
Voltage injection gedaan, maar de schuldige component bleek niet zo gemakkelijk op te sporen. Zelfs niet als ik er gedurende 10-20 min 5W doorheen joeg (op de VRM welteverstaan, niet op de GPU ;-) ). Maar dan toch letterlijk een lichtpuntje (op de thermal cam) gezien: de twee bovenste dual MOSFET's (datasheet) werden een ietsiepietsie warmer dan de rest. Waarschijnlijk ging alle overige warmte direct naar de pcb en dus direct "weg".
Dat zijn nota bene de MOSFET's waarvan eerder al de driver ernaast verwijderd werd. Dus we zaten toen blijkbaar wel al op een goed spoor.

Ok, 7 van de 8 fasen intact. Power up die handel !!

En jawel: we have an image !!! :banana:
Kaart haalt zelfs Windows en driver installatie. Na enkele minuten valt beeld weg, maar ik denk dat dat door een thermische veiligheid komt. Uiteindelijk zit daar om te testen maar een klein koelertje op, geen thermal pads, geen backplate, geen heatsink op de MOSFET's... Windows blijft wel actief op de achtergrond, m.a.w. geen crash. Dat is echt goed nieuws.


Ok, er is nog serieus wat werk aan: nieuwe MOSFET's en driver, componenten bij de outputs nog wat netter/vaster maken. Maar wie had ooit kunnen denken dat de "kattepis" kaart nog ooit een teken van leven zou tonen ?!
ns_ripper
Starter
Starter
Berichten: 1
Lid geworden op: 20 jul 2021, 23:09

tomw schreef:Condensatoren horen niet echt warm te worden, maar kan ook het gevolg zijn van te grote stroom door de regulator. Een methode dat ik dikwijls toepas is voltage injection. Dus in dit geval met een lab voeding zelf 5V aanleveren op de uitgang van regulator en dan alles goed in het oog houden en met warmtecamera meten.
Een capaciteits meter heb je in dit geval inderdaad niet nodig.
Dat is gevaarlijk als je niet weet wat er mis is!
Ik heb zo de cpu van een macbook pro 2015 om zeep geholpen.
Highside mosfet in kortsluiting naar de low side.
Cpu kan al om zeep geweest zijn, maar als hij het niet was, was hij het toen zeker. Sommige zaken leer je the hard way xD
Als ik nog injecteer, dan begin ik met een spanning die de laagste spanning op zo'n kaart niet overstijgt.
Maar ik moet er uiteraard niet bij zeggen dat als je onder of bij de 1V blijft dat er nagenoeg niets opwarmt wegens veel te weinig opgenomen vermogen. Komt daar nog bij dat zo'n kaart op zichzelf al nagenoeg een heatsink is en verdomd veel warmte kan afvoeren van componenten. Hier zou een warmtebeeldcamera dan weer van pas komen (maar die dingen zijn verdomd duur).
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

GTX 970 Strix van Marsmillo update: MOSFETs werden nogmaals vervangen. Maar ze bleven doorbranden en ook de drivers sneuvelden.
Daarnet nog een laatste poging gedaan. Maar daar kwam rook bij kijken. Deel van pcb doorgebrand. Misschien zat daar al een kortsluiting van in het begin, wie zal 't zeggen.

Jammer, maar deze ga ik niet meer kunnen redden. :-( Gaat in de bak donorkaarten.
Marsmillo
Plus Member
Plus Member
Berichten: 129
Lid geworden op: 16 jul 2009, 15:06
Uitgedeelde bedankjes: 13 keer
Bedankt: 10 keer

Jammer dat het niet gelukt is. Hoop dat bepaalde onderdelen nog van pas kunnen komen bij andere kaarten.
*-*
Gebruikersavatar
buthead
Elite Poster
Elite Poster
Berichten: 1690
Lid geworden op: 10 jan 2016, 13:14
Uitgedeelde bedankjes: 40 keer
Bedankt: 68 keer

Even inpikken hierop - nog steeds de GTX 970 van asus.
Doet zijn ding gewoon goed genoeg :D

standaard is deze op 60 graden = fan 0 RPM gezet.

Ik dacht van als ik nu standaard de fans altijd laat draaien voor betere levensduur en koeling?
Is dit nuttig?

Minimale RPM dat die doet is aan 33% lager gaat niet bij manueel profiel.

ingesteld nu:
0-60 graden = 33%
60-hoger exponentieel stijgend
Internet = PX FLEX pack
Telefonie/GSM = PX Mobiel
TV = PX pickx + Netflix + Disney+
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

buthead schreef: Ik dacht van als ik nu standaard de fans altijd laat draaien voor betere levensduur en koeling?
Is dit nuttig?
Ik zou zeggen van wel. Warmte heeft altijd een degraderend effect op elektronische componenten. Dus hoe koeler, hoe beter. Natuurlijk zal het in de praktijk een afweging zijn met lawaai. Maar wellicht maken die fans op 33% niet meer lawaai dan andere ventilatoren in de PC, dus why not.



Terwijl ik toch reageer: repairs hebben een tijdje stilgelegen. Sinds kort weer herbegonnen, hetzij op een lage pace.
Ik heb enkele kaarten met diagnose faulty memory chips. Dus binnenkort ga ik mijn eerste memory transplantaties proberen. Wish me luck!
didi79
Elite Poster
Elite Poster
Berichten: 912
Lid geworden op: 25 jun 2007, 17:19
Uitgedeelde bedankjes: 87 keer
Bedankt: 98 keer

New tricks, new tools.

Heb me een iets betere microscoopcamera gekocht.
Intussen zie ik dat die nog eens 8 euro goedkoper is dan toen ik hem vorige maand kocht :roll:
Anyway, toch wel een wereld van verschil met dat goedkoop usb dingetje. Veel meer detail, goeie verlichting, veel meer bereik.

Ik ben ook eens aan de slag gegaan met memory test voor AMD GPU's. Goeie uitleg hier.
Een RX580 met memory issues geeft met die test fouten op 2 banks, dus mogelijk 4 chips.
2 ervan (1 bank) heb ik al vervangen, maar de errors blijven gelijkaardig. Dat doet me vermoeden dat het probleem eigenlijk de memory controller is. Die zit in de GPU, dus als ik gelijk heb, dan is dat een verloren zaak. Om iets meer zekerheid te hebben, ga ik toch de andere bank ook nog vervangen.
Kans is trouwens groot dat die RX580 een ex-mining kaart is, dus wellicht was die gewoon "op".


Maaaaanden geleden had ik al eens een faulty memory module vastgesteld op een GTX 780. Voor Nvidia GPU's kan je dat vrij precies diagnoseren met de scripts MATS/MODS. Gisteren eindelijk tijd gehad om de module te vervangen. En daarmee is de kaart terug kerngezond. :thumbs:

Voor mijn eerste BGA werkzaamheden niet slecht.
Plaats reactie

Terug naar “Hardware”