Pagina 1 van 1
					
				tekenset recente & trending topics
				Geplaatst: 04 mei 2022, 22:24
				door _ketter_
				in het overzicht met recente forumberichten en trending topics wordt voor de trending topics lijst een verkeerde tekenset gebruikt, bv. Oekraïne en het euroteken € wordt verkeerd weergegeven. zie afbeelding.

 
			
					
				Re: tekenset recente & trending topics
				Geplaatst: 08 mei 2022, 10:54
				door devilkin
				Ik vrees dat dat aan jouw browser/instellingen zal liggen...
			 
			
					
				Re: tekenset recente & trending topics
				Geplaatst: 08 mei 2022, 11:03
				door boonpwnz
				Ik heb het ook. Dus of het aan zijn instellingen ligt? 
 
Bv heb ook dit nu met  dit topic 
 
 
	tekenset recente & trending topics
In chrome en Edge getest.
 
			
					
				Re: tekenset recente & trending topics
				Geplaatst: 08 mei 2022, 11:16
				door devilkin
				Je hebt gelijk 
 
 
Ik had die landing page en ´t forum dooreen gehaald. Ik kijk er es naar of ik iets kan vinden...
 
			
					
				Re: tekenset recente & trending topics
				Geplaatst: 08 mei 2022, 11:29
				door biot
				[/reddit]
devilkin schreef:Ik vrees dat dat aan jouw browser/instellingen zal liggen...
Nee, specifiek niet. De screenshot bewijst het exact tegenovergestelde.
Wat hier misloopt is het resultaat van een dubbele conversie naar UTF-8. 
De webserver geeft aan dat de HTML page UTF-8 is, via de header 
In de linkse kolom zie je het woord correct; de "ï" zit ofwel in de database als UTF-8, of wordt correct omgezet naar UTF-8 voor het tonen. De UTF-8 code voor "ï" is 0xc3 0xaf (
https://unicode-table.com/en/00EF/ -- zie tabel onderaan). In de rechtse kolom staat in plaats van "ï" de letters "ï", oftewel 0xc3 0x83 0xc2 0xaf.
Als je een "dubbele" UTF-8 conversie doet van die twee correcte UTF-8  bytes, is het resultaat 0xc3 0x83 0xc2 0xaf, dus dat is de oorzaak. Er zit dus een bug in de code die de rechtse kolom genereert.
Stukje Python dat het korter uitlegt:
Code: Selecteer alles
>>> bytes('ï', 'utf-8')
b'\xc3\xaf'
>>> bytes('\xc3\xaf', 'utf-8')
b'\xc3\x83\xc2\xaf'
 
			
					
				Re: tekenset recente & trending topics
				Geplaatst: 08 mei 2022, 11:33
				door devilkin
				Nu OK?
			 
			
					
				Re: tekenset recente & trending topics
				Geplaatst: 08 mei 2022, 12:40
				door biot
				devilkin schreef:Nu OK?
Ja, bedankt. Het probleem met deze topic, ook in de rechtse kolom (met die amp), is een gelijkaardig probleem, dubbele HTML entity encoding.
 
			
					
				Re: tekenset recente & trending topics
				Geplaatst: 08 mei 2022, 17:48
				door devilkin
				biot schreef:devilkin schreef:Nu OK?
Ja, bedankt. Het probleem met deze topic, ook in de rechtse kolom (met die amp), is een gelijkaardig probleem, dubbele HTML entity encoding.
 
Should be ok now.
 
			
					
				Re: tekenset recente & trending topics
				Geplaatst: 08 mei 2022, 17:51
				door boonpwnz
				Lijkt in orde ja  
