Pagina 1 van 1
tekenset recente & trending topics
Geplaatst: 04 mei 2022, 22:24
door _ketter_
in het overzicht met recente forumberichten en trending topics wordt voor de trending topics lijst een verkeerde tekenset gebruikt, bv. Oekraïne en het euroteken € wordt verkeerd weergegeven. zie afbeelding.

Re: tekenset recente & trending topics
Geplaatst: 08 mei 2022, 10:54
door devilkin
Ik vrees dat dat aan jouw browser/instellingen zal liggen...
Re: tekenset recente & trending topics
Geplaatst: 08 mei 2022, 11:03
door boonpwnz
Ik heb het ook. Dus of het aan zijn instellingen ligt?
Bv heb ook dit nu met dit topic
tekenset recente & trending topics
In chrome en Edge getest.
Re: tekenset recente & trending topics
Geplaatst: 08 mei 2022, 11:16
door devilkin
Je hebt gelijk
Ik had die landing page en ´t forum dooreen gehaald. Ik kijk er es naar of ik iets kan vinden...
Re: tekenset recente & trending topics
Geplaatst: 08 mei 2022, 11:29
door biot
[/reddit]
devilkin schreef:Ik vrees dat dat aan jouw browser/instellingen zal liggen...
Nee, specifiek niet. De screenshot bewijst het exact tegenovergestelde.
Wat hier misloopt is het resultaat van een dubbele conversie naar UTF-8.
De webserver geeft aan dat de HTML page UTF-8 is, via de header
In de linkse kolom zie je het woord correct; de "ï" zit ofwel in de database als UTF-8, of wordt correct omgezet naar UTF-8 voor het tonen. De UTF-8 code voor "ï" is 0xc3 0xaf (
https://unicode-table.com/en/00EF/ -- zie tabel onderaan). In de rechtse kolom staat in plaats van "ï" de letters "ï", oftewel 0xc3 0x83 0xc2 0xaf.
Als je een "dubbele" UTF-8 conversie doet van die twee correcte UTF-8 bytes, is het resultaat 0xc3 0x83 0xc2 0xaf, dus dat is de oorzaak. Er zit dus een bug in de code die de rechtse kolom genereert.
Stukje Python dat het korter uitlegt:
Code: Selecteer alles
>>> bytes('ï', 'utf-8')
b'\xc3\xaf'
>>> bytes('\xc3\xaf', 'utf-8')
b'\xc3\x83\xc2\xaf'
Re: tekenset recente & trending topics
Geplaatst: 08 mei 2022, 11:33
door devilkin
Nu OK?
Re: tekenset recente & trending topics
Geplaatst: 08 mei 2022, 12:40
door biot
devilkin schreef:Nu OK?
Ja, bedankt. Het probleem met deze topic, ook in de rechtse kolom (met die amp), is een gelijkaardig probleem, dubbele HTML entity encoding.
Re: tekenset recente & trending topics
Geplaatst: 08 mei 2022, 17:48
door devilkin
biot schreef:devilkin schreef:Nu OK?
Ja, bedankt. Het probleem met deze topic, ook in de rechtse kolom (met die amp), is een gelijkaardig probleem, dubbele HTML entity encoding.
Should be ok now.
Re: tekenset recente & trending topics
Geplaatst: 08 mei 2022, 17:51
door boonpwnz
Lijkt in orde ja
