Pagina 1 van 1

tekenset recente & trending topics

Geplaatst: 04 mei 2022, 22:24
door _ketter_
in het overzicht met recente forumberichten en trending topics wordt voor de trending topics lijst een verkeerde tekenset gebruikt, bv. Oekraïne en het euroteken € wordt verkeerd weergegeven. zie afbeelding.
Afbeelding

Re: tekenset recente & trending topics

Geplaatst: 08 mei 2022, 10:54
door devilkin
Ik vrees dat dat aan jouw browser/instellingen zal liggen...

Re: tekenset recente & trending topics

Geplaatst: 08 mei 2022, 11:03
door boonpwnz
Ik heb het ook. Dus of het aan zijn instellingen ligt? :|

Bv heb ook dit nu met dit topic :lol:

tekenset recente & trending topics

In chrome en Edge getest.

Re: tekenset recente & trending topics

Geplaatst: 08 mei 2022, 11:16
door devilkin
Je hebt gelijk ;)

Ik had die landing page en ´t forum dooreen gehaald. Ik kijk er es naar of ik iets kan vinden...

Re: tekenset recente & trending topics

Geplaatst: 08 mei 2022, 11:29
door biot
[/reddit]
devilkin schreef:Ik vrees dat dat aan jouw browser/instellingen zal liggen...
Nee, specifiek niet. De screenshot bewijst het exact tegenovergestelde.

Wat hier misloopt is het resultaat van een dubbele conversie naar UTF-8.

De webserver geeft aan dat de HTML page UTF-8 is, via de header

Code: Selecteer alles

content-type: text/html; charset=UTF-8
In de linkse kolom zie je het woord correct; de "ï" zit ofwel in de database als UTF-8, of wordt correct omgezet naar UTF-8 voor het tonen. De UTF-8 code voor "ï" is 0xc3 0xaf (https://unicode-table.com/en/00EF/ -- zie tabel onderaan). In de rechtse kolom staat in plaats van "ï" de letters "ï", oftewel 0xc3 0x83 0xc2 0xaf.

Als je een "dubbele" UTF-8 conversie doet van die twee correcte UTF-8 bytes, is het resultaat 0xc3 0x83 0xc2 0xaf, dus dat is de oorzaak. Er zit dus een bug in de code die de rechtse kolom genereert.

Stukje Python dat het korter uitlegt:

Code: Selecteer alles

>>> bytes('ï', 'utf-8')
b'\xc3\xaf'
>>> bytes('\xc3\xaf', 'utf-8')
b'\xc3\x83\xc2\xaf'

Re: tekenset recente & trending topics

Geplaatst: 08 mei 2022, 11:33
door devilkin
Nu OK?

Re: tekenset recente & trending topics

Geplaatst: 08 mei 2022, 12:40
door biot
devilkin schreef:Nu OK?
Ja, bedankt. Het probleem met deze topic, ook in de rechtse kolom (met die amp), is een gelijkaardig probleem, dubbele HTML entity encoding.

Re: tekenset recente & trending topics

Geplaatst: 08 mei 2022, 17:48
door devilkin
biot schreef:
devilkin schreef:Nu OK?
Ja, bedankt. Het probleem met deze topic, ook in de rechtse kolom (met die amp), is een gelijkaardig probleem, dubbele HTML entity encoding.
Should be ok now.

Re: tekenset recente & trending topics

Geplaatst: 08 mei 2022, 17:51
door boonpwnz
Lijkt in orde ja :-D