Groups | Search | Server Info | Login | Register


Groups > de.comp.lang.javascript > #5431

Re: Bestimmte Unicodezeichen in HTML finden und "behandeln"

From Andreas Borutta <borumat@gmx.de>
Newsgroups de.comp.lang.javascript
Subject Re: Bestimmte Unicodezeichen in HTML finden und "behandeln"
Date 2023-06-06 15:52 +0200
Organization A noiseless patient Spider
Message-ID <13e32p4bdrld6$.dlg@borumat.de> (permalink)
References (16 earlier) <j8pje920jp5f.dlg@borumat.de> <tit8hy08quee.dlg@borumat.de> <slrnu7sou2.lehd.hjp-usenet3@trintignant.hjp.at> <14x8d8hjurnpk$.dlg@borumat.de> <slrnu7u0q4.ngrv.hjp-usenet3@trintignant.hjp.at>

Show all headers | View raw


Peter J. Holzer:

> On 2023-06-06 06:33, Andreas Borutta <borumat@gmx.de> wrote:
>> Peter J. Holzer:
>>> On 2023-06-05 22:35, Andreas Borutta <borumat@gmx.de> wrote:
>>>> Warum wird das eine Entity im Quelltest ausgegeben, und das andere
>>>> nicht?
>>> 
>>> Wird sie nicht. Vergleich mal die Absätze, in denen Du das gleiche
>>> Zeichen auf verschiedene Art geschrieben hast.
>>
>> Im Quelltext kommen zwei Entities für zwei verschiedene Leerzeichen
>> vor:
>>
>> &nbsp;
>> &#x202F;
> 
> Nein, im Quelltext kommen drei verschiedene Arten, U+00A0 zu schreiben
> vor:

> [...]

Verzeihung, ich hatte ja im Laufe des Threads zwei Testdokumente
erwähnt:
https://borumat.de/-/fahrradzukunft/invisibles
https://borumat.de/-/fahrradzukunft/invisibles-2

Im zweiten kommen nur 2 verschiedene Entities vor. 

> <p>U+00A0 NO-BREAK SPACE<br>
>   &amp;nbsp;  <br />
>   foo&nbsp;foo</p>
> <p>U+00A0 NO-BREAK SPACE<br>
>   &amp;#160; <br />
>   foo&#160;foo</p>
> <p>U+00A0 NO-BREAK SPACE<br>
>   Unicodezeichen  <br />
> foo foo</p>
> 
> »&nbsp;«, »&#160;« und » «. Alle drei aber werden bei "View Selectio
> Source" aber als »&nbsp;« dargestellt.

Komisch, oder? Warum diese "Normalisierung"?

> Es hast auch U+202F auf zwei verschiedene Arten geschrieben:
> 
> <p>U+202F NARROW NO-BREAK SPACE<br>
>   &amp;#x202F;  <br />
>   bar&#x202F;bar</p>
> <p>U+202F NARROW NO-BREAK SPACE<br>
>   &amp;#8239;  <br />
>   bar&#8239;bar</p>
> 
> Und beide werden gleich (als Leerzeichen - welche Art von Leerzeichen
> ist optisch nicht erkennbar) ausgegeben.
> 
> Es wird also offensichtlich weder bei U+00A0 noch bei U+202F der
> Quelltext ausgegeben. 

Richtig.

> Sondern es wird im ersten Fall das Zeichen in
> »&nbsp;« übersetzt, damit man es optisch erkennen kann, während es im
> zweiten Fall einfach so ausgegeben wird (entweder weil die Entwickler
> eine optische Kennzeichnung nicht für wichtig erachtet haben, oder weil
> sie der Meinung waren, dass das störend wäre)

Mir erschließt sich das Motiv für die verschiedene Behandlung nicht.
"störend" scheidet ja aus, denn dann würde die Entwickler von Firefox
ja auch beim No-BREAK SPACE kein Entity ausgeben.

Wir spekulieren und können das auch so stehenlassen. Hier lesen ja
keine Mozilla-Entwickler mit.

Andreas
-- 
http://fahrradzukunft.de

Back to de.comp.lang.javascript | Previous | NextPrevious in thread | Next in thread | Find similar


Thread

Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-27 13:02 +0200
  Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-27 21:54 +0200
    Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-28 00:36 +0200
      Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-28 12:53 +0200
      Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-28 20:42 +0200
        Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-28 21:09 +0200
          Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-28 22:56 +0200
          Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-29 10:13 +0200
            Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-29 12:35 +0200
              Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-29 19:48 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-05-29 22:16 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-29 23:06 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-30 20:12 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-30 20:55 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-31 11:36 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-31 13:22 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-31 20:24 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-02 16:38 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-02 17:36 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-30 20:25 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-30 20:59 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-04 11:42 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-04 13:23 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-04 17:54 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-04 19:15 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-05 00:36 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-05 15:48 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-05 18:17 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-05 23:47 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-06 00:07 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-06 00:17 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-06 00:12 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-06 00:35 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-06 00:37 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-06 08:33 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-06 11:58 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-06 15:52 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-06 16:29 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-07 00:15 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-07 08:51 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-07 09:43 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-07 10:01 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-08 09:06 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-06 00:35 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-06 00:40 +0200
        Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-28 23:14 +0200
          Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-29 10:25 +0200
  Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-07 12:39 +0200
    Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-08 09:16 +0200

csiph-web