Groups | Search | Server Info | Login | Register


Groups > de.comp.lang.javascript > #5384

Re: Bestimmte Unicodezeichen in HTML finden und "behandeln"

From Andreas Borutta <borumat@gmx.de>
Newsgroups de.comp.lang.javascript
Subject Re: Bestimmte Unicodezeichen in HTML finden und "behandeln"
Date 2023-05-29 19:48 +0200
Organization A noiseless patient Spider
Message-ID <11sawgiw92age.dlg@borumat.de> (permalink)
References (9 earlier) <Elementtyp-20230528204202@ram.dialup.fu-berlin.de> <tbf1euk0alca.dlg@borumat.de> <Aenderungen-20230529104058@ram.dialup.fu-berlin.de> <oz65ya400y2h.dlg@borumat.de> <Elementtyp-20230529130608@ram.dialup.fu-berlin.de>

Show all headers | View raw


Stefan Ram:

>>Hier verstehe ich etwas konzeptionell noch nicht.
>>Mir ist jetzt erst aufgefallen, dass ich HTL-Elemente explizit
>>hinzufügen muss, die behandelt werden sollen.
>>Sozusagen Opt-In.
>>Wäre es vor diesem Hintergrund nicht sinnvoll und praktisch, wenn
>>automatisch alle HTML5-Elemente vom Skript behandelt werden?
>>Denn das ist ja der typische Usecase.

>   [...] 
>   Du kannst durch "const ok = true;" an Stelle von 'const ok =
>   parent.nodeName in{ "P":0, "H1":0 /* ... */ }' (die Zeile
>   sollte eigentlich ohnehin auch mit einem Semikolon ";" enden)
>   erreichen, daß wirklich /alle/ Elemente, die nicht unter einem
>   Element mit ausgeschlossenem Typ liegen, modifiziert werden.
>   Aber das könnte, wie gesagt, zu Problemen führen (siehe unten).

Ich habe das eingepflegt. Tests mit komplexeren Dokumenten (mit
verschachtelten Elementen) stehen eh noch aus.

Ich werde berichten.

Grundsätzlich ist natürlich eine hohe Zuverlässigkeit des Skriptes
wichtig.

Und bei einem White-Listing wäre es nur eine Frage der Zeit, wann man
mal auf einer Website ein HTML-Element neu hinzunimmt und vergisst, es
im Skript zu ergänzen. Das Argument erwähnst Du selber ja weiter unten
ebenfalls.

>>Auch alle HTML-Custom-Elemente, die mit einem spezifischen Präfix mit
>>Minus dahinter im Elementnamen eingeleitet werden, sollten automatisch
>>vom Skript behandelt werden.
> 
>   Du könntest ganz am Anfang des Skriptes folgende Deklaration einfügen:
> 
> const prefix = "x-";
> 
>   . Dadurch ist nun ein Präfix für Elemente festgelegt, die auf jeden
>   Fall bearbeitet werden sollen.
> 
>   Der Anfang der Funktion "processNode" über der Zeile "if( ok )" könnte
>   dann so aussehen:
> 
> function processNode( node )
> { if( node.nodeType == Node.TEXT_NODE )
>   { const parent = node.parentElement;
>     const ok1 = parent.nodeName.toLowerCase().startsWith( prefix );
>     const ok2 = parent.nodeName.toLowerCase() in
>     { "p":0, "h1":0 /* ... */ };
>     let ok3 = true;
>     for( pairs_unicode_custom_element of pairs_unicode_custom_elements )
>     { if
>       ( parent.nodeName.toLowerCase() ==
>         pairs_unicode_custom_element[ 1 ])
>       ok3 = false; }
>     const ok =( ok1 || ok2 )&& ok3;
> 
>     /* Hinweis: Nicht vergessen, obiges "ok2" je nach
>        Bedarf um die Typen weiterer Elemente zu erweitern,
>        in denen Ersetzungen stattfinden sollen! */

Das habe ich jetzt so eingepflegt.

Aber ich habe Sorge bei den diversen Änderungen doch Fehler
einzubauen.

Bist Du bitte nochmal so nett und führst folgende Änderungen am Skript
durch:

1
Entfernung der Skriptteile für Whitelisting

2 
Ergänzung der Blacklist mit "head"

3
Entfernung der Skriptteile, wo man CSS-Regeln angeben kann
<style> ...

4
Entfernung der Skriptteile, wo man ein externes Stylesheet angeben
kann

5
Ergänzung der Deklaration der Konstante für das Prefix im Kopf des
Skriptes.
Namensvorschlag: prefix_custom_element 

6
Beim mehrdimensionalen Array steht zur Zeit ein Name im Plural:
pairs_unicode_custom_elements (hatte ich ja so vorgeschlagen)
Entspricht das guter Praxis für Benennungen?
Oder wäre Singular besser?
pair_unicode_custom_element
oder darf man ein "&" verwenden im Namen für mehrdimensionale Arrays?
unicode&custom_element


Durch diese Änderungen fokussieren wir uns auf den Kern der Aufgabe:

a Umhüllung von spezifischen Unicodezeichen mit HTML-Custom-Elements
b Option zum Blacklisting ausgewählter Elemente, zur Sicherheit

CSS kann problemlos manuell als externes Stylesheet eingebunden
werden.
So bleibt die Aufgabe "Gestaltung der umhüllten Unicodezeichen"
getrennt vom Skript.

Ich kann mich erst am späteren Abend wieder melden. Aber eine Antwort
hat auch keine Eile lieber Stefan.

Andreas
-- 
http://fahrradzukunft.de

Back to de.comp.lang.javascript | Previous | NextPrevious in thread | Next in thread | Find similar


Thread

Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-27 13:02 +0200
  Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-27 21:54 +0200
    Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-28 00:36 +0200
      Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-28 12:53 +0200
      Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-28 20:42 +0200
        Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-28 21:09 +0200
          Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-28 22:56 +0200
          Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-29 10:13 +0200
            Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-29 12:35 +0200
              Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-29 19:48 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-05-29 22:16 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-29 23:06 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-30 20:12 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-30 20:55 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-31 11:36 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-31 13:22 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-31 20:24 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-02 16:38 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-02 17:36 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-30 20:25 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-30 20:59 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-04 11:42 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-04 13:23 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-04 17:54 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-04 19:15 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-05 00:36 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-05 15:48 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-05 18:17 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-05 23:47 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-06 00:07 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-06 00:17 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-06 00:12 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-06 00:35 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-06 00:37 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-06 08:33 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-06 11:58 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-06 15:52 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-06 16:29 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-07 00:15 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-07 08:51 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-07 09:43 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-07 10:01 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-08 09:06 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" "Peter J. Holzer" <hjp-usenet3@hjp.at> - 2023-06-06 00:35 +0200
                Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-06 00:40 +0200
        Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-28 23:14 +0200
          Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-05-29 10:25 +0200
  Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-07 12:39 +0200
    Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Andreas Borutta <borumat@gmx.de> - 2023-06-08 09:16 +0200

csiph-web