Path: csiph.com!news.mixmin.net!eternal-september.org!news.eternal-september.org!.POSTED!not-for-mail From: Andreas Borutta Newsgroups: de.comp.lang.javascript Subject: Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Date: Sun, 28 May 2023 00:36:59 +0200 Organization: A noiseless patient Spider Lines: 128 Message-ID: <10ete9dqz19k2$.dlg@borumat.de> References: <15w1w7buq1bbf$.dlg@borumat.de> <14jvgfoghdlhe$.dlg@borumat.de> MIME-Version: 1.0 Content-Type: text/plain; charset="iso-8859-1" Content-Transfer-Encoding: 8bit Injection-Info: dont-email.me; posting-host="1d9a510abc21a956ece581cb8b032c16"; logging-data="606323"; mail-complaints-to="abuse@eternal-september.org"; posting-account="U2FsdGVkX19xxGqx3ILdE7A3YEKVWDy5PHdaP95nydI=" User-Agent: 40tude_Dialog/2.0.15.41de (a5d2612c.3.492) Cancel-Lock: sha1:vpn0PzjpYFOyOFYGb6BgIjADpyA= Xref: csiph.com de.comp.lang.javascript:5367 Stefan Ram: > Andreas Borutta writes: >>Das Skript funktionierte nicht mit mehr als einem

. Daher habe ich >>erstmal die
eingefügt. >>Falls Du noch Muße hast, füge doch bitte noch eine Option zum Ersetzen >>der anderen Leerzeichen ein. > > Dieses Skript hier ersetzt auch in mehreren Absätzen. Allerdings > kann es sein, daß die hier eingesetzte Technik bei anderem > oder komplizierterem Aufbau des Dokuments doch versagt. Gäbe es denn andere Techniken, die vorhersagbar zuverlässig bei umfangreichem und komplexem HTML sind? Wichtig wäre auch, dass es nicht mit anderen JS kollidiert. Wir setzen z.B. MathJax für hochwertigen Formelsatz ein. https://de.wikipedia.org/wiki/MathJax Das produziert gewaltige Mengen Markup. https://borumat.de/-/fahrradzukunft/mathjax-latex Ideal wäre es, wenn die Technik des Skriptes (wir könnten es "invisibles.js" nennen) z.B. erlaubt Elemente (und ihre Kinder) auszuschließen. > Jetzt werden auch "202F" und "2009" modifiziert. Dabei sucht das > Skript entweder nach numerischen Entitätsreferenzen genau der > angegebenen Form oder nach den entsprechenden Unicode-Zeichen. > Es würde also Varianten von Entitätsreferenzen nicht finden. > > lang="de" xml:lang="de"> > Programm 2023-05-27T19:59 >

Durch die Verwendung nicht-trennbarer > Leerzeichen heben wir uns deutlich von anderen Radfahrer-Magazinen > ab.

Durch die Verwendung nicht-trennbarer > Leerzeichen heben wir uns deutlich von anderen Radfahrer-Magazinen > ab.

Nach Kursivschrif  wird noch etwas Leerraum > hinzugefügt

Subtile Veränderungen erleichtern das Lesen > des Wortes "Schiff fahrt".

Ich verstehe den Code mangels Kenntnissen nicht, sehe aber, dass "" dreimal vorkommt. Das erschwert etwas die Wartbarkeit. Ich schrieb ja im letzten Posting, dass ich "Custom Elements" verwende, statt "", weil das die moderne, prägnantere und besser lesbare Technik ist. Und auch für die Wartbarkeit und Lesbarkeit des Skriptes bezüglich der verschiedenen Leerzeichen, wäre es ideal, wenn jedes Leerzeichen ein anderes "Custom Element" bekommen kann. Denn sonst wären sie ja nicht mehr unterscheidbar. IMHO sowas in der Art: // Nicht anwenden in diesen Elementen: // mjx-container [Skriptcode] // Unicode: U+00A0 // Name: NO-BREAK SPACE // Entity:   // HTML Custom Element: [Skriptcode] // Unicode: U+202F // Name: NARROW NO-BREAK SPACE // Entity:   // Custom Element: [Skriptcode] // Unicode: U+2009 // Name: THIN SPACE // Entity:   // Custom Element: [Skriptcode] Was denkst Du bitte zu diesen Ideen? Andreas -- http://fahrradzukunft.de