Programm 2023-05-27T19:59

Path: csiph.com!news.mixmin.net!eternal-september.org!news.eternal-september.org!.POSTED!not-for-mail From: Andreas Borutta Newsgroups: de.comp.lang.javascript Subject: Re: Bestimmte Unicodezeichen in HTML finden und "behandeln" Date: Sun, 28 May 2023 00:36:59 +0200 Organization: A noiseless patient Spider Lines: 128 Message-ID: <10ete9dqz19k2$.dlg@borumat.de> References: <15w1w7buq1bbf$.dlg@borumat.de>

<14jvgfoghdlhe$.dlg@borumat.de> MIME-Version: 1.0 Content-Type: text/plain; charset="iso-8859-1" Content-Transfer-Encoding: 8bit Injection-Info: dont-email.me; posting-host="1d9a510abc21a956ece581cb8b032c16"; logging-data="606323"; mail-complaints-to="abuse@eternal-september.org"; posting-account="U2FsdGVkX19xxGqx3ILdE7A3YEKVWDy5PHdaP95nydI=" User-Agent: 40tude_Dialog/2.0.15.41de (a5d2612c.3.492) Cancel-Lock: sha1:vpn0PzjpYFOyOFYGb6BgIjADpyA= Xref: csiph.com de.comp.lang.javascript:5367 Stefan Ram: > Andreas Borutta writes: >>Das Skript funktionierte nicht mit mehr als einem

. Daher habe ich >>erstmal die
eingef�gt. >>Falls Du noch Mu�e hast, f�ge doch bitte noch eine Option zum Ersetzen >>der anderen Leerzeichen ein. > > Dieses Skript hier ersetzt auch in mehreren Abs�tzen. Allerdings > kann es sein, da� die hier eingesetzte Technik bei anderem > oder komplizierterem Aufbau des Dokuments doch versagt. G�be es denn andere Techniken, die vorhersagbar zuverl�ssig bei umfangreichem und komplexem HTML sind? Wichtig w�re auch, dass es nicht mit anderen JS kollidiert. Wir setzen z.B. MathJax f�r hochwertigen Formelsatz ein. https://de.wikipedia.org/wiki/MathJax Das produziert gewaltige Mengen Markup. https://borumat.de/-/fahrradzukunft/mathjax-latex Ideal w�re es, wenn die Technik des Skriptes (wir k�nnten es "invisibles.js" nennen) z.B. erlaubt Elemente (und ihre Kinder) auszuschlie�en. > Jetzt werden auch "202F" und "2009" modifiziert. Dabei sucht das > Skript entweder nach numerischen Entit�tsreferenzen genau der > angegebenen Form oder nach den entsprechenden Unicode-Zeichen. > Es w�rde also Varianten von Entit�tsreferenzen nicht finden. > > lang="de" xml:lang="de"> > Programm 2023-05-27T19:59 >

Durch die Verwendung nicht-trennbarer > Leerzeichen heben wir uns deutlich von anderen Radfahrer-Magazinen > ab.

Nach Kursivschrif  wird noch etwas Leerraum > hinzugefügt

Subtile Veränderungen erleichtern das Lesen > des Wortes "Schiff fahrt".

Ich verstehe den Code mangels Kenntnissen nicht, sehe aber, dass "" dreimal vorkommt. Das erschwert etwas die Wartbarkeit. Ich schrieb ja im letzten Posting, dass ich "Custom Elements" verwende, statt "", weil das die moderne, pr�gnantere und besser lesbare Technik ist. Und auch f�r die Wartbarkeit und Lesbarkeit des Skriptes bez�glich der verschiedenen Leerzeichen, w�re es ideal, wenn jedes Leerzeichen ein anderes "Custom Element" bekommen kann. Denn sonst w�ren sie ja nicht mehr unterscheidbar. IMHO sowas in der Art: // Nicht anwenden in diesen Elementen: // mjx-container [Skriptcode] // Unicode: U+00A0 // Name: NO-BREAK SPACE // Entity: // HTML Custom Element: [Skriptcode] // Unicode: U+202F // Name: NARROW NO-BREAK SPACE // Entity:   // Custom Element: [Skriptcode] // Unicode: U+2009 // Name: THIN SPACE // Entity: // Custom Element: [Skriptcode] Was denkst Du bitte zu diesen Ideen? Andreas -- http://fahrradzukunft.de