Groups | Search | Server Info | Keyboard shortcuts | Login | Register
Groups > de.comp.lang.python > #6314
| From | Hermann Riemann <nospam.ng@hermann-riemann.de> |
|---|---|
| Newsgroups | de.comp.lang.python |
| Subject | Re: [Python-de] Re: HTML-Datei auslesen, ändern, schreiben der Code ist onBlock |
| Date | 2025-10-08 21:09 +0200 |
| Message-ID | <mknr79F3edlU1@mid.individual.net> (permalink) |
| References | <200506301938.40501.deets@web.de> <175992026222.32353.4136918700892360340@mail.python.org> |
Am 08.10.25 um 12:44 schrieb Sukri Jusuf: > Danke für die Erklärung, das hilft, das Verhalten des Parsers besser zu verstehen. > Ich arbeite aktuell an der Strukturierung eines Lexikons, in dem unter anderem Begriffe wie > Suchmaschinenoptimierung (https://www.sumasearch.ch/lexikon/definition-suchmaschinenoptimierung/ > ) > technisch und inhaltlich sauber aufbereitet werden sollen. > > Mir ging es dabei vor allem um die Frage, ob man bei automatisch generiertem HTML den ursprünglichen Whitespace gezielt erhalten kann, um den Quellcode lesbarer zu halten, ohne das Parsing oder Rendering zu beeinträchtigen. > Der Hinweis auf Pretty-Printer war hilfreich; ich teste verschiedene Ansätze (z. B. html.parser und lxml) > und freue mich über Beispiele, wie sich Whitespace gezielt steuern lässt. Für html Seiten Erzeugung ( aus html-Vorlagen ) verwende ich eigene Python Programme. Wenn ich die ursprünglichen Whitespace erhalten wollte, würde ich ein entsprechend vom Programm einbauen lassen. -- <http://www.hermann-riemann.de> bzw.: <https://www.hermann-riemann.eu/de>
Back to de.comp.lang.python | Previous | Next — Previous in thread | Next in thread | Find similar
[Python-de] Re: HTML-Datei auslesen, ändern, schreiben der Code ist onBlock "Sukri Jusuf" <sj@sumasearch.de> - 2025-10-08 10:44 +0000
Re: [Python-de] Re: HTML-Datei auslesen, ändern, schreiben der Code ist onBlock Hermann Riemann <nospam.ng@hermann-riemann.de> - 2025-10-08 21:09 +0200
[Python-de] Re: HTML-Datei auslesen, ändern, schreiben der Code ist onBlock "<a>b</a> " <blakecopelanddev@gmail.com> - 2025-11-06 07:48 +0000
csiph-web