Path: csiph.com!fu-berlin.de!uni-berlin.de!individual.net!not-for-mail
From: Hermann Riemann <nospam.ng@hermann-riemann.de>
Newsgroups: de.comp.lang.python
Subject: =?UTF-8?Q?Re=3a_=5bPython-de=5d_Re=3a_HTML-Datei_auslesen=2c_=c3=a4?= =?UTF-8?Q?ndern=2c_schreiben_der_Code_ist_onBlock?=
Date: Wed, 8 Oct 2025 21:09:29 +0200
Lines: 20
Message-ID: <mknr79F3edlU1@mid.individual.net>
References: <200506301938.40501.deets@web.de> <175992026222.32353.4136918700892360340@mail.python.org>
Mime-Version: 1.0
Content-Type: text/plain; charset=utf-8; format=flowed
Content-Transfer-Encoding: 8bit
X-Trace: individual.net y5S6p1BQhfsf+7u7Fje1fAuBCrB9Tt05vVxOE2WMh1h4FG42Cn
Cancel-Lock: sha1:2oE0TI7cAb7ac88djG6yX0CI0d4= sha256:Je6M+VWKUkxu0DUVBXhIY/MuRwVr28XpjiZFb1kzB+c=
User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:68.0) Gecko/20100101 Thunderbird/68.2.1
In-Reply-To: <175992026222.32353.4136918700892360340@mail.python.org>
Content-Language: de-DE
Xref: csiph.com de.comp.lang.python:6314

Am 08.10.25 um 12:44 schrieb Sukri Jusuf:
> Danke für die Erklärung, das hilft, das Verhalten des Parsers besser zu verstehen.
> Ich arbeite aktuell an der Strukturierung eines Lexikons, in dem unter anderem Begriffe wie
> Suchmaschinenoptimierung (https://www.sumasearch.ch/lexikon/definition-suchmaschinenoptimierung/
> )
> technisch und inhaltlich sauber aufbereitet werden sollen.
> 
> Mir ging es dabei vor allem um die Frage, ob man bei automatisch generiertem HTML den ursprünglichen Whitespace gezielt erhalten kann, um den Quellcode lesbarer zu halten, ohne das Parsing oder Rendering zu beeinträchtigen.
> Der Hinweis auf Pretty-Printer war hilfreich; ich teste verschiedene Ansätze (z. B. html.parser und lxml)
> und freue mich über Beispiele, wie sich Whitespace gezielt steuern lässt.

Für html Seiten Erzeugung ( aus html-Vorlagen )
verwende ich eigene Python Programme.

Wenn ich die ursprünglichen Whitespace erhalten wollte,
würde ich ein entsprechend &nbsp; vom  Programm einbauen lassen.

-- 
<http://www.hermann-riemann.de> bzw.:
<https://www.hermann-riemann.eu/de>