Path: csiph.com!fu-berlin.de!uni-berlin.de!individual.net!not-for-mail From: Hermann Riemann Newsgroups: de.comp.lang.python Subject: =?UTF-8?Q?Re=3a_=5bPython-de=5d_Re=3a_HTML-Datei_auslesen=2c_=c3=a4?= =?UTF-8?Q?ndern=2c_schreiben_der_Code_ist_onBlock?= Date: Wed, 8 Oct 2025 21:09:29 +0200 Lines: 20 Message-ID: References: <200506301938.40501.deets@web.de> <175992026222.32353.4136918700892360340@mail.python.org> Mime-Version: 1.0 Content-Type: text/plain; charset=utf-8; format=flowed Content-Transfer-Encoding: 8bit X-Trace: individual.net y5S6p1BQhfsf+7u7Fje1fAuBCrB9Tt05vVxOE2WMh1h4FG42Cn Cancel-Lock: sha1:2oE0TI7cAb7ac88djG6yX0CI0d4= sha256:Je6M+VWKUkxu0DUVBXhIY/MuRwVr28XpjiZFb1kzB+c= User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:68.0) Gecko/20100101 Thunderbird/68.2.1 In-Reply-To: <175992026222.32353.4136918700892360340@mail.python.org> Content-Language: de-DE Xref: csiph.com de.comp.lang.python:6314 Am 08.10.25 um 12:44 schrieb Sukri Jusuf: > Danke für die Erklärung, das hilft, das Verhalten des Parsers besser zu verstehen. > Ich arbeite aktuell an der Strukturierung eines Lexikons, in dem unter anderem Begriffe wie > Suchmaschinenoptimierung (https://www.sumasearch.ch/lexikon/definition-suchmaschinenoptimierung/ > ) > technisch und inhaltlich sauber aufbereitet werden sollen. > > Mir ging es dabei vor allem um die Frage, ob man bei automatisch generiertem HTML den ursprünglichen Whitespace gezielt erhalten kann, um den Quellcode lesbarer zu halten, ohne das Parsing oder Rendering zu beeinträchtigen. > Der Hinweis auf Pretty-Printer war hilfreich; ich teste verschiedene Ansätze (z. B. html.parser und lxml) > und freue mich über Beispiele, wie sich Whitespace gezielt steuern lässt. Für html Seiten Erzeugung ( aus html-Vorlagen ) verwende ich eigene Python Programme. Wenn ich die ursprünglichen Whitespace erhalten wollte, würde ich ein entsprechend   vom Programm einbauen lassen. -- bzw.: