Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]


Groups > de.comp.lang.python > #6313

[Python-de] Re: HTML-Datei auslesen, ändern, schreiben der Code ist onBlock

Path csiph.com!fu-berlin.de!uni-berlin.de!not-for-mail
From "Sukri Jusuf" <sj@sumasearch.de>
Newsgroups de.comp.lang.python
Subject [Python-de] Re: HTML-Datei auslesen, ändern, schreiben der Code ist onBlock
Date Wed, 08 Oct 2025 10:44:22 -0000
Lines 12
Message-ID <175992026222.32353.4136918700892360340@mail.python.org> (permalink)
References <200506301938.40501.deets@web.de>
Mime-Version 1.0
Content-Type text/plain; charset="utf-8"
Content-Transfer-Encoding 8bit
X-Trace news.uni-berlin.de DL61bCgh4k6XGeXKX3Gvxg7sbbMbsDcBnhONjsI8W2/A==
Cancel-Lock sha1:xOpwcng7LLvD/C+dGu2klOV50PU= sha256:It05IPlM5dc4c5skMLnw0perh3A9KbmqKDUTUnrZ/1s=
Delivered-To python-de@x.python.org
Authentication-Results mail.python.org; dkim=none reason="no signature"; dkim-adsp=none (unprotected policy); dkim-atps=neutral
In-Reply-To <200506301938.40501.deets@web.de>
User-Agent HyperKitty on https://mail.python.org/
X-MailFrom sj@sumasearch.de
X-Mailman-Rule-Hits member-moderation
X-Mailman-Rule-Misses dmarc-mitigation; no-senders; approved; loop; banned-address; header-match-python-de.python.org-0; emergency
Message-ID-Hash 2YBCHI53I4NN2H7RHWBHIFW6VDKIKSNE
X-Message-ID-Hash 2YBCHI53I4NN2H7RHWBHIFW6VDKIKSNE
X-Mailman-Approved-At Wed, 08 Oct 2025 13:20:27 -0400
X-Mailman-Version 3.3.11b1
Precedence list
List-Id Die Deutsche Python Mailingliste <python-de.python.org>
Archived-At <https://mail.python.org/archives/list/python-de@python.org/message/2YBCHI53I4NN2H7RHWBHIFW6VDKIKSNE/>
List-Archive <https://mail.python.org/archives/list/python-de@python.org/>
List-Help <mailto:python-de-request@python.org?subject=help>
List-Owner <mailto:python-de-owner@python.org>
List-Post <mailto:python-de@python.org>
List-Subscribe <mailto:python-de-join@python.org>
List-Unsubscribe <mailto:python-de-leave@python.org>
Xref csiph.com de.comp.lang.python:6313

Show key headers only | View raw


Danke für die Erklärung, das hilft, das Verhalten des Parsers besser zu verstehen.
Ich arbeite aktuell an der Strukturierung eines Lexikons, in dem unter anderem Begriffe wie
Suchmaschinenoptimierung (https://www.sumasearch.ch/lexikon/definition-suchmaschinenoptimierung/
)
technisch und inhaltlich sauber aufbereitet werden sollen.

Mir ging es dabei vor allem um die Frage, ob man bei automatisch generiertem HTML den ursprünglichen Whitespace gezielt erhalten kann, um den Quellcode lesbarer zu halten, ohne das Parsing oder Rendering zu beeinträchtigen.
Der Hinweis auf Pretty-Printer war hilfreich; ich teste verschiedene Ansätze (z. B. html.parser und lxml)
und freue mich über Beispiele, wie sich Whitespace gezielt steuern lässt.

Viele Grüsse
Šukri Jusuf

Back to de.comp.lang.python | Previous | NextNext in thread | Find similar


Thread

[Python-de] Re: HTML-Datei auslesen, ändern, schreiben der Code ist onBlock "Sukri Jusuf" <sj@sumasearch.de> - 2025-10-08 10:44 +0000
  Re: [Python-de] Re: HTML-Datei auslesen, ändern, schreiben der Code ist onBlock Hermann Riemann <nospam.ng@hermann-riemann.de> - 2025-10-08 21:09 +0200
    [Python-de] Re: HTML-Datei auslesen, ändern, schreiben der Code ist onBlock "<a>b</a> " <blakecopelanddev@gmail.com> - 2025-11-06 07:48 +0000

csiph-web