Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]


Groups > fr.comp.lang.python > #4066

Re: XML : texte en forme de balise

From Olivier Miakinen <om+news@miakinen.net>
Newsgroups fr.comp.lang.python
Subject Re: XML : texte en forme de balise
Date 2023-05-25 17:35 +0200
Organization There's no cabale
Message-ID <u4nv8f$188f$1@cabale.usenet-fr.net> (permalink)
References <0b2d9848-ac47-41fe-8400-debbb3968e4en@googlegroups.com>

Show all headers | View raw


Le 25/05/2023 15:58, pata...@gmail.com a écrit :
> 
> j'ai cette chaîne de caractères à traiter "<a><b>this is <bad> tag text</b></a>".
> 
> du fait de la présence de "<bad>", xml.etree.ElementTree.fromstring() échoue
> à traiter la chaîne : comment puis-je préciser à xml.etree.ElementTree que
> <bad> n'est pas une balise ou inversement lui demander de ne considérer que
> les balises a et b ?

Je n'ai pas la réponse à ta question parce que je n'utilise pas ces fonctions.
Mais par curiosité, est-ce que ça fonctionne si tu remplaces « <bad> » par
« <bad/> ».

Question subsidiaire, existe-t-il des fonctions qui traitent du texte formaté
en tant que HTML plutôt que XML ? Ça pourrait être une solution, puisque le
formalisme de HTML est moins rigide que celui de XML.

-- 
Olivier Miakinen

Back to fr.comp.lang.python | Previous | NextPrevious in thread | Next in thread | Find similar


Thread

XML : texte en forme de balise "pata...@gmail.com" <patatetom@gmail.com> - 2023-05-25 06:58 -0700
  Re: XML : texte en forme de balise Olivier Miakinen <om+news@miakinen.net> - 2023-05-25 17:35 +0200
    Re: XML : texte en forme de balise "pata...@gmail.com" <patatetom@gmail.com> - 2023-05-26 00:04 -0700
      Re: XML : texte en forme de balise Damien Wyart <damien.wyart@free.fr> - 2023-05-26 19:12 +0200
        Re: XML : texte en forme de balise Olivier Miakinen <om+news@miakinen.net> - 2023-05-26 22:34 +0200
      Re: XML : texte en forme de balise Olivier Miakinen <om+news@miakinen.net> - 2023-05-26 22:32 +0200

csiph-web