Groups | Search | Server Info | Keyboard shortcuts | Login | Register


Groups > cz.comp.lang.python > #3365

Re: [python] xml parsování

From Petr Messner <petr.messner@gmail.com>
Subject Re: [python] xml parsování
Newsgroups cz.comp.lang.python
Message-ID <mailman.13.1565694349.5720.python@py.cz> (permalink)
References <6ot.DzVH.657}E95Dld6.1TKbRh@seznam.cz> <CAK9Q5BT2AzSfg2tQomMiWstaQUqved1hH5Yw4dE6YXP5kSyhig@mail.gmail.com> <CAAEb_Q0jT26UfPA9vV_Jgf8=TcNxpzbSmzrs857NcQWtE2euyg@mail.gmail.com> <6B8BDAAB-4F03-404F-9288-972742AE194D@gmail.com>
Organization usenet-news.net
Date 2019-08-13 13:05 +0200

Show all headers | View raw


Jak jako vadný tag? Potom to není XML.

Na HTML použij HTML parser. 

Petr Messner

13. 8. 2019 v 11:30, Ondrej Beranek <rainbof@gmail.com>:

> Ahoj,
> 
> když jste to tu tak nakousli, když bych chtěl zpracovávat xml streamy
> předem neznámého obsahu, co na to použít ? Potřebuju aby se to
> nesložilo když přijde nějaký vadný tag abych měl šanci si to ošetřit.
> Tak než začnu psát kolo...
> 
> rainbof
> 
> 13.08.19, Petr Messner <petr.messner@gmail.com>:
>> V těchto případech je asi nejednodušší xpath. Minimálně lxml ho umí.
>> 
>> PM
>> 
>> út 13. 8. 2019 v 8:22 odesílatel Ctibor.Plasek <Ctibor.Plasek@seznam.cz>
>> napsal:
>> 
>>> Ahoj.
>>> Mám takovýto xml soubor (viz.přiložený soubor)  - export z ffprobe.
>>> Pro ty hodnoty, které jsou u <stream používám toto:
>>> 
>>> from xml.dom import minidom
>>> xmldoc = minidom.parse('RainS02E06.mkv.xml')
>>> streamlist = xmldoc.getElementsByTagName('stream')
>>> for s in streamlist:
>>>    print(s.attributes['index'].value)
>>>    print(s.attributes['codec_name'].value)
>>>    try:
>>>        print(s.attributes['sample_rate'].value)
>>>    except:
>>>        print('none')
>>> 
>>> ale nevím jakým způsobem se dostat k těm "hlubším" hodnotám - např.
>>> <tag key="DURATION-eng" - jaká je např.hodnota value u stream index="1"
>>> 
>>> Mohli byste mi, prosím, poradit?
>>> 
>>> Děkuji Ctibor
>>> 
>>> 
>>> 
>>> 
>>> _______________________________________________
>>> Python mailing list
>>> python@py.cz
>>> http://www.py.cz/mailman/listinfo/python
>>> 
>>> Visit: http://www.py.cz
>>> 
>> 
> _______________________________________________
> Python mailing list
> python@py.cz
> http://www.py.cz/mailman/listinfo/python
> 
> Visit: http://www.py.cz

Back to cz.comp.lang.python | Previous | Next | Find similar


Thread

Re: [python] xml parsování Petr Messner <petr.messner@gmail.com> - 2019-08-13 13:05 +0200

csiph-web