Groups | Search | Server Info | Keyboard shortcuts | Login | Register


Groups > cz.comp.lang.python > #3365

Re: [python] xml parsování

Path csiph.com!news.dns-netz.com!news.freedyn.net!newsreader4.netcologne.de!news.netcologne.de!peer02.ams1!peer.ams1.xlned.com!news.xlned.com!peer02.am4!peer.am4.highwinds-media.com!news.highwinds-media.com!fx12.am4.POSTED!not-for-mail
Received-SPF none (Address does not pass the Sender Policy Framework) SPF=HELO; sender=mail-wm1-f44.google.com; remoteip=::ffff:209.85.128.44; remotehost=; helo=mail-wm1-f44.google.com; receiver=hugo.zagamma.cz;
Received-SPF pass (Address passes the Sender Policy Framework) SPF=MAILFROM; sender=petr.messner@gmail.com; remoteip=::ffff:209.85.128.44; remotehost=; helo=mail-wm1-f44.google.com; receiver=hugo.zagamma.cz;
DKIM-Signature v=1; a=rsa-sha256; c=relaxed/relaxed; d=gmail.com; s=20161025; h=from:content-transfer-encoding:mime-version:date:subject:message-id :references:in-reply-to:to; bh=p1pKmMmck5/85bq0OO2nbJzWNRLixbyWQU3bpbspnPQ=; b=cZwBQBKK1ZdTCrMjUBhqoatE3007ZMtJG7jSzEXmKjOBSPCfuhFWXmD+Qfwr8F5R6x LUL0Jc736qhwLxixuaLb7F2j3IEJbkDZZZZ/NC6ACsQiBCIJIZ7Lqu1HJcDA5WZk/Pxb mUSQLK1AVdyR02awRy0yP++2Fao8zfk8KQvnTb6UzE3pPBxT6mNehH5h3h7YDAleJEGA k4b+PtR9afLsK3OTHukI2M3FqXBdWuIYqrx6E0Ppg/hh0SuPYWgJ4glerkiJ1ehC52OY EY811JWs0BBJoLG4VuYVvALOPWwJT5n8RiYVvqGqILjbPnAQzrwdcoy+iO6pVEhMfUhC x5/A==
X-Google-DKIM-Signature v=1; a=rsa-sha256; c=relaxed/relaxed; d=1e100.net; s=20161025; h=x-gm-message-state:from:content-transfer-encoding:mime-version:date :subject:message-id:references:in-reply-to:to; bh=p1pKmMmck5/85bq0OO2nbJzWNRLixbyWQU3bpbspnPQ=; b=B/02XYK28Wvm40Uxx/1caH8qXEbSeavg1e4L5ZSjh/YT2DvmzrwlkVFS43udiIEC7I EqjnhPpCi9kruYpvLBFBS7wAyYqvtATFS1QpbzeKCS1RXjb9nJnLMX+OebZJRDI5cXtk 1/+kXeCbI5L6Rf2tq3kIH9GmTAuz3tokSxxK/tOIydUfjiAlARJBu+8W4lQxA4wdJpVr HzDxn0tDfq/T5E8xqb55rO9UVgYFHDoh+OTfik9g5/JiYLKae/S3QzjF997zqkqM8/Mi +0zadz6+n4jS7P69Q3UoQfF8UHjUIzHsuu21LWRI98V0L8jj1zHIB5rnxrJsYnImKswy WFaQ==
X-Gm-Message-State APjAAAX3ZEufVmMXCfB455eUAgwTqok7LJnHKPD2eLESvm6CMDTCs3MS gEmJ6CYyp9kr60p6wNH2I11nXkTF7Qw=
X-Google-Smtp-Source APXvYqxkx4AP9QPeA99mvO6+ZqqZuCSwdm7KFyEvDdXq3Eos/lFyd9+P0wS5jkyyGnLsifdtTfwFcA==
X-Received by 2002:a1c:2d4:: with SMTP id 203mr2503402wmc.105.1565694347278; Tue, 13 Aug 2019 04:05:47 -0700 (PDT)
Old-Return-Path <petr.messner@gmail.com>
From Petr Messner <petr.messner@gmail.com>
Content-Type text/plain; charset=utf-8
Content-Transfer-Encoding quoted-printable
Mime-Version 1.0 (1.0)
In-Reply-To <CAAEb_Q0jT26UfPA9vV_Jgf8=TcNxpzbSmzrs857NcQWtE2euyg@mail.gmail.com>
X-Mailer iPhone Mail (16G77)
Subject Re: [python] xml parsování
X-BeenThere python@py.cz
X-Mailman-Version 2.1.29
Precedence list
List-Id Konference PyCZ <python.py.cz>
List-Unsubscribe <http://www.py.cz/mailman/options/python>, <mailto:python-request@py.cz?subject=unsubscribe>
List-Archive <http://www.py.cz/pipermail/python/>
List-Post <mailto:python@py.cz>
List-Help <mailto:python-request@py.cz?subject=help>
List-Subscribe <http://www.py.cz/mailman/listinfo/python>, <mailto:python-request@py.cz?subject=subscribe>
Newsgroups cz.comp.lang.python
Message-ID <mailman.13.1565694349.5720.python@py.cz> (permalink)
X-Mailman-Original-Message-ID <6B8BDAAB-4F03-404F-9288-972742AE194D@gmail.com>
X-Mailman-Original-References <6ot.DzVH.657}E95Dld6.1TKbRh@seznam.cz> <CAK9Q5BT2AzSfg2tQomMiWstaQUqved1hH5Yw4dE6YXP5kSyhig@mail.gmail.com> <CAAEb_Q0jT26UfPA9vV_Jgf8=TcNxpzbSmzrs857NcQWtE2euyg@mail.gmail.com>
References <6ot.DzVH.657}E95Dld6.1TKbRh@seznam.cz> <CAK9Q5BT2AzSfg2tQomMiWstaQUqved1hH5Yw4dE6YXP5kSyhig@mail.gmail.com> <CAAEb_Q0jT26UfPA9vV_Jgf8=TcNxpzbSmzrs857NcQWtE2euyg@mail.gmail.com> <6B8BDAAB-4F03-404F-9288-972742AE194D@gmail.com>
Lines 72
X-Complaints-To abuse@usenet-news.net
NNTP-Posting-Date Tue, 13 Aug 2019 11:05:50 UTC
Organization usenet-news.net
Date Tue, 13 Aug 2019 13:05:45 +0200
X-Received-Bytes 5956
X-Received-Body-CRC 3889478066
Xref csiph.com cz.comp.lang.python:3365

Show key headers only | View raw


Jak jako vadný tag? Potom to není XML.

Na HTML použij HTML parser. 

Petr Messner

13. 8. 2019 v 11:30, Ondrej Beranek <rainbof@gmail.com>:

> Ahoj,
> 
> když jste to tu tak nakousli, když bych chtěl zpracovávat xml streamy
> předem neznámého obsahu, co na to použít ? Potřebuju aby se to
> nesložilo když přijde nějaký vadný tag abych měl šanci si to ošetřit.
> Tak než začnu psát kolo...
> 
> rainbof
> 
> 13.08.19, Petr Messner <petr.messner@gmail.com>:
>> V těchto případech je asi nejednodušší xpath. Minimálně lxml ho umí.
>> 
>> PM
>> 
>> út 13. 8. 2019 v 8:22 odesílatel Ctibor.Plasek <Ctibor.Plasek@seznam.cz>
>> napsal:
>> 
>>> Ahoj.
>>> Mám takovýto xml soubor (viz.přiložený soubor)  - export z ffprobe.
>>> Pro ty hodnoty, které jsou u <stream používám toto:
>>> 
>>> from xml.dom import minidom
>>> xmldoc = minidom.parse('RainS02E06.mkv.xml')
>>> streamlist = xmldoc.getElementsByTagName('stream')
>>> for s in streamlist:
>>>    print(s.attributes['index'].value)
>>>    print(s.attributes['codec_name'].value)
>>>    try:
>>>        print(s.attributes['sample_rate'].value)
>>>    except:
>>>        print('none')
>>> 
>>> ale nevím jakým způsobem se dostat k těm "hlubším" hodnotám - např.
>>> <tag key="DURATION-eng" - jaká je např.hodnota value u stream index="1"
>>> 
>>> Mohli byste mi, prosím, poradit?
>>> 
>>> Děkuji Ctibor
>>> 
>>> 
>>> 
>>> 
>>> _______________________________________________
>>> Python mailing list
>>> python@py.cz
>>> http://www.py.cz/mailman/listinfo/python
>>> 
>>> Visit: http://www.py.cz
>>> 
>> 
> _______________________________________________
> Python mailing list
> python@py.cz
> http://www.py.cz/mailman/listinfo/python
> 
> Visit: http://www.py.cz

Back to cz.comp.lang.python | Previous | Next | Find similar


Thread

Re: [python] xml parsování Petr Messner <petr.messner@gmail.com> - 2019-08-13 13:05 +0200

csiph-web