Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]


Groups > cz.comp.lang.python > #3367

Re: [python] xml parsování

Path csiph.com!newsfeed.xs4all.nl!newsfeed9.news.xs4all.nl!85.12.16.69.MISMATCH!peer02.ams1!peer.ams1.xlned.com!news.xlned.com!peer03.am4!peer.am4.highwinds-media.com!news.highwinds-media.com!fx27.am4.POSTED!not-for-mail
Received-SPF none (Address does not pass the Sender Policy Framework) SPF=HELO; sender=mail-wm1-f46.google.com; remoteip=::ffff:209.85.128.46; remotehost=; helo=mail-wm1-f46.google.com; receiver=hugo.zagamma.cz;
Received-SPF pass (Address passes the Sender Policy Framework) SPF=MAILFROM; sender=petr.messner@gmail.com; remoteip=::ffff:209.85.128.46; remotehost=; helo=mail-wm1-f46.google.com; receiver=hugo.zagamma.cz;
DKIM-Signature v=1; a=rsa-sha256; c=relaxed/relaxed; d=gmail.com; s=20161025; h=from:content-transfer-encoding:mime-version:date:subject:message-id :references:in-reply-to:to; bh=C1w7R0S5pCqRv6KFlUnh9Fbrzm32dAqkEkGgbNG5fYg=; b=RUmFxl2pJPZusgUWb7EHtosw/6z+ejndRauIxtVuGOghdWH2TfjEOWqOeyMDZlTMPA 6B81qUYjoYNA1Ia80m+meioVO6WrgYB01ndyMNnh5dhmCBDLM3m9bNcWBDrmIeZbh62r tsfwcLD65ukN23F5OA1E1TwW7M1HUjFS1eEmAxKa6Dap9hJNs0LRZnjHEW55/+onYm32 JNZmeWL3hXWeULgYrua9R3l2AM+3yKuOzNa6qTJqfpfPGRAgczUCrjnqts+ZchZgc/M8 CCjRIIWHhqqDEWBAT7Slg20yTQs47L93QI2t7skwE5Z/BD3A8je3VbV93eDqFnILqt6b 8zfQ==
X-Google-DKIM-Signature v=1; a=rsa-sha256; c=relaxed/relaxed; d=1e100.net; s=20161025; h=x-gm-message-state:from:content-transfer-encoding:mime-version:date :subject:message-id:references:in-reply-to:to; bh=C1w7R0S5pCqRv6KFlUnh9Fbrzm32dAqkEkGgbNG5fYg=; b=qTpeDCWFtskFyVA5bdramW9Me/0SKWzdQOXW1XSf81GwgjKOBwPxxWwHEq4AhNgRj1 S4MtmXIvXtQC8wSPmFzyt+Cd0qSsc+vctm3tKUllIC9E8yB8Uy7GW2BPTl/oZa4WRf7H frSPH/bsnkVBvS7KgIo3vfRKX0sN89v7tJCo2/Qcl8dYEteZ4GalhWt/6khynQhm7qOu JTYPU8oauIdi8Yiijig/VeY/r5CtDGRWNQPLXeou5jfzEYn6LzDkR59xa6DLQ5qzNSaa I3LyZjpJIHmjH/rVMpaExAE6oWNUnZDDG108B8xOhngB+d1XpQm2otZdCdrl2g1TTZUD bWAQ==
X-Gm-Message-State APjAAAUS40TCO+xmUF6pYGqq5+wPb1k2ONJhnefbnTWr1OlJB9464iar AsZisOZE039DUEgr8OaBEPnFJrEBoyg=
X-Google-Smtp-Source APXvYqw0bCnMYDZQnytScQJPrvwqo9oYDDf3HPHlFr9f1/F6PrzHWo3fLzT3tf3DeMh9EPCvmxABbA==
X-Received by 2002:a7b:c929:: with SMTP id h9mr4864211wml.1.1565722173694; Tue, 13 Aug 2019 11:49:33 -0700 (PDT)
Old-Return-Path <petr.messner@gmail.com>
From Petr Messner <petr.messner@gmail.com>
Content-Type text/plain; charset=utf-8
Content-Transfer-Encoding quoted-printable
Mime-Version 1.0 (1.0)
In-Reply-To <CAAEb_Q0yh+c7qDRswO86r6++EWJiNRgNVgQ=2d3=x5bbvhrHZg@mail.gmail.com>
X-Mailer iPhone Mail (16G77)
Subject Re: [python] xml parsování
X-BeenThere python@py.cz
X-Mailman-Version 2.1.29
Precedence list
List-Id Konference PyCZ <python.py.cz>
List-Unsubscribe <http://www.py.cz/mailman/options/python>, <mailto:python-request@py.cz?subject=unsubscribe>
List-Archive <http://www.py.cz/pipermail/python/>
List-Post <mailto:python@py.cz>
List-Help <mailto:python-request@py.cz?subject=help>
List-Subscribe <http://www.py.cz/mailman/listinfo/python>, <mailto:python-request@py.cz?subject=subscribe>
Newsgroups cz.comp.lang.python
Message-ID <mailman.16.1565722176.5720.python@py.cz> (permalink)
X-Mailman-Original-Message-ID <9144DF83-1FF0-4390-8165-A19E21F4D13F@gmail.com>
X-Mailman-Original-References <6ot.DzVH.657}E95Dld6.1TKbRh@seznam.cz> <CAK9Q5BT2AzSfg2tQomMiWstaQUqved1hH5Yw4dE6YXP5kSyhig@mail.gmail.com> <CAAEb_Q0jT26UfPA9vV_Jgf8=TcNxpzbSmzrs857NcQWtE2euyg@mail.gmail.com> <6B8BDAAB-4F03-404F-9288-972742AE194D@gmail.com> <CA+7MNVoPRuTDH9hqO4aUaM114K2tLBWPZtdnXaVvB_go9j+g-A@mail.gmail.com> <CAAEb_Q0yh+c7qDRswO86r6++EWJiNRgNVgQ=2d3=x5bbvhrHZg@mail.gmail.com>
References <6ot.DzVH.657}E95Dld6.1TKbRh@seznam.cz> <CAK9Q5BT2AzSfg2tQomMiWstaQUqved1hH5Yw4dE6YXP5kSyhig@mail.gmail.com> <CAAEb_Q0jT26UfPA9vV_Jgf8=TcNxpzbSmzrs857NcQWtE2euyg@mail.gmail.com> <6B8BDAAB-4F03-404F-9288-972742AE194D@gmail.com> <CA+7MNVoPRuTDH9hqO4aUaM114K2tLBWPZtdnXaVvB_go9j+g-A@mail.gmail.com> <CAAEb_Q0yh+c7qDRswO86r6++EWJiNRgNVgQ=2d3=x5bbvhrHZg@mail.gmail.com> <9144DF83-1FF0-4390-8165-A19E21F4D13F@gmail.com>
Lines 131
X-Complaints-To abuse@usenet-news.net
NNTP-Posting-Date Tue, 13 Aug 2019 18:49:36 UTC
Organization usenet-news.net
Date Tue, 13 Aug 2019 20:49:12 +0200
X-Received-Bytes 8724
X-Received-Body-CRC 3297310040
Xref csiph.com cz.comp.lang.python:3367

Show key headers only | View raw


To je nějaký komunikační standard nebo tak něco? Máš odkaz na nějakou dokumentaci? Spíš tipuju, že existuje způsob, jak s tím pracovat rozumně, než odchytávat nějaký zmatek a snažit se naparsovat ten kousek, co se povedlo odchytit. Co je to za zařízení?

Petr Messner

13. 8. 2019 v 14:38, Ondrej Beranek <rainbof@gmail.com>:

> Ahoj,
> 
> Trosku to rozvedu, existuje zarizeni co generuje XML po multicast
> vysilani. problem je ze ho zapnes a ono jede a jede a jede co mas mas,
> co ne jsi ztratil. Kdyz se k nemu pripojis tak ti uz chybi hlavicka a
> chytis to v pulce neceho. tak zacnes chytat co mas a postupne skladas
> strom. Muze se ale stat (a stava se) ze se tagy kapku pokrizi a misto
> koncu vetvi /B /A se obevi /A /B s tim ze mezitim jeste litaji nejaka
> data. V takovemto pripade o situaci chci vedet a sam si ji podle uz
> nactene urovne osetrit. Cast dat jsou data predana takze si nejsem ani
> jist tim ze se struktura nemuze pozmenit...
> 
> 
> Aby toho nebylo malo nektere tagy pro jistotu nahodne nekonci vubec
> ale da se dopocitat jejich zanoreni. A podobne kratochvile.
> 
> Jo a zarizeni nemuzu restartovat.
> 
> 
> 13.08.19, starenka . <starenka0@gmail.com>:
>> tak spatny xml se obcas prihodi, kdyz to nejakej jouda generuje nejak
>> obskurne, nebo se ti usekne stream nebo nevimcoeste.... lxml ucrite umi
>> podoktorovat html, mozna i xml....
>> ---
>> In Perl you shoot yourself in the foot, but nobody can understand how you
>> did it. Six months later, neither can you. | print 'aknerats'[::-1]
>> 
>> 
>> On Tue, Aug 13, 2019 at 1:06 PM Petr Messner <petr.messner@gmail.com>
>> wrote:
>> 
>>> Jak jako vadný tag? Potom to není XML.
>>> 
>>> Na HTML použij HTML parser.
>>> 
>>> Petr Messner
>>> 
>>> 13. 8. 2019 v 11:30, Ondrej Beranek <rainbof@gmail.com>:
>>> 
>>>> Ahoj,
>>>> 
>>>> když jste to tu tak nakousli, když bych chtěl zpracovávat xml streamy
>>>> předem neznámého obsahu, co na to použít ? Potřebuju aby se to
>>>> nesložilo když přijde nějaký vadný tag abych měl šanci si to ošetřit.
>>>> Tak než začnu psát kolo...
>>>> 
>>>> rainbof
>>>> 
>>>> 13.08.19, Petr Messner <petr.messner@gmail.com>:
>>>>> V těchto případech je asi nejednodušší xpath. Minimálně lxml ho umí.
>>>>> 
>>>>> PM
>>>>> 
>>>>> út 13. 8. 2019 v 8:22 odesílatel Ctibor.Plasek
>>>>> <Ctibor.Plasek@seznam.cz
>>>> 
>>>>> napsal:
>>>>> 
>>>>>> Ahoj.
>>>>>> Mám takovýto xml soubor (viz.přiložený soubor)  - export z ffprobe.
>>>>>> Pro ty hodnoty, které jsou u <stream používám toto:
>>>>>> 
>>>>>> from xml.dom import minidom
>>>>>> xmldoc = minidom.parse('RainS02E06.mkv.xml')
>>>>>> streamlist = xmldoc.getElementsByTagName('stream')
>>>>>> for s in streamlist:
>>>>>>   print(s.attributes['index'].value)
>>>>>>   print(s.attributes['codec_name'].value)
>>>>>>   try:
>>>>>>       print(s.attributes['sample_rate'].value)
>>>>>>   except:
>>>>>>       print('none')
>>>>>> 
>>>>>> ale nevím jakým způsobem se dostat k těm "hlubším" hodnotám - např.
>>>>>> <tag key="DURATION-eng" - jaká je např.hodnota value u stream
>>>>>> index="1"
>>>>>> 
>>>>>> Mohli byste mi, prosím, poradit?
>>>>>> 
>>>>>> Děkuji Ctibor
>>>>>> 
>>>>>> 
>>>>>> 
>>>>>> 
>>>>>> _______________________________________________
>>>>>> Python mailing list
>>>>>> python@py.cz
>>>>>> http://www.py.cz/mailman/listinfo/python
>>>>>> 
>>>>>> Visit: http://www.py.cz
>>>>>> 
>>>>> 
>>>> _______________________________________________
>>>> Python mailing list
>>>> python@py.cz
>>>> http://www.py.cz/mailman/listinfo/python
>>>> 
>>>> Visit: http://www.py.cz
>>> _______________________________________________
>>> Python mailing list
>>> python@py.cz
>>> http://www.py.cz/mailman/listinfo/python
>>> 
>>> Visit: http://www.py.cz
>>> 
>> 
> _______________________________________________
> Python mailing list
> python@py.cz
> http://www.py.cz/mailman/listinfo/python
> 
> Visit: http://www.py.cz

Back to cz.comp.lang.python | Previous | Next | Find similar


Thread

Re: [python] xml parsování Petr Messner <petr.messner@gmail.com> - 2019-08-13 20:49 +0200

csiph-web