Path: csiph.com!news.mixmin.net!weretis.net!feeder4.news.weretis.net!storethat.news.telefonica.de!feedme.news.telefonica.de!telefonica.de!fu-berlin.de!uni-berlin.de!not-for-mail From: Florian Lindner Newsgroups: de.comp.lang.python Subject: [Python-de] Datum aus Mails parsen Date: Tue, 22 Mar 2016 20:59:47 +0100 Lines: 67 Message-ID: Mime-Version: 1.0 Content-Type: text/plain; charset="iso-8859-1" Content-Transfer-Encoding: quoted-printable X-Trace: news.uni-berlin.de mOVVthwQN13CwseteXMn1wwzYBH27SIs4UVfdIa4cBFA== Return-Path: X-Original-To: python-de@python.org Delivered-To: python-de@mail.python.org User-Agent: KMail/5.1.3 (Linux/4.4.5-1-ARCH; KDE/5.19.0; x86_64; ; ) X-BeenThere: python-de@python.org X-Mailman-Version: 2.1.21 Precedence: list List-Id: Die Deutsche Python Mailingliste List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , Xref: csiph.com de.comp.lang.python:4320 Hallo, ich will das Datum einer Mail rausfinden, ob es das Sende- oder Empfangsdat= um=20 ist, oder eins der Stationen in der Mitte ist egal. Nun habe ich mir mal eine beliebige Mail rausgegriffen: =46rom someone@gmail.com Fri Feb 05 09:09:11 2016 Received: from ipvsmail.informatik.uni-stuttgart.de by hermes.informatik.uni-stuttgart.de (Dovecot) with LMTP id=20 842rLx9mtFbVeAAAqVsIVA for ; Fri, 05 Feb 2016 10:09:12 +0100 Received: from mx3.informatik.uni-stuttgart.de (mailgw.informatik.uni- stuttgart.de [129.69.211.42]) by ipvsmail.informatik.uni-stuttgart.de (Postfix) with ESMTP id=20 D3111EA3 for ; Fri, 5 Fe= b=20 2016 10:09:12 +0100 (CET) Received: by mx3.informatik.uni-stuttgart.de (Postfix, from userid 65534) id BD6DB6251; Fri, 5 Feb 2016 10:09:12 +0100 (CET) Received: from mail-lf0-f52.google.com (mail-lf0-f52.google.com=20 [209.85.215.52]) (using TLSv1.2 with cipher ECDHE-RSA-AES128-GCM-SHA256 (128/128 bit= s)) (No client certificate requested) by mx3.informatik.uni-stuttgart.de (Postfix) with ESMTPS id E6D5462= 49 for ; Fri, 5 Feb 2016 10:09:11= =20 +0100 (CET) Received: by mail-lf0-f52.google.com with SMTP id 78so52976351lfy.3 for ; Fri, 05 Feb 2016 01:09:11= =20 =2D0800 (PST) X-Received: by 10.25.42.18 with SMTP id q18mr5524069lfq.151.1454663351309; Fri, 05 Feb 2016 01:09:11 -0800 (PST) Received: by 10.25.145.21 with HTTP; Fri, 5 Feb 2016 01:09:11 -0800 (PST) Received: by 10.25.145.21 with HTTP; Fri, 5 Feb 2016 01:09:11 -0800 (PST) Date: Fri, 5 Feb 2016 10:09:11 +0100 Ein wenig habe ich schon irrelevante Infos rausgenommen. Probleme die ich sehe ist a) die Zuverl=E4ssigkeit des Datums und b) die=20 Standardisierung des Formates. Der Date Header springt nat=FCrlich sofort ins Auge, aber ich denke nicht, = dass=20 der sonderlich zuverl=E4ssig ist. Regelm=E4=DFig bekomme ich Spam mit unbek= annten=20 Datum oder Datum in der Zukunft. Au=DFerdem habe ich bei ersten Testl=E4ufe= n auch=20 verschiedene Formate gesehen (z.B. die Zeit ohne Sekunden) Nun frage ich mich, was da am zuverl=E4ssigsten ist? Die erste Zeile From g= ibt=20 es offensichtlich auch nicht bei allen Mails. Sollte man einfach den ersten Received Header nehmen, am ";" trennen und da= nn=20 datetime.strptime mit einen entsprechenden Format String drauf los lassen? Was denkt Ihr, ist das Beste? Viele Gr=FC=DFe, =46lorian