Path: csiph.com!fu-berlin.de!uni-berlin.de!not-for-mail
From: "Sven R. Kunze" <srkunze@mail.de>
Newsgroups: de.comp.lang.python
Subject: Re: [Python-de] string split
Date: Wed, 22 Feb 2017 18:07:41 +0100
Lines: 34
Message-ID: <mailman.4.1487783270.2669.python-de@python.org>
References: <CABTCcybjz2=TpMUvM7ur_obHfx2BGuoF4tohGuipgfrbonLcBA@mail.gmail.com> <562fb777-6db2-0457-2a4d-0d6d79588129@mail.de>
Mime-Version: 1.0
Content-Type: text/plain; charset=windows-1252; format=flowed
Content-Transfer-Encoding: 8bit
In-Reply-To: <CABTCcybjz2=TpMUvM7ur_obHfx2BGuoF4tohGuipgfrbonLcBA@mail.gmail.com>
Precedence: list
Xref: csiph.com de.comp.lang.python:4673

Ich fürchte eine 100%e Lösung gibt's nicht. Aber vielleicht hilft das ja:

last_chars = {word[-1] for word in text.split()}

Damit lässt sich schon mal abschätzen, welche Endungszeichen es gibt. 
Wenn du dir dann im Klaren bist, welche du alle akzeptieren möchtest:

Nimm dann dafür re.split https://docs.python.org/2/library/re.html#re.split

re.split('((?\W|\s)+)(?\.|\?|!)', text)

Bin grad auf dem Sprung, aber im Prinzip sollte es so gehen.

vG

Sven

On 22.02.2017 17:49, Frank Grellert wrote:
> Ich habe ein kniffliges Problem zu lösen:
> Ein längerer Text soll in einzelne Sätze aufgespalten werden. Leider
> enden nicht alle Sätze am Zeilenende und darüber hinaus enden auch
> nicht alle mit einem Punkt. Der Text lautet:
>
> text = """Dies ist ein Auszug aus einem langen Text: Welche Zeichen
> befinden sich am Satzende?
>    Manchmal ist es ein Ausrufezeichen! Häufig ist es ein Punkt.
>    """
> Hat jemand eine Idee?
>
> Danke!
>
> Frank
>