Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]


Groups > de.comp.lang.python > #4930

Re: [Python-de] 'z' < 'δ'

From "Diez B. Roggisch" <deets@web.de>
Newsgroups de.comp.lang.python
Subject Re: [Python-de] 'z' < 'δ'
Date 2017-10-02 16:17 +0200
Message-ID <mailman.17.1506954604.2819.python-de@python.org> (permalink)
References <z_kleiner_ae-20171002144954@ram.dialup.fu-berlin.de> <63D3B36B-E02F-40BD-8C7F-6A4549139E05@web.de>

Show all headers | View raw


[Multipart message — attachments visible in raw view] - view raw

Das Problem nennt sich “Collations” und ist wie alles was mit Unicode zu tun hat kompliziert.

Denn AFAIK ist zB im schwedischen die Sortierreihenfolge genau richtig. Und dann gibt’s auch noch so Sachen in tschechisch glaube ich, wo die Sortierreihenfolge eines Buchstabens abhaengig vom Kontext ist. So Dinge halt.

Konkret klappt das fuer mich mit pyuca:

from pyuca import Collator
c = Collator()

l = ["z", "ä"]

print(repr(sorted(l)).encode("utf-8"))
print(repr(sorted(l, key=c.sort_key)).encode("utf-8"))


Das encoding-gefummel ist wegen meinem Python 3.5 und dessen unwillen, irgendwas lesbares auf der Konsole auszugeben. *seufz*.

LG Diez

> On 2. Oct 2017, at 15:57, Stefan Ram <ram@zedat.fu-berlin.de> wrote:
> 
>  In Python scheint
> 
> 'z' < 'ä'
> 
>  wahr zu sein. Ist dies wie
> 
> ord( 'z' )< ord( 'ä' )
> 
>  zu verstehen?
> 
>  Gibt es eine Möglichkeit, beispielsweise zum Sortieren von
>  Texten, Python zu erklären, daß man »ä« wie »ae« einordnen
>  möchte (oder direkt davor oder dahinter)?
> 
> _______________________________________________
> python-de maillist  -  python-de@python.org
> https://mail.python.org/mailman/listinfo/python-de
> 

Back to de.comp.lang.python | Previous | Next | Find similar


Thread

Re: [Python-de] 'z' < 'δ' "Diez B. Roggisch" <deets@web.de> - 2017-10-02 16:17 +0200

csiph-web