Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]
Groups > fr.comp.lang.python > #4012
| Date | 2022-11-10 14:29 +0100 |
|---|---|
| Subject | Re: Propriétés Unicode dans les regex Python |
| Newsgroups | fr.comp.lang.python |
| References | (1 earlier) <63680b04$0$3005$426a74cc@news.free.fr> <unicodedata-20221109092838@ram.dialup.fu-berlin.de> <tkg09p$glm$1@cabale.usenet-fr.net> <87iljo2rum.fsf@universite-de-strasbourg.fr.invalid> <Lu-20221109143314@ram.dialup.fu-berlin.de> |
| From | ast <ast@invalid> |
| Message-ID | <636cfcb0$0$25956$426a34cc@news.free.fr> (permalink) |
| Organization | Guest of ProXad - France |
Le 09/11/2022 à 14:34, Stefan Ram a écrit :
> Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> writes:
>> D'après https://www.compart.com/en/unicode/category/Lu il y a 1791
>> caractères Unicode dans la catégorie Lu. Donc si tu veux construire une
>> expression régulière re en remplaçant "\p{Lu}" par "[.....]" dans une
>> expression régulière pcre, tu vas aboutir à une expression énorme...
>
> Bonne idée !
>
> main.py
>
> import re
> import unicodedata
>
> Lu = "["
> for i in range( 1114112 ): # Python 3.9
> ch = chr( i )
> if unicodedata.category( ch )== "Lu":
> Lu += ch
> Lu += "]"
>
> print( len( Lu ))
> print( re.search( Lu, "abcdEfgh" ))
>
> sortie :
>
> 1790
> <re.Match object; span=(4, 5), match='E'>
>
>
Amusant.
Pourquoi mets-tu "python 3.9" en commentaire ?
Il y a quelque chose dans ce programme qui ne passe pas avec les
versions antérieures ?
Back to fr.comp.lang.python | Previous | Next — Previous in thread | Find similar
Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-05 18:53 +0100
Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-06 10:24 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-06 19:46 +0100
Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-06 20:29 +0100
Re: Propriétés Unicode dans les regex Python Dominique <zzz@aol.com> - 2022-11-09 10:52 +0100
Re: Propriétés Unicode dans les regex Python Dominique <zzz@aol.com> - 2022-11-09 14:46 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 11:44 +0100
Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 14:13 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 15:12 +0100
Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 19:42 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 20:09 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 15:22 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 17:07 +0100
Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 19:46 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 19:52 +0100
Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-10 14:32 +0100
Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-10 14:29 +0100
csiph-web