Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]


Groups > fr.comp.lang.python > #4012

Re: Propriétés Unicode dans les regex Python

Date 2022-11-10 14:29 +0100
Subject Re: Propriétés Unicode dans les regex Python
Newsgroups fr.comp.lang.python
References (1 earlier) <63680b04$0$3005$426a74cc@news.free.fr> <unicodedata-20221109092838@ram.dialup.fu-berlin.de> <tkg09p$glm$1@cabale.usenet-fr.net> <87iljo2rum.fsf@universite-de-strasbourg.fr.invalid> <Lu-20221109143314@ram.dialup.fu-berlin.de>
From ast <ast@invalid>
Message-ID <636cfcb0$0$25956$426a34cc@news.free.fr> (permalink)
Organization Guest of ProXad - France

Show all headers | View raw


Le 09/11/2022 à 14:34, Stefan Ram a écrit :
> Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> writes:
>> D'après https://www.compart.com/en/unicode/category/Lu il y a 1791
>> caractères Unicode dans la catégorie Lu. Donc si tu veux construire une
>> expression régulière re en remplaçant "\p{Lu}" par "[.....]" dans une
>> expression régulière pcre, tu vas aboutir à une expression énorme...
> 
>    Bonne idée !
> 
>    main.py
> 
> import re
> import unicodedata
> 
> Lu = "["
> for i in range( 1114112 ): # Python 3.9
>      ch = chr( i )
>      if unicodedata.category( ch )== "Lu":
>          Lu += ch
> Lu += "]"
> 
> print( len( Lu ))
> print( re.search( Lu, "abcdEfgh" ))
> 
>    sortie :
> 
> 1790
> <re.Match object; span=(4, 5), match='E'>
> 
> 

Amusant.

Pourquoi mets-tu "python 3.9" en commentaire ?
Il y a quelque chose dans ce programme qui ne passe pas avec les 
versions antérieures ?

Back to fr.comp.lang.python | Previous | NextPrevious in thread | Find similar


Thread

Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-05 18:53 +0100
  Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-06 10:24 +0100
    Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-06 19:46 +0100
  Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-06 20:29 +0100
    Re: Propriétés Unicode dans les regex Python Dominique <zzz@aol.com> - 2022-11-09 10:52 +0100
      Re: Propriétés Unicode dans les regex Python Dominique <zzz@aol.com> - 2022-11-09 14:46 +0100
    Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 11:44 +0100
      Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 14:13 +0100
        Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 15:12 +0100
          Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 19:42 +0100
            Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 20:09 +0100
        Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 15:22 +0100
          Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 17:07 +0100
            Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 19:46 +0100
              Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 19:52 +0100
          Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-10 14:32 +0100
        Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-10 14:29 +0100

csiph-web