Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]


Groups > fr.comp.lang.python > #4001

Re: Propriétés Unicode dans les regex Python

From Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid>
Newsgroups fr.comp.lang.python
Subject Re: Propriétés Unicode dans les regex Python
Date 2022-11-09 14:13 +0100
Organization Université de Strasbourg
Message-ID <87iljo2rum.fsf@universite-de-strasbourg.fr.invalid> (permalink)
References <tk67uo$1b37$1@cabale.usenet-fr.net> <63680b04$0$3005$426a74cc@news.free.fr> <unicodedata-20221109092838@ram.dialup.fu-berlin.de> <tkg09p$glm$1@cabale.usenet-fr.net>

Show all headers | View raw


Olivier Miakinen <om+news@miakinen.net> writes:

> Le 09/11/2022 09:33, Stefan Ram a écrit :
>> 
>>   Si l'installation de modules supplémentaires n'est
>>   pas envisageable, il existe aussi une possibilité 
>>   avec l'installation habituelle de Python sans modules
>>   supplémentaires, mais pas avec les expressions 
>>   régulières seules.
>> 
>> import unicodedata
>> 
>> source = "abcdEfgh"
>> for i, ch in enumerate( source ):
>>     if unicodedata.category( ch )== 'Lu':
>>         print( i, ch )
>> 
>
> Très intéressant ! Merci pour cela.
> <https://docs.python.org/fr/3/library/unicodedata.html>

D'après https://www.compart.com/en/unicode/category/Lu il y a 1791
caractères Unicode dans la catégorie Lu. Donc si tu veux construire une
expression régulière re en remplaçant "\p{Lu}" par "[.....]" dans une
expression régulière pcre, tu vas aboutir à une expression énorme...

Mais effectivement, si tu n'as pas vraiment besoin d'une expression
régulière et que le test de correspondance peut être fait "à la main",
c'est une solution.

-- Alain.

Back to fr.comp.lang.python | Previous | NextPrevious in thread | Next in thread | Find similar


Thread

Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-05 18:53 +0100
  Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-06 10:24 +0100
    Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-06 19:46 +0100
  Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-06 20:29 +0100
    Re: Propriétés Unicode dans les regex Python Dominique <zzz@aol.com> - 2022-11-09 10:52 +0100
      Re: Propriétés Unicode dans les regex Python Dominique <zzz@aol.com> - 2022-11-09 14:46 +0100
    Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 11:44 +0100
      Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 14:13 +0100
        Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 15:12 +0100
          Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 19:42 +0100
            Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 20:09 +0100
        Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 15:22 +0100
          Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 17:07 +0100
            Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 19:46 +0100
              Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 19:52 +0100
          Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-10 14:32 +0100
        Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-10 14:29 +0100

csiph-web