Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]


Groups > fr.comp.lang.python > #4004

Re: Propriétés Unicode dans les regex Python

From Olivier Miakinen <om+news@miakinen.net>
Newsgroups fr.comp.lang.python
Subject Re: Propriétés Unicode dans les regex Python
Date 2022-11-09 15:12 +0100
Organization There's no cabale
Message-ID <tkgcgh$j7u$1@cabale.usenet-fr.net> (permalink)
References <tk67uo$1b37$1@cabale.usenet-fr.net> <63680b04$0$3005$426a74cc@news.free.fr> <unicodedata-20221109092838@ram.dialup.fu-berlin.de> <tkg09p$glm$1@cabale.usenet-fr.net> <87iljo2rum.fsf@universite-de-strasbourg.fr.invalid>

Show all headers | View raw


Le 09/11/2022 à 14:13, Alain Ketterlin m'a répondu :
> 
> D'après https://www.compart.com/en/unicode/category/Lu il y a 1791
> caractères Unicode dans la catégorie Lu. Donc si tu veux construire une
> expression régulière re en remplaçant "\p{Lu}" par "[.....]" dans une
> expression régulière pcre, tu vas aboutir à une expression énorme...

Certes ! :-)

Sans compter que cette collection peut augmenter au fil des différentes
versions d'Unicode.

> Mais effectivement, si tu n'as pas vraiment besoin d'une expression
> régulière et que le test de correspondance peut être fait "à la main",
> c'est une solution.

Je posais la question pour un outil dans lequel tout se fait par
expressions régulières. Par conséquent le module unicodedata ne peut
pas me servir directement pour cela, mais il pourrait m'être utile
dans d'autres circonstances et je remercie encore Stefan de me l'avoir
fait découvrir.

Pour l'heure je vais me contenter des [A-Z] ou [a-z], quitte à y
ajouter des caractères accentués au cas par cas.

Cordialement,

-- 
Olivier Miakinen

Back to fr.comp.lang.python | Previous | NextPrevious in thread | Next in thread | Find similar


Thread

Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-05 18:53 +0100
  Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-06 10:24 +0100
    Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-06 19:46 +0100
  Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-06 20:29 +0100
    Re: Propriétés Unicode dans les regex Python Dominique <zzz@aol.com> - 2022-11-09 10:52 +0100
      Re: Propriétés Unicode dans les regex Python Dominique <zzz@aol.com> - 2022-11-09 14:46 +0100
    Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 11:44 +0100
      Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 14:13 +0100
        Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 15:12 +0100
          Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 19:42 +0100
            Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 20:09 +0100
        Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 15:22 +0100
          Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 17:07 +0100
            Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 19:46 +0100
              Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 19:52 +0100
          Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-10 14:32 +0100
        Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-10 14:29 +0100

csiph-web