Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]
Groups > fr.comp.lang.python > #4001
| Path | csiph.com!aioe.org!K7PIs9tCGQ+WHJa7e6BylQ.user.46.165.242.75.POSTED!not-for-mail |
|---|---|
| From | Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> |
| Newsgroups | fr.comp.lang.python |
| Subject | Re: Propriétés Unicode dans les regex Python |
| Date | Wed, 09 Nov 2022 14:13:37 +0100 |
| Organization | Université de Strasbourg |
| Message-ID | <87iljo2rum.fsf@universite-de-strasbourg.fr.invalid> (permalink) |
| References | <tk67uo$1b37$1@cabale.usenet-fr.net> <63680b04$0$3005$426a74cc@news.free.fr> <unicodedata-20221109092838@ram.dialup.fu-berlin.de> <tkg09p$glm$1@cabale.usenet-fr.net> |
| Mime-Version | 1.0 |
| Content-Type | text/plain; charset=utf-8 |
| Content-Transfer-Encoding | quoted-printable |
| Injection-Info | gioia.aioe.org; logging-data="7084"; posting-host="K7PIs9tCGQ+WHJa7e6BylQ.user.gioia.aioe.org"; mail-complaints-to="abuse@aioe.org"; |
| User-Agent | Gnus/5.13 (Gnus v5.13) Emacs/25.2 (gnu/linux) |
| Cancel-Lock | sha1:8qwcocq3j8Eoiy1YuQUpfnyZ2Oc= |
| X-Notice | Filtered by postfilter v. 0.9.2 |
| Xref | csiph.com fr.comp.lang.python:4001 |
Show key headers only | View raw
Olivier Miakinen <om+news@miakinen.net> writes:
> Le 09/11/2022 09:33, Stefan Ram a écrit :
>>
>> Si l'installation de modules supplémentaires n'est
>> pas envisageable, il existe aussi une possibilité
>> avec l'installation habituelle de Python sans modules
>> supplémentaires, mais pas avec les expressions
>> régulières seules.
>>
>> import unicodedata
>>
>> source = "abcdEfgh"
>> for i, ch in enumerate( source ):
>> if unicodedata.category( ch )== 'Lu':
>> print( i, ch )
>>
>
> Très intéressant ! Merci pour cela.
> <https://docs.python.org/fr/3/library/unicodedata.html>
D'après https://www.compart.com/en/unicode/category/Lu il y a 1791
caractères Unicode dans la catégorie Lu. Donc si tu veux construire une
expression régulière re en remplaçant "\p{Lu}" par "[.....]" dans une
expression régulière pcre, tu vas aboutir à une expression énorme...
Mais effectivement, si tu n'as pas vraiment besoin d'une expression
régulière et que le test de correspondance peut être fait "à la main",
c'est une solution.
-- Alain.
Back to fr.comp.lang.python | Previous | Next — Previous in thread | Next in thread | Find similar
Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-05 18:53 +0100
Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-06 10:24 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-06 19:46 +0100
Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-06 20:29 +0100
Re: Propriétés Unicode dans les regex Python Dominique <zzz@aol.com> - 2022-11-09 10:52 +0100
Re: Propriétés Unicode dans les regex Python Dominique <zzz@aol.com> - 2022-11-09 14:46 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 11:44 +0100
Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 14:13 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 15:12 +0100
Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 19:42 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 20:09 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 15:22 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 17:07 +0100
Re: Propriétés Unicode dans les regex Python Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-11-09 19:46 +0100
Re: Propriétés Unicode dans les regex Python Olivier Miakinen <om+news@miakinen.net> - 2022-11-09 19:52 +0100
Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-10 14:32 +0100
Re: Propriétés Unicode dans les regex Python ast <ast@invalid> - 2022-11-10 14:29 +0100
csiph-web