Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]
Groups > fr.comp.lang.python > #3983
| From | Olivier Miakinen <om+news@miakinen.net> |
|---|---|
| Newsgroups | fr.comp.lang.python |
| Subject | Re: Un caractère spécial... |
| Date | 2022-10-19 17:18 +0200 |
| Organization | There's no cabale |
| Message-ID | <tip4h0$1t3o$1@cabale.usenet-fr.net> (permalink) |
| References | <TridnT4a0poIcNL-nZ2dnZfqlJxg4p2d@giganews.com> |
Bonjour, Le 19/10/2022 à 14:29, duareb a écrit : > Après l'importation d'un fichier texte de nombres entiers , les éléments ont été > transformés : par exemple l'entier écrit '1 549' est devenu '1 549', Visiblement, le fichier était en UTF-8, et après l'importation il est lu comme si c'était du CP1252 (version Windows du Latin1). En effet,   = E2 80 AF (en CP1252), et l'encodage UTF-8 E2 80 AF est celui de l'espace insécable étroite U+202F ( ). Pour obtenir une conversion parfaite, tu dois arriver à dire que tu pars d'un fichier UTF-8, et si possible que tu veux aussi avoir à l'arrivée un résultat en UTF-8, puisque le caractère « espace insécable étroite » n'existe pas dans CP1252. Sinon, si tu veux juste virer ces caractères, tu peux soit le faire dans le fichier texte avant importation, soit dans le résultat importé en utilisant des expressions rationnelles si tu ne peux pas copier-coller le caractère macron. -- Olivier Miakinen
Back to fr.comp.lang.python | Previous | Next — Previous in thread | Next in thread | Find similar
Un caract�re sp�cial... duareb <nospam_duareb@free.fr.invalid> - 2022-10-19 12:29 +0000 Re: Un caractère spécial... Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-10-19 14:49 +0200 Re: Un caractère spécial... Olivier Miakinen <om+news@miakinen.net> - 2022-10-19 17:18 +0200 Re: Un caractère spécial... ast <ast@invalid> - 2022-11-10 14:48 +0100
csiph-web