Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]


Groups > fr.comp.lang.python > #3983

Re: Un caractère spécial...

From Olivier Miakinen <om+news@miakinen.net>
Newsgroups fr.comp.lang.python
Subject Re: Un caractère spécial...
Date 2022-10-19 17:18 +0200
Organization There's no cabale
Message-ID <tip4h0$1t3o$1@cabale.usenet-fr.net> (permalink)
References <TridnT4a0poIcNL-nZ2dnZfqlJxg4p2d@giganews.com>

Show all headers | View raw


Bonjour,

Le 19/10/2022 à 14:29, duareb a écrit :
> Après l'importation d'un fichier texte de nombres entiers , les éléments ont été
> transformés : par exemple  l'entier écrit  '1 549' est devenu   '1 549',

Visiblement, le fichier était en UTF-8, et après l'importation il est lu
comme si c'était du CP1252 (version Windows du Latin1).

En effet,   = E2 80 AF (en CP1252), et l'encodage UTF-8 E2 80 AF est
celui de l'espace insécable étroite U+202F ( ).

Pour obtenir une conversion parfaite, tu dois arriver à dire que tu pars
d'un fichier UTF-8, et si possible que tu veux aussi avoir à l'arrivée
un résultat en UTF-8, puisque le caractère « espace insécable étroite »
n'existe pas dans CP1252.

Sinon, si tu veux juste virer ces caractères, tu peux soit le faire dans
le fichier texte avant importation, soit dans le résultat importé en
utilisant des expressions rationnelles si tu ne peux pas copier-coller
le caractère macron.

-- 
Olivier Miakinen

Back to fr.comp.lang.python | Previous | NextPrevious in thread | Next in thread | Find similar


Thread

Un caract�re sp�cial... duareb <nospam_duareb@free.fr.invalid> - 2022-10-19 12:29 +0000
  Re: Un caractère spécial... Alain Ketterlin <alain@universite-de-strasbourg.fr.invalid> - 2022-10-19 14:49 +0200
  Re: Un caractère spécial... Olivier Miakinen <om+news@miakinen.net> - 2022-10-19 17:18 +0200
  Re: Un caractère spécial... ast <ast@invalid> - 2022-11-10 14:48 +0100

csiph-web