Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]


Groups > de.comp.lang.perl > #512

Re: Tief in den Gräben von UTF-8

From Thomas Dorner <dclp241108.dorner@spamgourmet.com>
Newsgroups de.comp.lang.perl
Subject Re: Tief in den Gräben von UTF-8
Date 2024-11-08 18:37 +0100
Message-ID <6e5xoxaao9.fsf@th-dorner.de> (permalink)
References (2 earlier) <vgj0h1$u0o1$1@news1.tnib.de> <slrnviq4u3.qo37.hjp-usenet4@trintignant.hjp.at> <vgk91f$10a3m$1@news1.tnib.de> <slrnvis5fb.1p3pq.hjp-usenet4@trintignant.hjp.at> <vglb5i$127ug$1@news1.tnib.de>

Show all headers | View raw


Marc Haber <mh+usenetspam1118@zugschl.us> writes:
> "Peter J. Holzer" <hjp-usenet4@hjp.at> wrote:
>>On 2024-11-08 05:53, Marc Haber <mh+usenetspam1118@zugschl.us> wrote:
>>> "Peter J. Holzer" <hjp-usenet4@hjp.at> wrote:
>>>>    use Encode::Locale;
>>>>    binmode ($_, ":encoding(locale)");
>>>>    $string = decode("locale", $bytes);
>>>>    $bytes = encode("locale", $string);
>>>
>>> Was macht das? Liest encoding(locale) das vom System eingestellte
>>> locale aus?
>>
>>Ja. Genau wie oben. Der Unterschied ist, dass es ein Pseudo-Encoding
>>"locale" zur Verfügung stellt, das man dann einfach überall verwenden
>>kann, also z.B. als Argument für open, binmode, decode oder encode.
>>
>>Was man praktischer oder lesbarer findet, ist Geschmackssache.
>
> Da find ich die zweite Variante schöner.

Ja, das dürfte für Deine Test-Suite der praktikablere Ansatz sein.

> Bleibt nur noch zu klären wo
> ich explizit encoden muss oder wo nicht.

Vermutlich für alle Funktionen, die direkt auf den entsprechenden C
Systemfunktionen aufsetzen.  In perldoc perlfunc stehen die zusammen in
einer Liste ab "getpwnam" bis "endservent".  (Aber natürlich nur die,
die auch tatsächlich Strings als Parameter oder Rückgabewert haben.)  Im
Umfeld von adduser & Co. dürften das aber wohl alle sein, die Du da
benutzt.

> Mein Bauchgefühl sagt, dass ich das für jeden Aufruf den ich mache
> testen muss und mir für die Funktionen die ein encode brauchen wrapper
> schreiben werde.

Ein Encode kann eigentlich nur schaden, wenn Locales gemischt werden.
Wenn Du im getesteten Programm und im Testskript das gleiche Locale
verwendest, solltest Du eigentlich sicher sein.

(Allerdings könnten auf Dich auch "false Bug-Reports" zukommen, wenn
z.B. wie von Peter beschrieben root und Web-Server unterschiedliche
Locales verwenden, und sich jemand beschwert, daß im Web-Server die
Authorisierung über pam für Kennungen mit Umlauten nicht funktioniert
... ;-)

Viele Grüße, Thomas
-- 
Adresse gilt nur kurzzeitig!

Back to de.comp.lang.perl | Previous | NextPrevious in thread | Next in thread | Find similar


Thread

Tief in den Gräben von UTF-8 Marc Haber <mh+usenetspam202445@zugschlus.de> - 2024-11-06 21:58 +0100
  Re: Tief in den Gräben von UTF-8 Thomas Dorner <dclp241106.dorner@spamgourmet.com> - 2024-11-06 22:34 +0100
    Re: Tief in den Gräben von UTF-8 Marc Haber <mh+usenetspam1118@zugschl.us> - 2024-11-06 23:08 +0100
      Re: Tief in den Gräben von UTF-8 Thomas Dorner <dclp241107.dorner@spamgourmet.com> - 2024-11-07 14:40 +0100
        Re: Tief in den Gräben von UTF-8 Marc Haber <mh+usenetspam1118@zugschl.us> - 2024-11-07 19:05 +0100
  Re: Tief in den Gräben von UTF-8 Tim Landscheidt <tim@tim-landscheidt.de> - 2024-11-06 22:01 +0000
    Re: Tief in den Gräben von UTF-8 Marc Haber <mh+usenetspam1118@zugschl.us> - 2024-11-07 19:12 +0100
      Re: Tief in den Gräben von UTF-8 "Peter J. Holzer" <hjp-usenet4@hjp.at> - 2024-11-07 19:54 +0100
      Re: Tief in den Gräben von UTF-8 Tim Landscheidt <tim@tim-landscheidt.de> - 2024-11-09 12:32 +0000
        Re: Tief in den Gräben von UTF-8 "Peter J. Holzer" <hjp-usenet4@hjp.at> - 2024-11-09 14:29 +0100
  Re: Tief in den Gräben von UTF-8 Marcel Mueller <news.5.maazl@spamgourmet.org> - 2024-11-06 23:47 +0100
    Re: Tief in den Gräben von UTF-8 Marc Haber <mh+usenetspam1118@zugschl.us> - 2024-11-07 19:22 +0100
      Re: Tief in den Gräben von UTF-8 "Peter J. Holzer" <hjp-usenet4@hjp.at> - 2024-11-07 20:23 +0100
        Re: Tief in den Gräben von UTF-8 Marc Haber <mh+usenetspam1118@zugschl.us> - 2024-11-08 06:53 +0100
          Re: Tief in den Gräben von UTF-8 "Peter J. Holzer" <hjp-usenet4@hjp.at> - 2024-11-08 14:45 +0100
            Re: Tief in den Gräben von UTF-8 Marc Haber <mh+usenetspam1118@zugschl.us> - 2024-11-08 16:36 +0100
              Re: Tief in den Gräben von UTF-8 Thomas Dorner <dclp241108.dorner@spamgourmet.com> - 2024-11-08 18:37 +0100
                Re: Tief in den Gräben von UTF-8 "Peter J. Holzer" <hjp-usenet4@hjp.at> - 2024-11-08 19:10 +0100
                Re: Tief in den Gräben von UTF-8 Thomas Dorner <dclp241109.dorner@spamgourmet.com> - 2024-11-09 15:48 +0100
                Re: Tief in den Gräben von UTF-8 Marc Haber <mh+usenetspam1118@zugschl.us> - 2024-11-08 21:31 +0100
                Re: Tief in den Gräben von UTF-8 "Peter J. Holzer" <hjp-usenet4@hjp.at> - 2024-11-08 22:57 +0100
      Re: Tief in den Gräben von UTF-8 Marcel Mueller <news.5.maazl@spamgourmet.org> - 2024-11-08 04:34 +0100
        Re: Tief in den Gräben von UTF-8 "Peter J. Holzer" <hjp-usenet4@hjp.at> - 2024-11-08 14:30 +0100
          Re: Tief in den Gräben von UTF-8 Thomas Hochstein <thh@thh.name> - 2024-11-09 14:28 +0100
          Re: Tief in den Gräben von UTF-8 Marc Haber <mh+usenetspam1118@zugschl.us> - 2024-11-09 19:25 +0100
      Re: Tief in den Gräben von UTF-8 Thomas Dorner <dclp241108.dorner@spamgourmet.com> - 2024-11-08 18:55 +0100
        Re: Tief in den Gräben von UTF-8 "Peter J. Holzer" <hjp-usenet4@hjp.at> - 2024-11-08 19:58 +0100
          Re: Tief in den Gräben von UTF-8 Thomas Dorner <dclp241109.dorner@spamgourmet.com> - 2024-11-09 15:51 +0100
            Re: Tief in den Gräben von UTF-8 "Peter J. Holzer" <hjp-usenet4@hjp.at> - 2024-11-10 00:57 +0100
              Re: Tief in den Gräben von UTF-8 Thomas Dorner <dclp241110.dorner@spamgourmet.com> - 2024-11-10 17:29 +0100
                Re: Tief in den Gräben von UTF-8 Marc Haber <mh+usenetspam1118@zugschl.us> - 2024-12-22 15:33 +0100
                Re: Tief in den Gräben von UTF-8 "Peter J. Holzer" <hjp-usenet4@hjp.at> - 2024-12-22 16:22 +0100
                Re: Tief in den Gräben von UTF-8 Thomas Dorner <dclp241222.dorner@spamgourmet.com> - 2024-12-22 18:14 +0100
  Re: Tief in den Gräben von UTF-8 "Peter J. Holzer" <hjp-usenet4@hjp.at> - 2024-11-08 23:49 +0100
    Re: Tief in den Gräben von UTF-8 Marc Haber <mh+usenetspam1118@zugschl.us> - 2024-11-09 09:00 +0100
      Re: Tief in den Gräben von UTF-8 Ulli Horlacher <framstag@rus.uni-stuttgart.de> - 2024-11-09 09:26 +0000
      Re: Tief in den Gräben von UTF-8 "Peter J. Holzer" <hjp-usenet4@hjp.at> - 2024-11-09 14:47 +0100
        Re: Tief in den Gräben von UTF-8 Marc Haber <mh+usenetspam1118@zugschl.us> - 2024-11-09 15:35 +0100

csiph-web