Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]


Groups > de.comp.lang.vbclassic > #7632

Re: Unicode-Sequenzen in Strings erkennen

From Ulrich Möller <knobbi38@arcor.de>
Newsgroups de.comp.lang.vbclassic
Subject Re: Unicode-Sequenzen in Strings erkennen
Date 2024-03-13 20:31 +0100
Organization A noiseless patient Spider
Message-ID <ussuv5$13sdr$1@dont-email.me> (permalink)
References <ussie2$1amq6$1@solani.org>

Show all headers | View raw


Hallo Klaus,

Am 13.03.2024 um 16:57 schrieb Klaus Ketelaer:
> Hallo zusammen,
> 
> ich parse Google-Seiten nach den Namen von Darstellern, wobei viele
> Namen Akzente enthalten. Die Akzente haben einmal einen Ascii Code
> bis 255, und manchmal sind die Zeichen als Unicode in 2 Bytes codiert.
> 
> Ich habe nun Probleme damit, zu erkennen, ob solche 2 Byte Akzente in
> einem String enthalten sind. Bei den meisten Akzenten hat das erste
> Byte den Ascii-Code 195,196,197 oder 226. Das werte ich nun aus, und
> die Konvertierung von Namen mit Akzenten funktioniert eigentlich
> bestens.
> 
> Leider finde ich meine Funktion zur Erkennung dieser 2 Byte Akzente
> irgendwie stümperhaft, und frage mich, ob es keine Funktion gibt, mit
> der man zuverlässig erkennen kann, ob ein String 2 Byte Unicode enthält.
> 
> Hat vielleicht jemand einen Tip für mich?
> 

bist du dir sicher mit Unicode? Das verwenden Webseiten eher selten. 
Meistens sind die Seiten doch UTF-8 codiert. Wohin konvertierst du die 
Akzente? Bist du dir sicher, daß es für alle Unicode-Akzente eine ANSI 
Entsprechung gibt?

Grüße
Ulrich

Btw.: ASCII Code hat übrigens nur 7-Bit.

Back to de.comp.lang.vbclassic | Previous | NextPrevious in thread | Next in thread | Find similar | Unroll thread


Thread

Unicode-Sequenzen in Strings erkennen Klaus Ketelaer <usenet@ketelaer.de> - 2024-03-13 16:57 +0100
  Re: Unicode-Sequenzen in Strings erkennen Ulrich Möller <knobbi38@arcor.de> - 2024-03-13 20:31 +0100
    Re: Unicode-Sequenzen in Strings erkennen Klaus Ketelaer <usenet@ketelaer.de> - 2024-03-14 01:41 +0100
      Re: Unicode-Sequenzen in Strings erkennen Ulrich Möller <knobbi38@arcor.de> - 2024-03-14 12:09 +0100
        Re: Unicode-Sequenzen in Strings erkennen Klaus Ketelaer <usenet@ketelaer.de> - 2024-03-14 16:58 +0100
          Re: Unicode-Sequenzen in Strings erkennen Wolfgang  Εnzinger <we_usenet@nurfuerspam.de> - 2024-04-16 00:05 +0200
            Re: Unicode-Sequenzen in Strings erkennen Wolfgang  Εnzinger <we_usenet@nurfuerspam.de> - 2024-04-16 00:33 +0200

csiph-web