Groups | Search | Server Info | Login | Register


Groups > pl.comp.lang.asm > #28

Re: Konwerter txt do UTF 8

From "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl>
Newsgroups pl.comp.lang.asm
Subject Re: Konwerter txt do UTF 8
Date 2022-03-22 13:18 +0100
Organization Aioe.org NNTP Server
Message-ID <t1ceqt$kd0$1@gioia.aioe.org> (permalink)
References <62388b93$0$481$65785112@news.neostrada.pl>

Show all headers | View raw


W dniu 21.03.2022 o 15:28, Kamil pisze:
> Witam
> 
> Postanowiłem napisać programik konwertujący polskie "pliterki" z txt 
> ASCII na UTF 8. I coś mnie zaniepokoiło. Otóż znaki te w UTF 8 maja na 
> końcu średnik. A o ile dobrze pamiętam sam średnik i wszystko za nim 
> jest traktowane jako komentarz i pomijane. Dobrze sądzę?
> 
> Pozdrawiam

Witam.

Ogólnie - tak, "wolnostojący" średnik w asemblerze jest początkiem 
komentarza, ale to nie przeszkadza używać go w napisach czy komendach:

	napis db 'a;b;c'

	mov al, ';'

Natomiast znaki "ąćęłńóśźż" kodują się w UTF-8 na wartości szesnastkowe

	C4 85 C4 87  C4 99 C5 82  C5 84 C3 B3  C5 9B C5 BA  C5 BC

Tutaj średnika nigdzie nie ma i to jest ta część problemu, której za 
bardzo nie rozumiem. Chyba że masz na myśli np. encje HTML postaci 
"&#C485;", to wtedy wracamy do używania średnika w stałej znakowej i 
to powinno bez problemu działać.

-- 
Pozdrawiam/Regards - Bogdan                     (GNU/Linux & FreeDOS)
Kurs asemblera x86 (DOS, GNU/Linux):            http://bogdro.evai.pl
Grupy dyskusyjne o asm:  pl.comp.lang.asm alt.pl.asm alt.pl.asm.win32
www.Xiph.org www.TorProject.org  Soft(EN): http://bogdro.evai.pl/soft

Back to pl.comp.lang.asm | Previous | NextPrevious in thread | Next in thread | Find similar


Thread

Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-21 15:28 +0100
  Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-22 13:18 +0100
    Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-22 15:27 +0100
      Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-22 21:37 +0100
        Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-22 22:42 +0100
          Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-23 12:45 +0100
            Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-24 13:59 +0100
              Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-24 18:18 +0100
                Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-25 22:47 +0100
                Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-25 23:03 +0100
                Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-26 17:03 +0100
                Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-26 17:38 +0100
                Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-27 13:17 +0200
                Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-28 09:36 +0200
                Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-28 18:59 +0200
                Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-29 17:50 +0200
            Re: Konwerter txt do UTF 8 "Radoslaw Szwed" <radekszwed@pochta.fm> - 2022-03-25 06:29 +0100
              Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-25 22:37 +0100

csiph-web