Groups | Search | Server Info | Login | Register


Groups > pl.comp.lang.asm > #43

Re: Konwerter txt do UTF 8

From "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl>
Newsgroups pl.comp.lang.asm
Subject Re: Konwerter txt do UTF 8
Date 2022-03-28 18:59 +0200
Organization Aioe.org NNTP Server
Message-ID <t1spgn$9c9$1@gioia.aioe.org> (permalink)
References (8 earlier) <623e3867$0$480$65785112@news.neostrada.pl> <t1ndg2$tgp$1@gioia.aioe.org> <623f41a8$0$479$65785112@news.neostrada.pl> <t1ph5b$qu7$1@gioia.aioe.org> <6241656d$0$479$65785112@news.neostrada.pl>

Show all headers | View raw


W dniu 28.03.2022 o 09:36, Kamil pisze:
> Użytkownik "Bogdan (bogdro)"  napisał:
> 
>>  I to jest właśnie to, co poruszyłem w mojej "drugiej istotnej 
>> idei": przeszukujesz bufor wejściowy znak po znaku, ale po JEGO 
>> znaku, a NIE po znaku, który przerabiasz (tj. "ą", "ć", ...).
> 
> Co to znaczy "przeszukujesz"? Czytam znak po znaku porównując go z 
> założonym kryterium. Jeśli warunek nie jest spełniony, zapisuję znak 
> bez zmian, a jeśli spełniony zapisuję znak w postaci jego 
> reprezentacji w UTF 8.


Tak.


>> Jeśli przerabiasz najpierw wszystkie "ą", potem wszystkie "ć", potem 
>> "ę" itd., to faktycznie tworzy to problemy, o których obaj mówimy -
> j> ak "wiedzieć", gdzie teraz zapisać wynik.
> 
>>  Ja zaś proponuję coś, co można by zapisać pseudokodem:
> 
>> odczytać plik wejściowy do bufora input
> 
>> i = 0;  // indeks do bufora wejściowego
>> o = 0;  // indeks do bufora wyjściowego
> 
>> while i < długość input
>> if input[i] = 'ą'
>> output[o] = "&#XXX;";
>> o = o + 6;
>> else if input[i] = 'ć'
>> output[o] = "&#XXX;";
>> o = o + 6;
>> .....
>> end while
> 
>> zapisać bufor output do pliku wyjściowego
> 
>> Dzięki takiemu podejściu nie musisz za każdą nową literą zaczynać 
>> znów zapisywać do output i uważać, pod jaki adres zapisujesz (tj. 
>> pamiętać, ile zmienionych liter było już do tej pory).
> 
> To już opisałem wcześniej:
> 
> Jeśli by procedura mogła szukać wszystkich znaków trzeba by było 
> wprowadzić
> zmienne zawierające wartości liczników, korygowane po każdym 
> znalezionym znaku.


Tak, to co nazwałem "i" oraz "o" w pseudo-kodzie.


> To skomplikowane i niepewne.


Co kto lubi. Mi łatwiej sterować dwiema zmiennymi do dwóch buforów, 
niż mieć jedną i "jeździć" z nią w przód i w tył. Jeśli inny sposób 
będzie dla Ciebie wygodniejszy, to go użyj.

[...]


-- 
Regards - Bogdan ('bogdro') D.                 (GNU/Linux & FreeDOS)
X86 assembly (DOS, GNU/Linux):    http://bogdro.evai.pl/index-en.php
Soft(EN): http://bogdro.evai.pl/soft  http://bogdro.evai.pl/soft4asm
www.Xiph.org  www.TorProject.org  www.LibreOffice.org  www.GnuPG.org

Back to pl.comp.lang.asm | Previous | NextPrevious in thread | Next in thread | Find similar


Thread

Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-21 15:28 +0100
  Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-22 13:18 +0100
    Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-22 15:27 +0100
      Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-22 21:37 +0100
        Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-22 22:42 +0100
          Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-23 12:45 +0100
            Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-24 13:59 +0100
              Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-24 18:18 +0100
                Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-25 22:47 +0100
                Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-25 23:03 +0100
                Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-26 17:03 +0100
                Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-26 17:38 +0100
                Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-27 13:17 +0200
                Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-28 09:36 +0200
                Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-28 18:59 +0200
                Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-29 17:50 +0200
            Re: Konwerter txt do UTF 8 "Radoslaw Szwed" <radekszwed@pochta.fm> - 2022-03-25 06:29 +0100
              Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-25 22:37 +0100

csiph-web