Groups | Search | Server Info | Login | Register
Groups > pl.comp.lang.asm > #43
| From | "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> |
|---|---|
| Newsgroups | pl.comp.lang.asm |
| Subject | Re: Konwerter txt do UTF 8 |
| Date | 2022-03-28 18:59 +0200 |
| Organization | Aioe.org NNTP Server |
| Message-ID | <t1spgn$9c9$1@gioia.aioe.org> (permalink) |
| References | (8 earlier) <623e3867$0$480$65785112@news.neostrada.pl> <t1ndg2$tgp$1@gioia.aioe.org> <623f41a8$0$479$65785112@news.neostrada.pl> <t1ph5b$qu7$1@gioia.aioe.org> <6241656d$0$479$65785112@news.neostrada.pl> |
W dniu 28.03.2022 o 09:36, Kamil pisze:
> Użytkownik "Bogdan (bogdro)" napisał:
>
>> I to jest właśnie to, co poruszyłem w mojej "drugiej istotnej
>> idei": przeszukujesz bufor wejściowy znak po znaku, ale po JEGO
>> znaku, a NIE po znaku, który przerabiasz (tj. "ą", "ć", ...).
>
> Co to znaczy "przeszukujesz"? Czytam znak po znaku porównując go z
> założonym kryterium. Jeśli warunek nie jest spełniony, zapisuję znak
> bez zmian, a jeśli spełniony zapisuję znak w postaci jego
> reprezentacji w UTF 8.
Tak.
>> Jeśli przerabiasz najpierw wszystkie "ą", potem wszystkie "ć", potem
>> "ę" itd., to faktycznie tworzy to problemy, o których obaj mówimy -
> j> ak "wiedzieć", gdzie teraz zapisać wynik.
>
>> Ja zaś proponuję coś, co można by zapisać pseudokodem:
>
>> odczytać plik wejściowy do bufora input
>
>> i = 0; // indeks do bufora wejściowego
>> o = 0; // indeks do bufora wyjściowego
>
>> while i < długość input
>> if input[i] = 'ą'
>> output[o] = "&#XXX;";
>> o = o + 6;
>> else if input[i] = 'ć'
>> output[o] = "&#XXX;";
>> o = o + 6;
>> .....
>> end while
>
>> zapisać bufor output do pliku wyjściowego
>
>> Dzięki takiemu podejściu nie musisz za każdą nową literą zaczynać
>> znów zapisywać do output i uważać, pod jaki adres zapisujesz (tj.
>> pamiętać, ile zmienionych liter było już do tej pory).
>
> To już opisałem wcześniej:
>
> Jeśli by procedura mogła szukać wszystkich znaków trzeba by było
> wprowadzić
> zmienne zawierające wartości liczników, korygowane po każdym
> znalezionym znaku.
Tak, to co nazwałem "i" oraz "o" w pseudo-kodzie.
> To skomplikowane i niepewne.
Co kto lubi. Mi łatwiej sterować dwiema zmiennymi do dwóch buforów,
niż mieć jedną i "jeździć" z nią w przód i w tył. Jeśli inny sposób
będzie dla Ciebie wygodniejszy, to go użyj.
[...]
--
Regards - Bogdan ('bogdro') D. (GNU/Linux & FreeDOS)
X86 assembly (DOS, GNU/Linux): http://bogdro.evai.pl/index-en.php
Soft(EN): http://bogdro.evai.pl/soft http://bogdro.evai.pl/soft4asm
www.Xiph.org www.TorProject.org www.LibreOffice.org www.GnuPG.org
Back to pl.comp.lang.asm | Previous | Next — Previous in thread | Next in thread | Find similar
Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-21 15:28 +0100
Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-22 13:18 +0100
Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-22 15:27 +0100
Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-22 21:37 +0100
Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-22 22:42 +0100
Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-23 12:45 +0100
Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-24 13:59 +0100
Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-24 18:18 +0100
Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-25 22:47 +0100
Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-25 23:03 +0100
Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-26 17:03 +0100
Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-26 17:38 +0100
Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-27 13:17 +0200
Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-28 09:36 +0200
Re: Konwerter txt do UTF 8 "Bogdan (bogdro)" <bogdan@poczta.gazeta.pl> - 2022-03-28 18:59 +0200
Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-29 17:50 +0200
Re: Konwerter txt do UTF 8 "Radoslaw Szwed" <radekszwed@pochta.fm> - 2022-03-25 06:29 +0100
Re: Konwerter txt do UTF 8 "Kamil" <nospam@tlen.pl> - 2022-03-25 22:37 +0100
csiph-web