Groups | Search | Server Info | Keyboard shortcuts | Login | Register
Groups > de.comp.lang.python > #6126
| From | "Wolli Buechel" <wjb131@web.de> |
|---|---|
| Newsgroups | de.comp.lang.python |
| Subject | [Python-de] Re: Fwd: Keyboard coding |
| Date | 2024-07-24 15:55 +0000 |
| Message-ID | <172183650388.12053.598107056645157522@mail.python.org> (permalink) |
| References | <A6A89469-A2D0-434F-8E7D-8BBF76C64EBA@multi-matrix.de> |
Sehr geehrter Herr Schnoor,
Mehrfachzeichen in ziffern sind nicht lediglich "einige chinesische Zeichen" und auch nicht bloß "doppelt", sondern insgesamt 66 Zeichen aus folgenden Schriftsystemen:
DEVANAGARI : 6
BENGALI : 4
ORIYA : 3
TIBETAN : 7
KHMER : 11
OL CHIKI : 4
GEORGIAN : 20
CJK : 11
Dies kann man mit dem Python-Modul unicodedata herausfinden:
import unicodedata # Python-Doku: https://docs.python.org/3/library/unicodedata.html
# extrahiere aus ziffern : Mehrfachzeichen, Zeilenumbrüche, Leerzeichen
mehrfach = sorted(list(set([ x for x in ziffern if ziffern.count(x) > 1 or x in "\n\t " ])))
Names = dict()
for i, ch in enumerate(mehrfach):
try:
chName = unicodedata.name(ch)
except:
chName = unicodedata.category(ch)
language = chName.split()[0]
if 'OL' in language:
language = ' '.join(chName.split()[:2])
Names[language] = Names.get(language, 0) + 1
# print("[%2d] >%s<\t%5d\t%s" % (i+1, ch, ord(ch), chName))
for k, v in Names.items():
print("%s \t: %2d" % (k, v))
W. Buechel
Back to de.comp.lang.python | Previous | Next — Next in thread | Find similar
[Python-de] Re: Fwd: Keyboard coding "Wolli Buechel" <wjb131@web.de> - 2024-07-24 15:55 +0000
[Python-de] Fwd: Keyboard coding Erich Schnoor <eschnoor@multi-matrix.de> - 2024-07-25 12:57 +0200
[Python-de] Re: Fwd: Keyboard coding Christian Baier <chrbaier@gmx.de> - 2024-07-25 13:45 +0200
[Python-de] Re: Fwd: Keyboard coding Frank GRELLERT <frank.grellert@gmail.com> - 2024-07-25 14:42 +0200
Re: [Python-de] Re: Fwd: Keyboard coding "Peter J. Holzer" <hjp-usenet4@hjp.at> - 2024-07-25 18:03 +0200
csiph-web