Path: csiph.com!news.redatomik.org!newsfeed.xs4all.nl!newsfeed8.news.xs4all.nl!news.tele.dk!news.tele.dk!small.news.tele.dk!feed118.news.tele.dk!news.corell.dk!news2.jernurt.dk!.POSTED!not-for-mail From: Anders Wegge Keller Newsgroups: dk.edb.programmering Subject: Re: [Python] Problemer med utf8 og =?UTF-8?B?bMOmc25pbmc=?= af filer Date: Tue, 22 Nov 2016 15:41:35 +0100 Organization: Disorganized Lines: 36 Message-ID: <20161122154135.4d97fb17@wegge.dk> References: <4wqbrc72bhkk$.dlg@lundhansen.dk> Mime-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: quoted-printable X-Trace: rollo.jernurt.dk 1479825741 2777 2.110.225.100 (22 Nov 2016 14:42:21 GMT) X-Complaints-To: usenet@news2.jernurt.dk NNTP-Posting-Date: Tue, 22 Nov 2016 14:42:21 +0000 (UTC) X-Newsreader: Claws Mail 3.14.0 (GTK+ 2.24.31; x86_64-redhat-linux-gnu) Xref: csiph.com dk.edb.programmering:45 P=C3=A5 Tue, 22 Nov 2016 09:57:35 +0100 Bertel Lund Hansen skrev: > Jeg er for ikke s=C3=A5 l=C3=A6nge siden g=C3=A5et over til utf8. Det har= givet > nogle nye udfordringer. Det g=C3=A5r smertefrit at lave en hjemmeside > fordi browserne ogs=C3=A5 kender utf8, men ved l=C3=A6sning af filer bliv= er > der ballade. Python l=C3=A6ser jo =C3=A9n byte ad gangen, s=C3=A5 en test= som: >=20 > if '=C3=A6' in line: > print line =20 > virker ikke. Jeg kan godt lave en workaround (omend den er > besv=C3=A6rlig og skal rettes til til inputfilen), men der m=C3=A5 v=C3= =A6re en > organiseret m=C3=A5de at g=C3=B8re det p=C3=A5. Er der nogen der kan hj= =C3=A6lpe? N=C3=A5r du sp=C3=B8rger p=C3=A5 den m=C3=A5de, regner jeg med at du bruge= r python2. Du burde bruge python3 i stedet, men hvis du ikke har mulighed for det, s=C3=A5 star= t med Py2 unicode HOWTO: Du skal pr=C3=A6fixe dine unicode strengkonstanter med u: if u'=C3=A6' in line: print line --=20 //Wegge