Groups | Search | Server Info | Keyboard shortcuts | Login | Register [http] [https] [nntp] [nntps]


Groups > dk.edb.programmering > #15 > unrolled thread

Linkchecker i Python

Started byBertel Lund Hansen <gadekryds@lundhansen.dk>
First post2016-05-21 09:48 +0200
Last post2016-05-24 16:45 +0200
Articles 4 — 2 participants

Back to article view | Back to dk.edb.programmering


Contents

  Linkchecker i Python Bertel Lund Hansen <gadekryds@lundhansen.dk> - 2016-05-21 09:48 +0200
    Re: Linkchecker i Python Anders Wegge Keller <wegge@wegge.dk> - 2016-05-23 21:24 +0200
      Re: Linkchecker i Python Bertel Lund Hansen <gadekryds@lundhansen.dk> - 2016-05-23 22:44 +0200
        Re: Linkchecker i Python Anders Wegge Keller <wegge@wegge.dk> - 2016-05-24 16:45 +0200

#15 — Linkchecker i Python

FromBertel Lund Hansen <gadekryds@lundhansen.dk>
Date2016-05-21 09:48 +0200
SubjectLinkchecker i Python
Message-ID<8xoqrtzgw863.dlg@lundhansen.dk>
Jeg kunne tænke mig at skrive en linkchecker i Python, men det
spørgsmål jeg har (i øjeblikket) angår mere HTTP-protokollen, så
derfor spørger jeg her.

Jeg har fundet ud af at lave en connection til en webside, og jeg
kan også få status skrevet ud, men hvis den så siger "Moved
permanently", hvordan får jeg så fat i den direkte url - den er
redirectet til?

-- 
Bertel - stadig med Linux

[toc] | [next] | [standalone]


#16

FromAnders Wegge Keller <wegge@wegge.dk>
Date2016-05-23 21:24 +0200
Message-ID<20160523212430.0cecaaa7@wegge.dk>
In reply to#15
On Sat, 21 May 2016 09:48:31 +0200
Bertel Lund Hansen <gadekryds@lundhansen.dk> wrote:

> Jeg kunne tænke mig at skrive en linkchecker i Python, men det
> spørgsmål jeg har (i øjeblikket) angår mere HTTP-protokollen, så
> derfor spørger jeg her.
> 
> Jeg har fundet ud af at lave en connection til en webside, og jeg
> kan også få status skrevet ud, men hvis den så siger "Moved
> permanently", hvordan får jeg så fat i den direkte url - den er
> redirectet til?

 Det afhænger af hvordan du åbner linket. Bruger du urllib, requests, eller
åbner du selv din socket?

-- 
//Wegge

[toc] | [prev] | [next] | [standalone]


#17

FromBertel Lund Hansen <gadekryds@lundhansen.dk>
Date2016-05-23 22:44 +0200
Message-ID<4les499y2sze$.dlg@lundhansen.dk>
In reply to#16
Anders Wegge Keller skrev:

>> Jeg har fundet ud af at lave en connection til en webside, og jeg
>> kan også få status skrevet ud, men hvis den så siger "Moved
>> permanently", hvordan får jeg så fat i den direkte url - den er
>> redirectet til?

> Det afhænger af hvordan du åbner linket. Bruger du urllib,
> requests, eller åbner du selv din socket?

Jeg bruger urllib.

-- 
Bertel - stadig med Linux

[toc] | [prev] | [next] | [standalone]


#18

FromAnders Wegge Keller <wegge@wegge.dk>
Date2016-05-24 16:45 +0200
Message-ID<20160524164514.5f20e00e@wegge.dk>
In reply to#17
On Mon, 23 May 2016 22:44:29 +0200
Bertel Lund Hansen <gadekryds@lundhansen.dk> wrote:

> Anders Wegge Keller skrev:
> 
> >> Jeg har fundet ud af at lave en connection til en webside, og jeg
> >> kan også få status skrevet ud, men hvis den så siger "Moved
> >> permanently", hvordan får jeg så fat i den direkte url - den er
> >> redirectet til?
> 
> > Det afhænger af hvordan du åbner linket. Bruger du urllib,
> > requests, eller åbner du selv din socket?
> 
> Jeg bruger urllib.

 Du burde nok overveje at bruge requests i stedet, medmindre du har behov
for at kunne styre SSL og HTTP Auth meget præcist. Men that aside, så tag et
kig på

<https://docs.python.org/3/library/urllib.request.html#module-urllib.response>

 Det objekt urlopen returnerer, har en geturl metode, der fortæller hvad du
er redirected til. 

-- 
//Wegge

[toc] | [prev] | [standalone]


Back to top | Article view | dk.edb.programmering


csiph-web