Scrape URL


Höfundur
benregn
Nörd
Póstar: 126
Skráði sig: Fim 28. Jún 2007 19:38
Reputation: 0
Staða: Ótengdur

Scrape URL

Pósturaf benregn » Mán 15. Sep 2008 22:39

Ekki getur einhver útskýrt fyrir mér hvað "Scrape URL" eða bent mér í áttina hvar ég get fræðst um það? Ég fæ ekkert gagnlegt upp í Google :S

Takk



Skjámynd

hagur
Besserwisser
Póstar: 3125
Skráði sig: Mið 17. Des 2003 16:11
Reputation: 455
Hafðu samband:
Staða: Ótengdur

Re: Scrape URL

Pósturaf hagur » Þri 16. Sep 2008 10:11

"URL Scraping" er einfaldlega að "stela" upplýsingum af vefsíðu, þ.e nota einhverskonar utility eða forritskóða til að gera HTTP request á ákveðna vefsíðu, lesa innihald hennar og e.t.v parsa það til að ná í ákveðnar upplýsingar af síðunni en sleppa öðrum.

Hér er dæmi, segjum sem svo að þig langi rosalega mikið til að birta veðurspána á síðunni þinni og þú hafir ekki aðgang í til þess gerða gagnaveitu (vefþjónustu, XML feed etc.), þá gætirðu einfaldlega url-scrape-að veðursíðuna á Mbl.is og extractað út þeim hluta sem þú vilt fá og birt hann á vefnum þínum.




Höfundur
benregn
Nörd
Póstar: 126
Skráði sig: Fim 28. Jún 2007 19:38
Reputation: 0
Staða: Ótengdur

Re: Scrape URL

Pósturaf benregn » Þri 16. Sep 2008 16:17

Þakka þér fyrir þessa ágætu útskýringu og skjót svör. =D> En ekki veistu um einhverja síðu/síður með frekaru upplýsingum?



Skjámynd

hagur
Besserwisser
Póstar: 3125
Skráði sig: Mið 17. Des 2003 16:11
Reputation: 455
Hafðu samband:
Staða: Ótengdur

Re: Scrape URL

Pósturaf hagur » Þri 16. Sep 2008 17:40

Ekki málið :8)

Það er hellingur til um þetta á netinu.

T.d hér: http://www.rexx.com/~dkuhlman/quixote_htmlscraping.html

Þetta er oft líka kallað "HTML screen scraping".

Hérna er fín grein um þetta á Wikipedia: http://en.wikipedia.org/wiki/Screen_scraping með undirkafla um URL/Web scraping: http://en.wikipedia.org/wiki/Screen_scr ... b_scraping



Skjámynd

Dagur
Geek
Póstar: 802
Skráði sig: Fös 19. Sep 2003 14:00
Reputation: 65
Staðsetning: Reykjavík
Hafðu samband:
Staða: Ótengdur

Re: Scrape URL

Pósturaf Dagur » Mið 17. Sep 2008 10:11

Ef þú kannt python þá mæli ég með http://www.crummy.com/software/BeautifulSoup/

ef ekki þá mæli ég með að þú lærir python




Höfundur
benregn
Nörd
Póstar: 126
Skráði sig: Fim 28. Jún 2007 19:38
Reputation: 0
Staða: Ótengdur

Re: Scrape URL

Pósturaf benregn » Mið 17. Sep 2008 14:10

hagur og Dagur, takk fyrir svörin. Ég var einmitt að spá hvort þetta væri það sama, þ.e. URL scraping og screen scraping. Fannst ég ekki finna neitt með google sem skýrði "URL Scraping" út almennilega en slatta um screen scraping. Þar sem þetta er sami hluturinn (?) þá er ég búinn að finna nokkar góðar :)

Ég hef verið að pæla í að læra python, kann í rauninni ekkert í forritun en hef áhuga á henni. Ekki lumiði á einhverjum góðum tutorials eða góðum bókum fyrir byrjanda?



Skjámynd

Dagur
Geek
Póstar: 802
Skráði sig: Fös 19. Sep 2003 14:00
Reputation: 65
Staðsetning: Reykjavík
Hafðu samband:
Staða: Ótengdur

Re: Scrape URL

Pósturaf Dagur » Fim 18. Sep 2008 16:25

benregn skrifaði:hagur og Dagur, takk fyrir svörin. Ég var einmitt að spá hvort þetta væri það sama, þ.e. URL scraping og screen scraping. Fannst ég ekki finna neitt með google sem skýrði "URL Scraping" út almennilega en slatta um screen scraping. Þar sem þetta er sami hluturinn (?) þá er ég búinn að finna nokkar góðar :)

Ég hef verið að pæla í að læra python, kann í rauninni ekkert í forritun en hef áhuga á henni. Ekki lumiði á einhverjum góðum tutorials eða góðum bókum fyrir byrjanda?


Það er til slatti af góðum (og ókeypis) kennslubókum fyrir Python á netinu. A byte of python er mjög góð til dæmis.

Annars keypti ég mér Learning python á sínum tíma. Ég mæli með henni.


Það er góður listi yfir bækur og fleira á python.org