Síða 1 af 1

Scrape-a Vínbúðina.is

Sent: Lau 04. Okt 2014 17:20
af gosi
Er einhver góður í python og kann að búa til forrit sem scrapar Vínbúðina.
Var að reyna með scrapy en síðan þeirra er svo flókin að ég skildi það ekki almennilega.

Re: Scrape-a Vínbúðina.is

Sent: Lau 04. Okt 2014 17:54
af Frantic
Ég myndi byrja að prófa að lúppa í gegnum id dótið hjá þeim.
http://www.vinbudin.is/DesktopDefault.a ... ID=????????

Athuga hvort þú getir ekki náð öllu með því að byrja á 0 og enda á 100000.
Þarf þá að passa að scrape-a ekki þegar engar upplýsingar koma fram.
Hef sama og ekkert gert í python þannig ég get ekki hjálpað þér með hvaða tól þú gætir notað.
Vonandi einhver annar sem getur svarað því.

Re: Scrape-a Vínbúðina.is

Sent: Lau 04. Okt 2014 18:42
af dori
Skoðaðu beautiful soup ef þú vilt parsa html með python. Þetta scripy virkar samt rosa einfalt líka (þarft basically bara að skilgreina hvernig þetta liggur en lítið sem ekkert boilerplate). Getur prófað að nota https://www.kimonolabs.com/, það er voða fínt svona hýst lausn til að skrapa hluti af vefnum.

Hvað er það sem þú ert að reyna að gera nákvæmlega?

Re: Scrape-a Vínbúðina.is

Sent: Lau 04. Okt 2014 19:48
af gosi
Mig langar bara að prófa að scrapa þessa síðu því mér finnst hún svo óaðgengileg eitthvað. Ýmislegt sem hægt væri að laga hjá þeim.
Langar þá að tengja nokkra hluti saman um hina ýmsu drykki en síðan er svo illa gerð að það verður eitthvað flókið

Re: Scrape-a Vínbúðina.is

Sent: Lau 04. Okt 2014 20:49
af gosi
Það þarf annars ekkert að vera í python, jafnvel nodes eða einhverju öðru sem keyrist á linux

Re: Scrape-a Vínbúðina.is

Sent: Lau 04. Okt 2014 21:17
af dori
Ég á samt við hvað þú ætlar að gera. Nánari útlistun á því hvað þetta forrit sem þú ætlar að gera gerir.

Viltu bara betra yfirlit yfir hvað er til og hvað það kostar? Eitthvað annað og hvað þá? Eru upplýsingarnar í listanum nóg eða er eitthvað sem er bara á "detail síðunni" sem þig vantar?

Ertu bara að hugsa um eitthvað til heimanota eða eitthvað sem fleiri en þú myndir nota? Skiptir allt máli upp á hvað borgar sig að eyða miklu tíma í þetta.

Re: Scrape-a Vínbúðina.is

Sent: Lau 04. Okt 2014 21:35
af gosi
Já ég myndi vilja betra yfirlit. Þetta ætti nú að vera til heimanota. T.d. að leita og fletta finnst mér vera lélegt.
Stundum þegar ég er að skoða og fletti á næstu síðu, as in númerin neðst, þá vill stundum síðan fara á heildaryfirlit yfir drykki.
Það pirrar mig þegar mig vantar upplýsingar. Líka sendir síðan javascript í númerunum neðst.

Þessi kimonolabs.com er helvíti góð. Þakka þér fyrir þær upplýsingar :D

Re: Scrape-a Vínbúðina.is

Sent: Lau 04. Okt 2014 21:52
af hagur
Ef þú ert að fara að smíða scraper fyrir þetta, þá auðvitað býrðu til apis.is scraper og gerir þetta svo aðgengilegt fyrir alla þar ;-)

https://github.com/kristjanmik/apis#add ... w-endpoint

Re: Scrape-a Vínbúðina.is

Sent: Lau 04. Okt 2014 22:19
af gosi
Nauh þetta er sniðugt. Já ég kannski geri það.

Re: Scrape-a Vínbúðina.is

Sent: Fim 23. Okt 2014 14:57
af starionturbo
Eins mikið og ég elska að scrape-a, þá er hræðilega leiðinlegt að skrapa .NET doPostBackOjbara virkni með __VIEWSTATE.

Re: Scrape-a Vínbúðina.is

Sent: Fim 23. Okt 2014 15:28
af davida
Heyheyhey, my time to shine! Ég skrifaði litla skriftu til að gera akkúrat þetta og notaði til þess CasperJS og phantomJS. Þetta er allt á github og er að sjálfsögðu alveg mega nastí "þarf bara að fá þetta til að virka einu sinni" skriftukóði , engin ábyrgð tekin etcetc :).

Þú getur tékkað á þessu á https://github.com/davidarnarsson/boozefind . Eflaust pínu hausverkur að fá þetta til að virka. Þetta er líka + árs gamalt svo það getur vel verið að þetta brotni á móti síðunni í dag, ef einhverjar breytingar hafa orðið á henni.

Leitarvélin sjálf er uppsett á booze.axlabond.in . Þetta var nú bara smá parser flipp.

Re: Scrape-a Vínbúðina.is

Sent: Fim 23. Okt 2014 19:59
af rango

Re: Scrape-a Vínbúðina.is

Sent: Fös 31. Okt 2014 16:51
af gosi
Já!!! Svakalegt. Fer þetta semsagt á leitarsíðuna og kannar allar product og fer svo á næstu síðu?

Re: Scrape-a Vínbúðina.is

Sent: Sun 02. Nóv 2014 22:18
af davida
gosi skrifaði:Já!!! Svakalegt. Fer þetta semsagt á leitarsíðuna og kannar allar product og fer svo á næstu síðu?


Jebb, ef ég man rétt þá eru þetta 2 skriftur, ein til þess að taka inn vörurnar, og svo önnur til að scrapea details fyrir hverja vöru fyrir sig.