2010-08-03 37 views
3

我只是想知道是否有人可以向我解釋價格比較網站的工作原理?我的意思是,如果它起作用,我認爲它的確如此(下面解釋),那麼我有一個非常好的項目可以爲自己工作,這應該可以長期賺取很多錢。價格比較網站 - 它們是如何工作的?

所以我認爲它的工作原理是每個供應商都提供一個比較網站連接到的RSS源。每種產品都有其自己的唯一代碼(由製造商提供),並以RSS提要中的標準代碼提供。比較網站收集有關誰供應哪種產品並比較供應特定產品的數據的數據。例如,圖書出版商可能會在每本書的背面,ISBN,出版商名稱,作者,標題(顯然),RRP,流派,事實/小說以及其他一些有用的信息中提供RSS源,國際標準書號</ISBN >。銷售書籍的比較網站可以按流派,作者等過濾這些書籍,並使用xsl樣式表(RSS提供的XML格式)顯示他們想要的樣子。

這是正確的,還是我對RSS是什麼或它是如何工作的完全錯誤的想法?還有什麼其他方式可以實現同樣的目標?

非常感謝提前。

問候,

理查德

PS如果這是張冠李戴,應被移動到另一個部分,那麼請會有人重新標記它。我試圖找到價格比較網站或類似的東西,但沒有這樣的標籤。我把我能想到的最相關的東西放在一邊。

+0

看起來[國際標準書號]沒有出來正確..我正在努力修復現在.. 編輯:固定 – ClarkeyBoy 2010-08-03 15:37:59

回答

10

你的理念似乎更像是理想的世界形勢。實際上,該網站使用了與其他任何搜索引擎一樣的抓取工具。該網站只是優化爬蟲,以颳去價格和產品信息。例如,他們知道戴爾網站上某件商品的價格位於ID爲「foo」的div中,產品信息位於文本「立即購買」後的第3個標籤中。

他們更可能限制他們爬到已知零售商的網站。

+0

當然,它的很多工作,在你描述的方式,以保持眼睛在網站上進行佈局更改(例如,如果「foo」已更改爲「bar」)。我正在考慮啓動我自己的網站,該網站利用來自制造商和供應商的飼料(爲了保密的目的,我不會說這些,但基本上允許觀衆根據供應商的數據選擇產品,然後給他們一個選擇零售商購買)。這不會是一年左右,但。理查德 – ClarkeyBoy 2010-08-03 15:48:33

+1

是的,這是很多的工作......但它不需要與被抓取的網站的合作 – Quentin 2010-08-03 15:52:30

+0

這是一個很大的工作,價格比較網站的質量取決於他們的抓取引擎有多好。 – speshak 2010-08-03 15:54:37

5

正如speshak所說,他們通常使用爬蟲並解析HTML。

店鋪網站不提供RSS源的原因,是因爲他們討厭比較網站。它嚴格把重點放在價格上。如果有20家商店受到監控,這意味着商店有19%的機會不是最低的。商店寧願你直接訪問他們的網站,他們有機會說服你根據服務支付價格。

+0

嗯可能是最好的堅持飼料的製造商(誰不會賣零售,並有興趣讓他們的產品在那裏)然後沖刷零售商網站的價格..感謝您的意見。 – ClarkeyBoy 2010-08-03 15:54:03

0

我不認爲網站爬蟲是最好的選擇,我也不認爲這是真正合法的,至少在西班牙。如果不允許,您不能使用其他人的產品品牌

0

價格比較網站通過後端數據抓取動態抓取各種網上購物門戶網站的結果,並向客戶提供最佳交易,然後直接重定向到提供最便宜的交易的購物門戶並完成購買。他們採用快速查詢處理技術,爲消費者帶來快速搜索結果,並提供輕鬆導航,使客戶能夠在單一平臺上瀏覽最流行的品牌,最受歡迎的產品和最暢銷的產品。他們在LAMP平臺上使用開源技術,即PHP/MySql來完成實時比較的任務。

+0

什麼是問題,請提供一些你已經工作的代碼塊。 – 2013-12-19 11:19:05

0

邏輯可以從網站到網站有所不同。我們抓取主要的在線食品交付網站來獲取菜單詳情。並非所有的網站都公開API,因此網站爬行是唯一的方法。 我們目前正在使用Jsoup庫(用於Java平臺)來提取這些網站的HTML。