2017-03-04 73 views
0

這是一個非常廣泛的問題,請耐心等待。Ruby on Rails:從博客網站收集數據

我想創建一個應用程序,從另一個網站,特別是medium.com獲取數據。但是,我不認爲媒體有API。

具體來說,我想要達到的目標是在medium.com上搜索500個或更多個喜歡的文章,或者可能有50個或更多回復(評論)的文章。我想用紅寶石做到這一點 你認爲我能做到這一點?如果你知道如何,請告訴我正確的方向。預先感謝您:)

+0

嗯,你有沒有嘗試搜索中的API? https://github.com/Medium/medium-api-docs –

回答

1

我會建議使用所謂的引入nokogiri紅寶石寶石webscraping。
這是一種獲取可用於幾乎任何網站的數據的通用方法。

看看這些鏈接上手:-)
Web Scraping with Ruby and Nokogiri for Beginners
和個人最喜歡的
Parsing HTML with Nokogiri

+0

我會檢查它。感謝您的指導!現在我知道從哪裏開始@orion – Lorelyn

+0

非常歡迎您!可能需要一點時間才能解決它,但要堅持下去,如果遇到問題,請提問。這是完全值得的。祝你好運 :-) – orion

1

目前,沒有任何API來獲取所有的帖子,無論是搜索他們,看到https://github.com/Medium/medium-api-docs/issues/48

+0

是的,我也猜到了。這就是爲什麼我想通過解析數據手動完成它,儘管我只是RoR的初學者。這也是爲什麼我問我應該採取什麼方法來做到這一點。雖然感謝您的確認! :) – Lorelyn