2017-08-31 48 views
1

考慮此鏈接: https://www.reddit.com/r/todayilearned/comments/6x6iz8/til_princess_diana_on_live_tv_shook_the_hand_of/?ref=share&ref_source=link從reddit的網址,以獲取原始URL

原來一樣被

http://www.bbc.com/news/av/magazine-39490507/how-princess-diana-changed-attitudes-to-aids

使用JavaScript,我怎樣才能從第一個鏈接的原始鏈接,而無需使用Reddit API?

+0

耶刮頁面,獲得鏈接 –

+0

爲了給你一個不同的角度或糾正你的問題。您提供的鏈接以任何方式引用bbc.com鏈接。只是碰巧你的原始鏈接指向的頁面包含該鏈接。所以唯一的辦法就是刮掉那個鏈接的頁面。 – Paul

+0

@保羅:這個格式是你得到了什麼(而不是原來的鏈接)當您嘗試(通過點擊分享按鈕) – Ari

回答

2

如果你談論的是在網頁中運行的JavaScript,你不能。你需要使用Reddit API,或者刮掉Reddit網頁。但是,由於跨源安全規則,您無法使用JavaScript來抓取網頁,因此您必須使用該API。

編輯:啊,保羅只是指出你所標記的Node.js;如果你是從服務器執行此操作,則可能會發生刮擦。查找「用node.js進行刮擦」。在粗略瀏覽一下Google之後,看起來大多數解決方案都需要下載Reddit網頁的HTML,然後使用名爲cheerio的庫進行解析。還有這個看起來很有前景的東西scrape-it

+1

他做了標籤node.js,所以也許我們可以假設它是服務器端而不是客戶端。 – Paul

+0

這不提供問題的答案。要批評或要求作者澄清,請在其帖子下方留言。 - [來自評論](/ review/low-quality-posts/17202436) – GrumpyCrouton