2017-07-03 65 views
0

我正在使用X射線來廢除分頁的網頁。下面是一些HTML通過文本的X射線分頁過濾器

<td align="center" style="font-size: 11pt;"> 
    <div class="paginate" style="font-size: 11pt;"> 
    <span class="disabled">Previous</span> 
    <span class="current">1</span> 
    <a href="link2.html">2</a> 
    <a href="link2.html">Next</a> 
    </div> 
</td> 

我想通過Next按鈕報廢。但是網頁的例子被它的類名稱所掠奪。

x('https://blog.ycombinator.com/', '.post', [{ 
    title: 'h1 a', 
    link: '[email protected]' 
}]) 
    .paginate('.nav-previous [email protected]') 

我想知道如何通過選擇Next按鈕中的鏈接來分頁?

在此先感謝。

+0

寫這篇文章我會寫一個自定義的解析器,將適合你的需求最好。 – Lazyexpert

+0

@Lazyexpert我想你是對的,我試圖懶惰通過使用X射線。但它似乎並不適合。最初我使用request + cheerio,但我試圖廢除子頁面(共4層)。刮4層依次緩慢,你知道我怎麼能將它轉換成並行請求? – Winston

+0

你可以使用Promise.all,你可以使用async.parallel或者再次使用基於回調的自定義解決方案:) – Lazyexpert

回答

0

過濾器通過文本

.paginate('.paginate a:contains(Next)@href')