我正在試驗一些機器學習技術。 在這種情況下PSO-KMean用於聚類。如何在單個請求中查詢Stack Exchange站點上所有標記的計數
我想我可能會對其進行測試,通過按堆棧交易所API高達 搶的標籤列表以及每個標籤的數量, 然後再轉換成表示每個站點位置彩車的數組中的「標籤空間「
from stackauth import StackAuth
import stackexchange
site_data = {}
n_sites= 20
for site_auth in StackAuth().sites()[3:n_sites+3]: #Skip big 3
site=site_auth.get_site()
site_tags = {}
for tag in site.all_tags():
site_tags[(tag.name)]=tag.count
site_data[site.domain] = site_tags
現在這個必須有gone over the 10,000 requests limit後,我用了幾次混亂,因爲周圍 我StackExchangeError: 502 [throttle_violation]: too many requests from this IP, more requests available in 81719 seconds
所以我想它正在請求網站上的每個標籤以獲得它的數量。 這對任何人都沒有好處, 對我來說比較慢,而且在堆棧交換基礎架構上的工作也更多。 我覺得必須有一種方法可以獲得每個站點1次訪問中的信息, 但是我不熟悉API來解決這個問題。
代碼中的#skip big 3是什麼意思? – 2014-10-01 19:50:11
這意味着跳過超級用戶,堆棧溢出和服務器故障。他們(特別是Stackoverflow)只是很大。這個代碼實際上可能會跳過Meta SE,SO和SU,但不是SF,但是我確定,cos Meta是巨大的,比SF更大,我猜想 – 2014-10-01 22:35:35
所以你想出了一個解決方案嗎?如果是這樣,請發佈。這對其他人會有用! – 2014-10-01 23:12:59