github-archive

    1熱度

    1回答

    我正在嘗試處理Github數據挑戰的入口,並試圖分析一組PushEvent,但我得到了一些奇怪的(?)結果。 users = Hash.new(0) (0..23).each do |hour| gz = open("http://data.githubarchive.org/2013-04-01-#{hour}.json.gz") js = Zlib::GzipReader

    2熱度

    2回答

    在github網站上,很多問題都與拉取請求或提交連接(引用)。有沒有一種方法可以在github存檔數據庫或github API中找到連接?

    0熱度

    1回答

    我試圖通過輸入http://data.githubarchive.org/2012-04-15.json.gz從GitHub存檔獲取歷史數據,但沒有收到數據。 如何獲取有關GitHub活動的數據?

    1熱度

    1回答

    我正在嘗試在github存檔(http://www.githubarchive.org/)數據上使用Google BigQuery數據來獲取最新事件發生時的存儲庫統計信息,而我試圖以最多的觀察者來獲取這個存儲庫。我意識到這是很多,但我覺得我真的接近於在一個查詢中得到它。 這是查詢我現在有: SELECT repository_name, repository_owner, repository_o

    0熱度

    1回答

    Github上的數據丟失Big Query上的數據存檔? 使用BigQuery's tables from the Github Archive,並運行於爲typelevel/cats repo拉請求的查詢,還有之前的2016年1月1日,沒有項目,儘管在2015年1月28日開始實際回購展映活動。 Link to github repo showing earlier pull requests 查

    2熱度

    1回答

    的GitHub Archive項目狀態 GitHub的歸檔是一個項目,記錄公共GitHub的時間表,存檔,並使其方便作進一步的分析。 該存檔也可通過Google Big Query查詢。然而,看起來我要麼丟失了一些東西,要麼只有一部分數據可用。 事實上,運行下面的查詢只返回1636 WatchEvents(開始或停止),而Rails repository賬戶超過14300觀察家。 SELECT a

    0熱度

    1回答

    好吧,我想構建一個簡單的網絡應用程序,它會以某種方式使用githubarchive數據。首先,儘管使用BigQuery數據庫和它的API,但是,我的免費配額將在一天內完成。 因此,我所做的就是從網站下載所有2012/2013記錄,並將它們解壓縮到一個文件夾中 - 現在我有10k + json文件比我想用來爲我的應用獲取數據。 所以我想要:創建一個GAE(python)或Django應用程序來可視化