mapreduce

    3熱度

    1回答

    我正在開發一種Ruby on Rails中的個性化搜索引擎,目前我正試圖根據用戶的記錄實時地對結果進行排序的最佳方式。 示例:搜索的項目可以具有標籤(帶有ID的單獨實體),例如項目具有標籤= [1, 5,10,23,45]。 另一方面,用戶可能已經標記了一些特別感興趣的標籤,所以說用戶具有標籤= [5,23]。 用於排序結果的分數應該考慮用戶「盯着」項目標籤的數量。例如,物品的得分根據物品的屬性爲

    13熱度

    5回答

    我正在尋找其他人如何使用Hadoop或其他類似MapReduce技術的一般信息。一般來說,我很好奇你是否正在編寫MR應用程序來處理現有數據集(如Web服務器日誌文件),還是正在編寫生成和處理新數據集的應用程序? 編輯: 後續問題 (1)你是否執行對其他MR程序生成數據的MR程序? (2)你是否曾經需要使用MR修改現有的數據組? (3)你曾與其他開發者分享你的數據集嗎?

    141熱度

    9回答

    與我CouchDB問題。 任何人都可以在用詞上numbnuts能夠理解解釋的MapReduce?

    7熱度

    9回答

    我目前正在設計一個應用程序,它有一個模塊,它將從數據庫加載大量數據,並根據具體情況通過各種計算將其減少到更小的集合。 許多更密集的操作都具有確定性並且適合並行處理。 提供我有一個循環遍歷從數據庫到達的大量數據塊,併爲每個調用一個沒有副作用的確定性函數,我將如何使它,以便程序不會等待函數返回,而是設置下一個呼叫,所以他們可以並行處理?現在,用一種天真的方式來證明這個原則會對我有用。 我已經閱讀過Go