accumulo

    0熱度

    1回答

    我想要使用一個HashSet,該HashSet在映射時對一個文件存在/工作,然後在下一個文件被映射時重置/重新創建。我修改了TextInputFormat來覆蓋isSplitable以返回false,這樣文件就不會被分割,並且由Mappers作爲一個整體進行處理。是否有可能做這樣的事情?或者有另一種方法可以減少對Accumulo表的寫入嗎? 讓我開始我不相信我想要一個全局變量。我只想確保唯一性,從

    0熱度

    2回答

    我有一個性能問題,同時使用select查詢處理十億條記錄,我有一個表作爲 CREATE TABLE `temp_content_closure2` ( `parent_label` varchar(2000) DEFAULT NULL, `parent_code_id` bigint(20) NOT NULL, `parent_depth` bigint(20) NOT

    1熱度

    3回答

    我是Accumulo的新手。我知道我可以編寫Java代碼來使用Hadoop和MapReduce掃描,插入,更新和刪除數據。我想知道的是在Accumulo中聚合是否可行。 我知道,在MySQL的,我們可以使用groupby,orderby,max,min,count,sum,join S,嵌套查詢等是他們的任何可能性,以直接或間接使用Accumulo這些功能。

    3熱度

    2回答

    我無法獲得一個批處理掃描程序只掃描特定的行,當設置開始和停止鍵到同一件事情時我得不到條目的回來,當使用掃描儀我得到這個異常: 「java.lang.IllegalArgumentException異常:啓動鍵必須大於結束鍵在較少範圍(測試:[] 0假,測試:[] 0假)」 ... 我寫在Visual Studio 2010中使用C#,並在項目中使用Thrift(ver 0.9.1.1)和Accum

    -1熱度

    1回答

    我是Accumulo的新手。我配置了Hadoop,Zookeeper,Accumulo。 我也瀏覽了Apache Accumulo wiki和accumulo.apache.org ,但他們只有少量的例子,從 的發展角度揭示了較少的信息。任何人都可以建議我可以找到Accumulo 的資源或PDF文件嗎?

    0熱度

    1回答

    所以我的一般問題是「是否有可能讓Accumulo BatchScanner僅將每個範圍的第一個結果拉回來?」 現在關於我的用例的一些細節可能有更好的方法來解決這個問題。我有表示來自不同系統的消息的數據。可以有不同類型的消息。我的用戶希望能夠詢問系統的問題,例如「給我所有這些系統某個特定時間的最新消息」。 我的表佈局看起來像這樣 rowid: system_name, family: message

    1熱度

    1回答

    給定一個鍵或一個鍵的列表,構建一個累加的複雜服務器端過濾器的方法是什麼。 例如:filter a或filter b? 例如:filter a AND filter b或filter c AND filter d? 這甚至可能嗎?

    1熱度

    1回答

    我試圖在裝載了Mountain Lion的OS X上安裝這些技術以用於測試目的。該設置是使用'localhost'的單節點設置。 我遇到的幾個問題... 1)運行sudo的zkCli - > LS /拋出一個錯誤 Exception in thread "main" org.apache.zookeeper.KeeperException$ConnectionLossException: Keep

    1熱度

    1回答

    源迭代器如何設置源SortedKeyValueIterator? 在許多迭代器中,我看到一個初始化(init)方法和source.get *方法,但我沒有看到這些方法的具體實現。有沒有一個基礎迭代器,所有這些迭代器都是在我沒有看到的頂部實現的?

    0熱度

    2回答

    我正在使用hadoop.2.2.0,當我嘗試初始化accumulo時,出現以下錯誤。 Hadoop和Zookeeper正在這個系統上運行。從./accumulo類路徑命令 [email protected]:/usr/local/bin/accumulo-1.5.0/bin# ./accumulo init Thread "init" died null java.lang.