apache-storm

0熱度

1回答

我應該保持一個偏移量文件並讀取該偏移線，放出，更新偏移=偏移+ 1 class SimSpout(storm.Spout): # Not much to do here for such a basic spout def initialize(self, conf, context): ## Open the file with read only permit

0熱度

1回答

在多個Apache風暴螺栓任務之間共享一個併發哈希表

我有一個風暴螺栓，它將密鑰和值寫入特定元組的哈希表中，並使用存儲在其他元素中的密鑰從哈希映射中讀取值。當任務數量設置爲1時，它可以正常工作，但只要我增加了這個數字，那麼當它們不應該時，鍵就開始返回空值。我認爲這是因爲每個螺栓任務正在創建自己的哈希映射實例，因此數據不共享。我如何獲得所有螺栓任務共享一個Hashmap？我目前正在創建的準備方法HashMap中，像這樣： protected Map<

0熱度

1回答

類型錯誤：<打開文件「數據」，模式爲「r」是不JSON序列

我在打開包含一個文件得到錯誤文本等 rt @whufc_news : west ham are the only team in the top half of the premier league without a player in the england squad . !url rt @blackpplvines : don't say anything just rt_ !url

2熱度

1回答

爲什麼在實時處理中使用apache kafka

最近我一直在尋找使用storm，flink等進行實時數據處理...... 我遇到的所有體系結構都使用kafka作爲數據源和流處理器之間的一個層，爲什麼這個圖層應該存在？

1熱度

1回答

storm1.1.0：沒有找到匹配的字段：waitUntilReady for class org.apache.storm.pacemaker.PacemakerClient

當風暴的工作人員使用storm 1.1.0運行我的拓撲時，我得到了起搏器的錯誤 - > java.lang .IllegalArgumentException：未找到匹配的字段：waitUntilReady for class org.apache.storm.pacemaker.PacemakerClient 似乎在使用反射時，調用者無法找到方法waitUntilReady？但我在Pacema

0熱度

1回答

風暴 - 使用壓縮技術寫入HDFS

我想將我的風暴拓撲中傳入的所有原始數據存儲在HDFS羣集中。這是JSON或二進制數據，以2k /秒的速率傳入。我試圖使用HDFS螺栓（http://storm.apache.org/releases/0.10.0/storm-hdfs.htmlà，但使用正常的HDFS不允許壓緊螺栓使用序列文件博爾特壓縮纔是可能的。我不想使用序列文件，因爲我沒有一個真正的關鍵。另外，我已經卡桑德拉用於存儲

0熱度

1回答

Apache Strom字段分組是否可以跨多個工作人員使用？

我可以看到如何將字段內容和任務ID散列在一起用於保持字段中具有相同值的所有元組進入相同的螺栓任務。但是，如果有多名工人，他們應該如何保證？當然，螺栓任務不在工人之間共享？

0熱度

1回答

在apache風暴中collector.fail是做什麼的？

在apache風暴中collector.fail的作用是什麼？它是從源頭（噴口）重播元組，還是僅從它發出的最後一個螺栓重放元組？注意：我不固定我的元組，所以在這種情況下會發生什麼？

0熱度

1回答

在Apache風暴中提交字數拓撲時出錯

這是我嘗試運行的基本wordcount拓撲。但我收到錯誤爲'INFO org.apache.storm.zookeeper.server.SessionTrackerImpl - SessionTrackerImpl exited loop！'。誰能幫我這個？？當我刪除cluster.shutdown（），推文連續不斷地來，直到我按下Ctrl + C。同樣WORDCOUNT沒有顯示## imp

0熱度

1回答

虔誠分析_Apache HBase_Apache風暴

我正在嘗試對Apache Storm進行情感分析並使用Hbase檢索結果。誰能告訴我該怎麼做？