aggregate

5熱度

4回答

我有R的工作表，我有這樣的數據： data <- structure(list(Col1 = 1:9, Col2 = structure(c(2L, 2L, 2L, 1L, 3L, 3L, 3L, 3L, 3L), .Label = c("Administrative ", "National", "Regional"), class = "factor"), Col3 = structure

0熱度

3回答

星火斯卡拉 - 基於時間段

聚集和旋轉，我想實現旋轉火花截至目前，我使用sqlContext和SQL應用內全部改造類似於SQL Server。我想知道我是否可以直接從sql server中獲取數據並使用spark實現數據透視功能。下面是什麼，我想achieve- 的SQL Server查詢如下─ create table #temp(ID Int, MonthPrior int, Amount float); inse

2熱度

1回答

node.js - mongodb native中的RegExp

我使用node-mongodb-native來實現MongoDB查詢功能。我需要執行一個查詢，如果tag相匹配的部分或組合firstName和lastName這樣的： filter50WithTagSkip(tag, skip) { return new Promise((resolve, reject) => { const regex = new RegExp(tag

0熱度

1回答

MongoDB的骨料項目返回_id

數組我們知道，如果我們想獲得_id的數組，我們可以這樣做： db.collections.distinct("_id"); 我的問題是怎樣才能得到_id數組，如果我需要做的一個複雜的聚合邏輯。例如： db.getCollection('users').aggregate({ $match : { is_register_completed : { $ne : tru

0熱度

1回答

我應該使用哪些elasticsearch聚合？

我需要創建一個「按活動用戶數量」的條形圖。活躍用戶表示最近7天登錄的用戶。所以我需要統計last_activity日期在7天內的用戶總數。我需要爲我的圖表中的每個酒吧（日）執行此操作。我明白它需要使用聚合彈性搜索來完成，但不確定我應該使用哪些聚合？存儲桶聚合，管道聚合？如果你知道類似的例子，請告訴我。在這裏您可以找到用戶樣本文件的兩個實例「約翰」 { "userid": "jo

1熱度

2回答

分組行和定義列聚合規則

我正在尋找合併多行不同dtypes的熊貓。我有我的.groupby()參數：['ID']。當按['ID']分組時，列['A']可能重複值，或者每行的數據不同。僅需要通過.sum()彙總列['B']。 input_df ID A B 140-1 Apple 3.2 140-1 Pear 5.0 143-2 Plum 1.2 143-2 Plum 2.0 什麼是由['ID'

2熱度

1回答

Mongolite GROUP BY/JSON對象合計

我有我的MongoDB集合這樣一個JSON文件：更新文件： { "_id" : ObjectId("59da4aef8c5d757027a5a614"), "input" : "hi", "output" : "Hi. How can I help you?", "intent" : "[{\"intent\":\"greeting\",\"confidence\":0.81540894

0熱度

1回答

在KafkaStreams中使用SessionWindows聚合數據（0.11）

我想在Kafka（0.11）中的聚合函數中使用SessionWindows，但無法理解，爲什麼我會收到錯誤。這裏是我的代碼片段： // defining some values: public static final Integer SESSION_TIMEOUT_MS = 6000000; public static final String INTOPIC = "input"; pu

0熱度

1回答

ElasticSearch - 術語聚合按空白分割

我有一堆包含招聘廣告信息的彈性搜索文檔。我試圖彙總attributes.Title字段以從作業發佈中提取「體驗」實例的數量。例如初級，高級，領導等。相反，我得到的是與整個標題相匹配的桶，而不是每個單詞都是標題欄。例如「初級Java開發人員」，「高級.NET分析師」等。如何判斷彈性搜索是否根據標題中的每個單詞分割聚合，而不是匹配整個字段的值。我稍後想要擴展查詢以提取「技能級別」和「角色」，但如果

0熱度

1回答

在一個函數中使用兩個分組變量聚合一個變量R

我想寫一個函數，它會給我一個按年齡和國家的人口簡單的描述性統計。這裏是我的數據的例子： popcount = 200:250 sex = rep(c("M", "F"), 25) country = rep(c("NZ", "Aus", "Fiji", "PNG", "Samoa"), 10) 爲了得到聚集，我指定了以下功能 Aggregate_fun <- function(pop,