aggregation

    0熱度

    1回答

    我有一堆包含招聘廣告信息的彈性搜索文檔。我試圖彙總attributes.Title字段以從作業發佈中提取「體驗」實例的數量。例如初級,高級,領導等。相反,我得到的是與整個標題相匹配的桶,而不是每個單詞都是標題欄。例如「初級Java開發人員」,「高級.NET分析師」等。 如何判斷彈性搜索是否根據標題中的每個單詞分割聚合,而不是匹配整個字段的值。 我稍後想要擴展查詢以提取「技能級別」和「角色」,但如果

    0熱度

    1回答

    編輯:解決方案發現在第一條評論中,你也可以檢查that question,我們達到同樣的效果。 比方說,我有包括這些文件 {name: 'John', fruit:'apples'}, {name:'Zac', fruit:'bananas'}, {name:'Sara', fruit:'oranges'}, {name:'John', fruit:'oranges' }, {name:'

    0熱度

    1回答

    我試圖聚合多個列上的數據幀。我知道聚合需要的所有東西都在分區內 - 也就是說,不需要洗牌,因爲聚合的所有數據都是分區本地的。 以一個example,如果我有像 val sales=sc.parallelize(List( ("West", "Apple", 2.0, 10), ("West", "Apple", 3.0, 15), ("West", "Orang

    0熱度

    2回答

    我是elasticsearch的新手,我有一些技術難點。目前我有按小時索引存儲的文檔,它們是時間序列數據。我試圖弄清楚的是如何有效地提取只有key字段值,它被定義爲"key": { "type": "long" }。我最初嘗試的是天真的方法,它滾動瀏覽所有索引並提取字段,但顯然這不會很快完成,每個小時索引大約有10M個文檔,並且滾動3個索引已經耗盡了。 然後我來到terms aggregation

    0熱度

    3回答

    我正在使用來自https://www.kaggle.com/c/titanic的泰坦尼克號數據集。 我想讓「0-4」,「1-5」,「2-6」,「3-7」等不同的年齡段,並找出存活百分比的年齡組最高。我的年齡組在整數區間內[0,80]。原始數據集中的「Age」列也包含NAs。 「Survived」列包含該人是否存活的信息(0 =否,1 =是)。 我試圖解決這個問題,但它沒有奏效。我會很感激任何幫助。

    0熱度

    1回答

    我有一個表table1,它有一些列,必須根據某些條件計算並移動到另一個表table2中。爲了符合條件,我創建了一個臨時表#ttemp,並將臨時表更改爲創建兩個新變量var1和var2,以根據不同的列設置一些值,並稍後檢查這些條件。如果條件通過,我做一些聚合,然後我會插入table2將有聚合列。 首先,從table1創建#temp表和變量。 SELECT * INTO #ttemp FROM t

    1熱度

    1回答

    我在C#中有一些聚合問題。現在,我有以下代碼: namespace ShapeDrawing { public abstract class Shape { protected Drawing myDrawing; public Shape(Drawing drawing) { myDrawing = drawing;

    0熱度

    1回答

    是否可以在geo_point字段上使用最大聚合或最小聚合? 我試圖max直接到我的座標屬性,它的類型是geo_point { "size": 0, "aggs" : { "max_lat" : { "max" : { "field" : "coordinate" } } } } 這可以理解返回ClassCastException,所以我想直接的coo

    1熱度

    3回答

    非常新的火花/斯卡拉。我想知道是否有一種簡單的方法來以列式方式聚合Array [Double]。這裏有一個例子: c1 c2 c3 ------------------------- 1 1 [1.0, 1.0, 3.4] 1 2 [1.0, 0,0, 4.3] 2 1 [0.0, 0.0, 0.0] 2 3 [1.2, 1.1, 1.1] 然後,一旦聚集,我會看起來像一個表

    0熱度

    1回答

    我一直在測試Mongo上的部分索引,並且似乎在$match階段中使用aggregation expression會干擾使用正確的索引。 例如,我有一個data收集與下列文件: { "type": "person", "value": { "id": 1, "name": "Person 1", "age": 10 } }, {