group-by

    3熱度

    2回答

    我常常最終會做這樣的事情在pandas: s2 = s1.groupby(level=1).sum() s2 = s2[s2>25] 在的話,我做了一些groupby操作,然後只保留滿足的結果一定條件下的結果。 在一行中有辦法嗎?更具體地說,是否可以在不創建系列的情況下執行此操作,然後在第二步中執行布爾選擇?

    1熱度

    2回答

    目前我有這個df,可以有八個不同的揚聲器。 : raw_score Speaker date Allison 2012-10-31 0.796908 2012-11-30 1.792649 2012-12-31 0.668619 Warsh 2015-03-31 NaN 2015-04-30 NaN

    1熱度

    1回答

    我想要獲取用戶在不同表中輸入的記錄數。 DB的模式是: +-----------------------+ | Survey Master | +----------------+------+ | Field | Key | +----------------+------+ | id | PK | | Username | | | FamilyMasterId

    2熱度

    1回答

    我有我的MongoDB集合這樣一個JSON文件: 更新文件: { "_id" : ObjectId("59da4aef8c5d757027a5a614"), "input" : "hi", "output" : "Hi. How can I help you?", "intent" : "[{\"intent\":\"greeting\",\"confidence\":0.81540894

    0熱度

    2回答

    組 條件第一次出現的列值我有一個熊貓數據框如下: player condition num A 0 1 A 1 2 A 1 3 B 0 1 B 0 2 B 1 3 B 0 4 我想補充一點,存儲num列,其中每player的最低值的列condition列是。 的結果,因此,應該是這樣的: player condition num numC

    1熱度

    2回答

    我有一個表格cast約有150萬行,有一個小表約有1000-2000行看。兩個表共享一個名爲movieId的列。我試圖運行此查詢: SELECT actorId, COUNT(actorId) FROM cast t1 WHERE EXISTS ( SELECT userId FROM watched t2 WHERE t1.movieId = t2.movieI

    0熱度

    2回答

    我有一個包含時間戳登錄的表的MySQL數據庫,我想獲得過去24小時每個小時的登錄次數。 起初,我嘗試了一些東西明顯: SELECT timestamp AS Hour, COUNT(*) AS Logins FROM auth WHERE timestamp >= DATE_SUB(NOW(), INTERVAL 1 DAY) GROUP BY HOUR(tim

    0熱度

    1回答

    與聯接涉及組select語句的集合函數我有兩個表具有以下屬性: t1 t2 source domain date rank domain date --- --- --- --- --- --- A google 2008-10-24 1 google 2007-10-20 A facebook 2010-05-17 1 google 200

    1熱度

    3回答

    假設我有以下記錄的表:SQL Fiddle | category | begin | end | |----------|---------------------|---------------------| | a | 2017-09-26 08:00:00 | 2017-09-27 10:00:00 | | b | 2017-10-02 13:00:00 | 2017

    0熱度

    1回答

    我正在使用spark 1.6.1。 是否有任何API可用於將GroupDataset保存爲實木複合地板文件。 或將其轉換爲DataFrame。 E.g.我有一個自定義的對象「過程」,我已經將Dataframe轉換爲過程對象。 之後,我正在通過patientID進行分組。 我想分組爲文件或將其作爲數據框傳遞給其他函數。 我沒有獲得任何存儲API或將其轉換爲Dataframe。 val procedu