pandas-groupby

    3熱度

    1回答

    我有盤中日數據的時間序列看起來像下面 ts =pd.Series(np.random.randn(60),index=pd.date_range('1/1/2000',periods=60, freq='2h')) 我希望將數據轉換成數據幀,與列作爲每個日期和行作爲在日期的時間。 我嘗試了這些, key = lambda x:x.date() grouped = ts.groupby(key

    0熱度

    1回答

    我在因官僚主義原因而無法升級的環境中使用Pandas 0.8.1。 在閱讀所有關於最初的問題和我的目標之前,您可能想跳到下面的「簡化問題」部分。 我的目標是:通過分類列「D」對DataFrame進行分組,然後對於每個組,按日期列「dt」進行排序,將索引設置爲「dt」,執行滾動OLS迴歸並返回按日期索引的迴歸係數DataFrame beta。 最終結果可能是一堆堆積的beta幀,每個幀對於某個特定的

    0熱度

    1回答

    我不確定以前是否詢問過此問題。在一個熊貓數據幀我有這樣 A B C 1 z 0 0 2 z 1 1 3 z 2 2 4 y 0 0 5 y 1 1 6 z 2 2.5 7 z 0 0 8 z 1 0.2 9 z 2 0.8 數據我想獲得 A B C 1 z 2 2.5 2 y 1 1 3 z 2 0.8 在上面的例子(從第一表)z的從0變爲對於B和C 2 B和2

    0熱度

    1回答

    輸入數據集 Var1 Var2 Var3 Var4 101 XXX yyyy 12/10/2014 101 XYZ YTRT 13/10/2014 102 TTY UUUU 9/9/2014 102 YTY IUYY 10/10/2014 輸出數據集預計關鍵變量轉換多行單行: Var1 Var2 Var3 Var4 101 XXX,XYZ yyyy,YTRI

    0熱度

    1回答

    我有一個簡單的Pandas DataFrame,包含行名和2列,有點像下面這樣。 from pandas import DataFrame, Series row_names = ['row1', 'row2', 'row2', 'row4'] df = DataFrame({'col1': Series([1, 2, 3, 4], index=row_names), 'col

    3熱度

    1回答

    我一直在閱讀有關熊貓數據框中的分層索引和多索引,但似乎這些都是有序標籤。例如,我的數據是這樣的: 而且我想要的數據一起基於列標籤即能組。通過平均值將第3行中'd'的所有列聚合在一起。 是什麼讓這個Excel數據的最佳方式(或csv如果絕對需要)到一個數據幀,這樣我可以做這些操作,我將如何去這樣做呢? 任何意見或引用,將不勝感激 編輯 我嘗試使用下面的命令加載從CSV數據: data = pd.re

    3熱度

    2回答

    我有一個數據集有一個類別字段'城市'和2個指標,年齡和體重。我想用循環爲每個城市繪製散點圖。然而,我正在努力將我所需要的組合和循環結合起來,以便在單個語句中使用。如果我只是使用for循環,那麼每個記錄最終都會有一個圖表,如果我通過獲取正確數量的圖表但沒有任何值來進行分組。 這裏是我的代碼只使用與我的小組循環的註釋: import pandas as pd import numpy as np

    4熱度

    2回答

    有沒有一種簡單的方法/模塊可以在Python中對數據集進行分組操作,因爲數據集太大而不適合內存? 我通常會使用熊貓,但它打破了大型數據集。

    1熱度

    1回答

    我有一個'id'列'值'的熊貓數據框。它已經按第一個id(升序)和value(降序)排序。我需要的是每個ID的前10個值。 我以爲,像下面這樣的工作,但它並不: df.groupby("id", as_index=False).aggregate(lambda (index,rows) : rows.iloc[:10]) 我得到的只是是IDS,值列(和其他列的列表,我省略了這個問題)不在那裏了

    0熱度

    2回答

    ,我有以下的數據幀: df = pd.DataFrame([[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['1','3','3','2','