2014-10-18 128 views
0

我在處理Excel和pentaho時遇到了一些問題(我猜是由於我對這些工具的0經驗...)。 具有下列數據集:Excel/Pentaho double group by + count

Interaction date interaction_name 
    21/08/13 course view 
    21/08/13 course view 
    21/08/13 forum view forum 
    21/08/13 course view 
    21/08/13 course view 
    21/08/13 course view 
    22/08/13 forum view forum 
    22/08/13 course view 
    22/08/13 forum view forum 
    22/08/13 user view all 
    22/08/13 user view 
    22/08/13 blog view 
    22/08/13 user view all 

我想表示在21/08/2013出現了4周的景色和1個論壇視圖中,22/08/2013 2論壇次,1個場查看,3個用戶查看所有...等等。

這就是(從SQL角度來看)雙數組中的一種計數。按日期先組,然後通過交互進行分組並計數。正確的SQL查詢也可以幫助我。

我只是不知道如何做到這一點。我嘗試用excel和pentaho,但似乎我缺少的東西...

任何幫助將真正apreciated!謝謝

到目前爲止,我在pentaho中的報告:已經嘗試過聚合計數,但它計算了每個交互,而沒有在它們之間做出任何區別。
enter image description here

+2

原始數據在哪裏?在Excel工作表中?你成功地將它讀入Pentaho嗎?可以包括到目前爲止Pentaho轉型的截圖嗎? – 2014-10-18 11:02:51

+0

這裏沒有涉及任何編程。這個問題應該去一個不同的網站。例如。 Pentaho論壇,因爲它關於使用Pentaho軟件? – 2014-10-18 11:11:16

+0

我在這個論壇上看到很多有關分析的問題,所以我決定在這裏發佈。問題不在於pentaho軟件本身,而在於分析。 @MarcusRickert是的,原始數據是在Excel表格中,我添加了當前報告狀態的屏幕截圖。謝謝 – 2014-10-18 11:22:52

回答

1

由於@Marcus李凱爾特問,你沒有指定數據源,但我會假設,就像數據庫中的一些SQL,因爲你問正確的SQL查詢。

這一個:

SELECT Interaction_date, Interaction_name, count(Interaction_name) from your_table group by Interaction_date,Interaction_name order by Interaction_date asc; 

它會產生:

Interaction_date Interaction_name count 
--------------------------------------------- 
21/08/13   course view   5 
21/08/13   forum view forum 1 
22/08/13   forum view forum 2 
22/08/13   course view   1 
22/08/13   user view all  2 
22/08/13   user view   1 
22/08/13   blog view   1 

現在,你可以把它放在Pentaho的報表設計器和group by(報表設計器內)的Interaction_date。