我有一個DataFrame具有下面的數據點。這裏count
表示articleTag被讀取的次數。對於articleId,articleTag
是tag
;即對於商品Id 590020
,存在四個標籤A,B,C,D
,其被表示爲一個字符串。計數次數字符串的一部分存在的是DataFrame
articleId articleTag count
0 590020 A,B,C,D 2
1 466322 A,B,E 3
2 466322 B 2
3 466322 A 1
我需要找出tag distribution
即每個標籤它是如何出現在文章的時候很多號,有多少次它的讀數。
就像上面的示例Dataframe一樣。
Tag Present Read
A 3 6
B 3 7
C 1 2
D 1 2
E 1 3
PI help。
有了上面的代碼,字符串的一部分也正在考慮之中。例如,如果標籤是「naren」,其讀取計數將被計算。所以如果它對'narendra modi,bjp'進行測試,那麼它的計數就會增加。但我不想要這個。標籤必須作爲整體呈現。 –
使用==代替'in' –