我在熊貓有一個數據幀提取行,看起來像這樣:與來自熊貓數據幀的特殊性能
AID VID Freq
0 00016A3E 0127C661 1
1 00016A3E 0C05DA5D 2
2 00016A3E 0C032814 1
3 00016A3E 0BF6C78D 1
4 00016A3E 0A79DFF1 1
5 00016A3E 07BD2FB2 1
6 00016A3E 0790E61B 1
7 00016A3E 0C24ED25 3
8 00016A3E 073630B5 3
9 00016A3E 06613535 1
10 00016A3E 05F809AF 1
11 00016A3E 05C625FF 1
12 00016A3E 04220EA8 4
13 00016A3E 013A29E5 1
14 00016A3E 0761C98A 1
15 00016AE9 0A769475 16
16 00016AE9 0A7DED0A 2
17 00016AE9 0ABF60DF 9
18 00016AFF 0AE3F25A 2
19 00016AFF 0AEFE12F 5
20 00016AFF 0BD8975A 2
21 00016AFF 44DF880B 1
22 00016AFF 43F9E08E 2
23 00016AFF 44EA5E08 2
24 00016AFF 4539ED1E 16
25 00016AFF 8516B55A 4
26 00016AFF 0972AFF2 1
27 00016AFF 0C559B34 1
28 00016AFF 06B5C040 7
29 00016AFF 0B0426FA 1
我想:
1-提取物在AID發生10次都行或更多,我們稱之爲df1。
2-從那個df1我想爲每個AID隨機選擇2行並將它們從df1移到另一個數據幀中,我們稱之爲df2。
所以導致DF的應該是這樣的:
DF1:我們刪除其中AID
是00016AE9
行,因爲只有3個出現了。
AID VID Freq
0 00016A3E 0127C661 1
1 00016A3E 0C05DA5D 2
2 00016A3E 0C032814 1
4 00016A3E 0A79DFF1 1
5 00016A3E 07BD2FB2 1
7 00016A3E 0C24ED25 3
8 00016A3E 073630B5 3
9 00016A3E 06613535 1
10 00016A3E 05F809AF 1
11 00016A3E 05C625FF 1
12 00016A3E 04220EA8 4
13 00016A3E 013A29E5 1
14 00016A3E 0761C98A 1
18 00016AFF 0AE3F25A 2
19 00016AFF 0AEFE12F 5
20 00016AFF 0BD8975A 2
21 00016AFF 44DF880B 1
22 00016AFF 43F9E08E 2
23 00016AFF 44EA5E08 2
24 00016AFF 4539ED1E 16
25 00016AFF 8516B55A 4
26 00016AFF 0972AFF2 1
29 00016AFF 0B0426FA 1
DF2:我想隨機從每組艾滋病的選擇兩行,並把它在DF2:
AID VID Freq
3 00016A3E 0BF6C78D 1
6 00016A3E 0790E61B 1
27 00016AFF 0C559B34 1
28 00016AFF 06B5C040 7
好的,你的問題是什麼? – Zero
問題中的第1條和第2條如何做...我仍然對數據框不熟悉,也不想使用循環,因爲它違背了目的。 – BKS