這裏是我的代碼:如何統計兩列數據框中的trues和falses?
pizzarequests = pd.Series(open('pizza_requests.txt').read().splitlines())
line = "unix_timestamp_of_request_utc"
lines = pizzarequests[pizzarequests.str.contains(line)].str.split(",").str[1]
print(lines)
dts = pd.to_datetime(lines, unit='s')
hours = dts.dt.hour
print(hours)
pizzarequests = pd.Series(open('pizza_requests.txt').read().splitlines())
line = "requester_received_pizza"
lines = pizzarequests[pizzarequests.str.contains(line)].str.split(",").str[1]
data = pd.DataFrame({'houroftheday' : hours.values, 'successpizza' : lines})
print(data)
****這給了我:****
houroftheday successpizza
23 18 true
67 2 true
105 14 true
166 23 true
258 20 true
297 1 true
340 2 true
385 22 true
...
304646 21 false
304686 12 false
304746 1 false
304783 3 false
304840 20 false
304907 17 false
304948 1 false
305023 4 false
我如何可以總結,只有對應於trues的時間?
是看起來像'successpizza'是一個字符串與''true''和'列'false'作爲值。 – James
謝謝,我用新的條件編輯答案。 – jezrael
當我做了我需要的每一個的長度,它給了我,每個小時都有零計數的真實。可能會出現什麼問題? – Yungpythonnoob