我有一個巨大的sensor data
設置和工作Python
。問題是他們的date formats
。基本上,這是日期列的樣子。處理數據集與可怕的日期時間數據
07/ 7/15 06:51
07/ 7/15 06:53
07/ 7/15 06:55
07/ 7/15 06:57
07/ 7/15 06:59
2015-07-07 07:00:46.047
07/ 7/15 07:03
07/ 7/15 07:05
07/ 7/15 07:07
07/ 7/15 07:09
07/ 7/15 07:11
07/ 7/15 07:13
2015-07-07 07:15:53.007
2015-11-14 23:33:43.000
2015-11-14 23:35:44.000
2015-11-14 23:37:43.000
2015-11-14 23:39:43.000
2015-11-14 23:41:43.000
11/14/15 23:42
2015-11-14 23:45:43.000
11/14/15 23:46
2015-11-14 23:49:43.000
2015-11-14 23:51:44.000
我要解析日期使用平日,週末和作爲一個額外的,也許我會變成他們Julian date format
(使用數字1到365,而不是常規的日期)。
我曾嘗試:
解析日期,而我讀的CSV
日期,直到解析器;例如dateutil.parser.parse(X)
Datetime.strptime
,但沒有一次成功。我仍然無法解析日期。 這些數據在10部分excel文件中。
當我使用pd.read_csv(......, parse_dates('date'))
讀取它們時,它在某些文件中讀取日期列爲'object'
,在其他文件中讀取爲'datetime64'
格式。但是,即使與格式'datetime64'
日期的文件無法解析,並給出了一個錯誤:
"Unknown String Format".
任何想法,將有助於!
是否所有的日期或者日 - 月 - 年或年 - 月 - 日,其中的標點字符可能不是一個連字符,代表天,月,年可能有所不同字符串的長度? –
或者,我們可以依靠日期的明顯排序作爲指導嗎? –
你的意思是'我們可以依靠...'嗎?「@BillBell – dss