我有一個csv文件CSV文件,如下所示:創建從另一個
19/04/2015 00:00 180 187 85 162 608 61
19/04/2015 01:00 202 20 26 70 171 61
19/04/2015 02:00 20 40 40 11 40 810
19/04/2015 03:00 20 80 81 24 0 86
19/04/2015 04:00 25 30 70 91 07 50
19/04/2015 05:00 80 611 691 70 790 37
19/04/2015 06:00 199 69 706 70 790 171
19/04/2015 07:00 80 81 90 192 57 254
19/04/2015 08:00 40 152 454 259 52 151
每一行是在該文件中的相同的小區。
我想使它看起來像這樣:
19/04/2015 00:00 180
19/04/2015 00:10 187
19/04/2015 00:20 85
19/04/2015 00:30 162
19/04/2015 00:40 608
19/04/2015 00:50 61
19/04/2015 01:00 202
等。
釋:
號的第一個列表是一個日期dd/M/YYYY HH:mm
有6個值,每10分鐘的價值。 在第二個演示文稿中,我想知道每個值的日期和分鐘的確切時間。
這是我到目前爲止已經試過:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import os
import sys, getopt
import tarfile
import re
import pandas as pd
import tempfile
import shutil
import collections
import urllib
import numpy
import logging
import csv
csvFile = "testfile.csv"
data = []
minutes = ['00:00','10:00','20:00','30:00','40:00','50:00']
with open(csvFile, 'rb') as csvfile:
reader = csv.reader(csvfile, delimiter=',')
for row in reader:
row[0] = re.sub("\s+", ";", row[0].strip())
rowlist = row[0].split(';')
while(len(rowlist)<8):
rowlist.append(0)
for i in range(len(rowlist)):
for m in minutes:
data.append(rowlist[0]+rowlist[1]+m)
data.append(rowlist[i])
df = pd.DataFrame(data)
df.to_csv('example.csv')
但這代碼沒有給我想要的結果。 有什麼建議嗎?
這就是它。但我想刪除第一列和第一行。怎麼做? – Somar
這是一個好的開始。 OP說每10分鐘的價值。我不知道如何使用'分鐘[索引]'是準確的。 –
我剛做了一個編輯。即使是「熊貓」進口也沒有必要。 –