1
我有一個看起來像中提取數據,並插入到表
ML1 ML1 SD ML2 ML2 SD ...
aPhysics0 0.8730469 0.3329205 0.5950521 0.4908820
aPhysics1 0.8471074 0.3598839 0.6473829 0.4777848
aPhysics2 0.8593750 0.3476343 0.7031250 0.4568810
aPhysics3 0.8875000 0.3159806 0.7000000 0.4582576
aPhysics4 0.7962963 0.4027512 0.7654321 0.4237285
...
數據幀和我想使用該行的名稱創建一個看起來像
Institution Subject Class ML1 ML1 SD ML2 ML2 SD ...
[1,] A Physics 0 0.8730469 0.3329205 0.5950521 0.4908820
[2,] A Physics 1 0.8471074 0.3598839 0.6473829 0.4777848
[3,] A Physics 2 0.8593750 0.3476343 0.7031250 0.4568810
[4,] A Physics 3 0.8875000 0.3159806 0.7000000 0.4582576
[5,] A Physics 4 0.7962963 0.4027512 0.7654321 0.4237285
...
數據幀什麼是最好的方法來做到這一點?
完美,謝謝! – bountiful 2013-02-26 15:28:06
注意:廣義的解決方案是假定只有一個數字的類號。爲了使它更加靈活,你需要讓你的中間正則表達式模式變得懶惰,並且讓最後一個正則表達式模式變得貪婪。像這樣:'^(\\ w)(\\ w +?)(\\ d +)$'如果您還想要允許多個機構字母,您需要根據大寫字母進行過濾,如下所示:假設主題始終以大寫字母開頭,則可以將'^ [az]'更改爲''[az] +?'(\\ d +)$' – Dinre 2013-02-26 15:50:09
@Dinre,^[az] {0,n}'這裏n是你期望的最大長度。同樣在末尾'[0-9] + $'。這應該足夠了。 – Arun 2013-02-26 16:27:18