我正嘗試爲數據挖掘創建一個csv文件,其中每個單獨實例都有一個屬性subject
,該屬性具有40
可能的值以及對應的grade
也是屬性。每個實例最多隻能有4
和grade
。我如何創建一個csv文件excel
代表每個主題{p,q,r,s,t,u,v,w,x,y,z,aa,ab,...}
作爲sub-attribute
的{A,B,C,D,E,F,O}
爲{A,B,C,D,E,F,O}
作爲值,這樣我就不會失去依賴和關係的主題。重新格式化R中的CSV文件
他們顯然安排(subject->sub, grade->grd)
如下
|id|sex|sub1 |grd1 |sub2 |grd2 |sub3 |grd3 |sub4 |grd4 |
|--|---|-----|-----|-----|-----|-----|-----|-----|-----|
|1 |M |x |A |y |B |u |O |s |C |
|2 |F |p |E |aa |E |t |A |r |B |
|3 |M |q |B |z |D |aa |A |v |C |
|4 |F |t |D |ab |O |y |B |u |A |
我想要的屬性轉化爲
|id|sex|subject |
|--|---|-----------------------------------------------|
|1 |M |x |A |y |B |u |O |s |C |
|2 |F |p |E |aa |E |t |A |r |B |
|3 |M |q |B |z |D |aa |A |v |C |
|4 |F |t |D |ab |O |y |B |u |A |
在此先感謝
**爲什麼**?沒有應用程序將能夠讀取這種格式。因爲它不再是CSV **。 –
除了列標題外,這兩個表看起來完全相同,因此很難理解您要查找的轉換類型。你能澄清嗎?一般來說,Excel中的大規模轉換比使用OpenRefine或Python等語言更難。 –