2016-09-16 55 views
1

大家好:我有一個50個字符串的集合,代表了文本文件中的註釋,每行代表一個單獨的註釋和不同的句子。如何創建複合字符串的陣列

每個字符串是產品的用戶評論,每個字符串或評論有幾個句子。

我怎麼能創建一個使用Python這些字符串的數組?評論的

例子: 評價1.「我的產品disapointed質量是現實糟糕的,價格是不公平從來沒有在我的生活,我會再次購買這個品牌

回顧2。 「我對這款產品感到非常滿意。這就是我想要的。由於品牌J」 ....到目前爲止

期望的結果:

  1. [( '失望', '產品'),( '質量', '真', '壞' , '價格', '公平')]

  2. [( '高興', '產品'),( '全部', '期望'),( '謝謝', '品牌')]

  3. ...

我想要每個處理的註釋在一個單獨的行中以將其保存在csv文件中

+0

,做你想要的輸出是什麼樣子? –

+0

你的字符串是什麼樣的? –

+0

我收集的評論是一個txt文件,每一行意味着一個單獨的評論與不同的句子。應用停用詞後,我想得到如下結果:1. \t [('disappointed','product'),('quality','really','bad','price','fair')] 2. \t [('happy','product'),('all','desired'),('thanks','brand')] 3. \t ...我希望每個處理後的註釋都保存在一個單獨的行中在一個csv文件中。 – mlosada

回答

0

我的第一個項目之一與此類似。我相信你在獲取文本文件行時需要幫助。

要打開文件進行讀取:

file = open("/path/to/file", "r")

然後,我會在空間分割這樣:

for line in file: 
     print line.split(' ') 

這將給你從TXT文件中的每一行字的數組。 然後使用python中的csv模塊輸入到csv文件中。

參考文獻: