2016-02-05 70 views
0

我正在閱讀一個csv文件,其中包含371行文本。Python2.7/NLTK在某些字符前刪除字符串的一部分

0þ「文本包括數字和引號」þ4.6

我試圖提取TH「和」號的短信。我怎樣才能做到這一點?文件data.csv中的每一行的

+0

使用開始ň結束 –

+0

能否請你解釋一下? – boneless

+1

http://stackoverflow.com/questions/3368969/find-string-between-two-substrings –

回答

0

謝謝大家!

無論你的回答幫我找到了解決方案:

test = sent[(sent.index('þ"')):(sent.index('"þ'))] 
+0

如果有字符串,就不會工作「」þ「' – alvas

0
awk -F'þ"|"þ' '{print $2}' data.csv 

上述命令打印第2列,
其中列由或者是þ"分離。