2017-09-27 94 views
0
sc = pyspark.SparkContext() 
sqlCxt = SQLContext(sc) 
df=sqlCxt.read.format("csv").option("delimiter","|").load("D:/SparkPy/u.item") 

錯誤加載CSV文件到數據幀時:當我星火更新到2.2.0版本得到錯誤使用Jupyter筆記本

ERROR:root:An unexpected error occurred while tokenizing input The following traceback may be corrupted or invalid The error message is: ('EOF in multi-line string', (651, 72))

+0

此錯誤與pyspark無關。您的文件缺少報價,撇號或其他內容。檢查錯誤信息中給出的行號。 – ashwinids

+0

這不會看起來像csv問題,即使創建一個虛擬的csv並使用它,我得到相同的錯誤。 –

+0

你能分享可能產生上述錯誤的最小可能虛擬csv文件的內容嗎? – ashwinids

回答

0

的問題得到了解決。

Python 3.6兼容Spark v2.2.0