得到錯誤使用Jupyter筆記本

sc = pyspark.SparkContext() 
sqlCxt = SQLContext(sc) 
df=sqlCxt.read.format("csv").option("delimiter","|").load("D:/SparkPy/u.item")

錯誤加載CSV文件到數據幀時：當我星火更新到2.2.0版本得到錯誤使用Jupyter筆記本

ERROR:root:An unexpected error occurred while tokenizing input The following traceback may be corrupted or invalid The error message is: ('EOF in multi-line string', (651, 72))

來源

2017-09-27 Shreya Singh

此錯誤與pyspark無關。您的文件缺少報價，撇號或其他內容。檢查錯誤信息中給出的行號。 – ashwinids

這不會看起來像csv問題，即使創建一個虛擬的csv並使用它，我得到相同的錯誤。 –

你能分享可能產生上述錯誤的最小可能虛擬csv文件的內容嗎？ – ashwinids

的問題得到了解決。

Python 3.6兼容Spark v2.2.0

來源

2017-09-30 05:51:27

得到錯誤使用Jupyter筆記本

回答

相關問題