我試圖從字符串中刪除所有非字母數字字符,然後繼續計算從pdf中提取的每一行的單詞數量。逗號未刪除Javascript正則表達式
var m = item["str"].replace(/[^a-zA-Z0-9 ]/g," ").trim().split(" ");
console.log("count: " + m.length + " words: " + m);
這是代碼。所得到的輸出的一個示例:
計數:10個字:本,快速,棕色,福克斯,,,跳躍,在所述的,懶惰
雖然項[ 「STR」]看起來像這樣的:
敏捷的棕色狐狸 - 跳通過惰性
一些產量也類似於:
數:1個詞語:
誰能幫我明白是怎麼回事?預先感謝!
'/ [^ A-ZA-Z0-9] +/g'不起作用,split(「\ s +」)'不是有效的語法。 – Cerbrus