我目前正在處理大型數據集的字符串。我很欣賞SQL不適合字符串操作,但它是我唯一的選擇。選擇字符串後的下一個單詞(SQL)
我的原始表格基本上採用了形式爲'company name [+place name] [+ other text]'
的字符串,並將其與地名列表進行匹配。如果有一個匹配它,剝去地名,並把它放在一個單獨的列即
Daves butchers London | Daves butchers | London
也能正常工作對我的所有條目,除了那些形式
Duke of Westminster | Duke of | Westminster
的有沒有查詢表格的方法,以便當第2列以''的單詞結尾時,我在第1列搜索後面的單詞並將其插入第2列的末尾?
Duke of Westminster | Duke of Westminster | Westminster
特別是,它往往是那個地方的名字是不是在列1結束的情況下,即
Duke of Westminster 0177263774 | Duke of | Westminster
是仍然有可能在這種情況下?
我的數據集中有40,000,000行,我不能重建它 - 我只需要嘗試解決這個問題。
是否有任何多次出現的單詞? –
有多少[duchies](http://en.wikipedia.org/wiki/Duchies_in_England)開始?簡單地手動更新所有的公爵並且完成它是不可行的? –