2012-04-11 69 views
0

有沒有人見過將單個字符串或多個名字分開的好嘗試?
做出了榜樣:
用戶能夠帶給他們的名字的形式,遺憾的是它會從John J. Johnson(容易),John/Peter Johnson(2人)到Michael Peter John PaulStacy Miller Kevin Mitnick
到目前爲止,我已經構建了一個數據庫,其中包含名字和姓氏,我將對照這些數據庫進行檢查。但我想知道是否有人真的試圖以高命中率正確做到這一點。grep第一個和自由文本格式的小寫字母

評論非常感謝。 Thx

+1

難道你不能提供兩個單元格來分別輸入名字和姓氏嗎? – Marco 2012-04-11 08:45:17

+0

不,我從第三方獲取這些數據。作爲確切的旅遊行業,我可以告訴你,當談到誰和進入酒店的人數時,人們是非常「有創意」的完美例子: 「Mike + Ute SCHROBSDORFF/FABER」f ** k是那應該是 – user1326075 2012-04-11 10:14:06

+0

我會說這是不可能的。例如,有人將他們的名字改爲[「在美國釣鱒魚」](http://google.com/search?q=「鱒魚+釣魚+在美國」+名稱+更改+彼得+伊士曼)[wikipedia.com ](http://en.wikipedia.org/wiki/Trout_Fishing_in_America)[manolith.com](http://www.manolith.com/2009/10/21/the-10-stupidest-things-people-have-更改他們的名字到/)[snopes.com](http://www.snopes.com/racial/language/names.asp) – 2012-11-06 22:14:58

回答

0

我見過的最接近的是Lingua::EN::NamedEntity,但這是一個難以解決的問題。獲得一個完美的解決方案可能是不可能的,但你可能會得到一些適合你的案例。

+0

謝謝。我認爲這將是幾乎不可能的,特別是考慮到這應該與來自世界各地的名字一起工作,以及中國似乎有人稱他們的孩子爲「@」。 – user1326075 2012-04-11 11:40:15

相關問題