2011-12-20 78 views
1

我正在尋找一種算法,當給出一個文本時,它會巧妙地將其切成句子,任何事情都可以幫助。現在我有一個算法可以處理我指定的每個句子的詞數。我可以改變它的工作,直到第一''。和類似的東西,但我需要的是一種算法,可以在邏輯上做一些(不會留下以'is'和'and'結尾的句子,也可能在其他標點符號之外尋找'')。智能剪切文本的算法?

任何想法? 我正在使用PHP5。

+1

你能更精確一點,你需要什麼。也許一個例子 – 2011-12-20 13:16:49

+0

nope,不得不自己寫一些東西,可能類似於在第一個之後結束,或者。要麼 !要麼 ?在第300個字符之後,如果在第350個字符之後第350個字符結束時沒有找到第一個空白字符? – Hannes 2011-12-20 13:19:36

+0

我可以自己寫一個算法,但它不會像我能找到一個大多數人使用的算法一樣好。 – Vadiklk 2011-12-20 13:21:42

回答

1

使用此代碼preg_split

$sentences = preg_split("/[,.:;]+/", "Now you can split in sentences, try this. Isn't it good?"); 

這將您的一句句子的數組,你必須選擇你想上面我以前用(在本例中其中字母「:;。」 )。 它使用正則表達式,這是非常有用的;)

+0

問題是它刪除','和'。'我後來想把這些句子重新組合起來形成原文。 – Vadiklk 2011-12-20 14:06:35

+0

嗯,這是更難...我嘗試搜索的東西 – 2011-12-20 14:12:05