我有兩組字符串,如果可能,我需要在每對中使用相同的子字符串(下面示例中的粗體字;粗體/大寫只在這裏強調,沒有辦法通過查看一個列表元素來識別每個列表中唯一的關鍵字符串)。文本的剩餘部分(lorem ipsum)可能對許多元素而言是共同的,或者可能是完全獨特的。基於唯一子串的配對字符串
列出一個:
- 「Lorem存有悲坐阿梅德,直板 consectetur adipisicing ELIT,」
- 「SED做eiusmod 糖果手杖 tempor incididunt UT labore等dolore 蚤」
- 「sed do eiusmod tempor HOMER incididunt ut labore et dolore magna」
- 「Lorem存有悲坐阿梅德,consectetur adipisicing PICKUP TRUCK ELIT,」
- 「ullamco laboris暫準UT aliquip前EA commodo consequat。 DUIS奧特 「
列出兩種:
- 」SED做eiusmod tempor incididunt HOMER UT labore等dolore蚤「
- 」 aliqua。 Ut enim ad minim veniam,CANDY BAR quis nostrud practitation「
- 」aliqua。 UT enim廣告微量veniam,QUIS nostrud 糖果手杖實習」
- 「在voluptate velit埃塞cillum dolore reprehenderit」
- 「irure悲Lorem存有悲坐阿梅德,consectetur adipisicing 皮卡 ELIT,」
從下面的匹配樣本文本是:1-2; 2-3; 3-1;在列表中的一個和元件4在列表2不與任何匹配4-5
元件5
。
我們如何提取子字符串,我的意思是我們知道每個唯一的子字符串是大寫還是什麼? – Juvanis 2012-03-06 22:30:22
爲什麼「tempor」未標記爲2-1解決方案?你對這個問題有更多的數學定義嗎? – mgaert 2012-03-06 22:56:31
@mgaert tempor不是唯一的。它位於列表1的第2行和第3行。 – 2012-03-06 23:19:04