2017-05-03 103 views
0

有沒有辦法在網上搜索以任何字母開頭但以固定順序結束的單詞?例如,我想在* otus上搜索以返回蓮花,POTUS,SCOTUS,Herodotus等。搜索引擎的單詞結尾

有很多工具可以爲有限集合執行此操作,如字典或語料庫。例如,allwords.com可以選擇「以......結尾」。但是,它會搜索一小部分文本。我正在尋找整個網絡。

感謝您提供任何幫助。

大衛

回答

2

這是一個修改後的語言查找器。
由於您在搜索網頁,因此使用Unicode。
我只能在需要的時候才能使用ascii。

實際的字是在組2中捕獲的

(?i)([^\pL\pN]*([\pL\pN](?:[\pL\pN_-]|\pP(?=[\pL\pN\pP_-])|[?.!])*otus)(?:\pP(?=[\pL\pN\pP_-])|[?.!])*(?=[^\pL\pN]|$))

https://regex101.com/r/HrFrEM/3

Formatted

(?i) 
(       # (1 start) 
     [^\pL\pN]*     # Not letters/numbers 
     (       # (2 start), Followed by letter/number 
      [\pL\pN] 
      (?: 
       [\pL\pN_-]     # Letter/number or '-' 
      | 
       \pP       # Or, punctuation if followed by punctuation/letter/number or '-' 
       (?= [\pL\pN\pP_-]) 
      | 
       [?.!]       # Or, (Add) Special word ending punctuation 
      )* 
      otus       # Ends with this 
    )        # (2 end) 
     (?: 
      \pP       # Or, punctuation if followed by punctuation/letter/number or '-' 
      (?= [\pL\pN\pP_-]) 
     | 
      [?.!]       # Or, (Add) Special word ending punctuation 
    )* 
     (?= [^\pL\pN] | $) 
)        # (1 end) 
0

是的,有一種方法。

您可以從創建一個for循環開始,該循環將在0.0.0.0到255.255.255.255之間的每個可能的IP上執行反向DNS(如果您願意,可以排除受限制的端口)。

恭喜,您現在擁有了全球所有網站的所有網址。

然後,您可以創建一個循環遍歷所有這些域,加載主頁並遞歸加載超鏈接。

恭喜,您現在擁有整個網站!

保存到一個文件夾(即web/

然後

cat web/* | grep otus 
+0

哈!謝謝你們倆。我的道歉,但我沒有完全意識到如何專注於編程(這個名字應該已經把它給了,我知道)。我不是程序員,所以需要一個現有的網站工具/搜索引擎,可以爲我搜索「結束詞」搜索。有什麼想法嗎? – David

+0

不知道爲什麼這是擱置,因爲我的問題(和f/u評論)似乎很好定義和界限。但是... c'est la vie。 – David