search-engine

    1熱度

    1回答

    我們知道,使用Lucene或着名搜索引擎Google的elasticsearch將保持索引文檔中單詞的偏移距離,以獲得更好的結果。上述兩種軟件都在上執行索引和搜索,其數據量非常大()。什麼是特殊的索引(或數據結構)或算法,以實現內部的高效和快速?那麼成本(時間和空間)呢?是否有網頁或文檔解釋Google或elasticsearch(lucene)使用的偏移距離算法?下面是我想要創建自己的圖片。

    0熱度

    2回答

    是否可以將Solr字段配置爲具有多個/拆分的過濾器鏈?例如,我可以創建一個過濾器鏈,看起來像這樣?: StandardTokenizer ↓ LowerCaseFilter ↙ ↘ SynonymnFilter PhoneticFilter ↓ NGramFilter 我已經做了相當多的搜索,並沒有發現建立一個過

    0熱度

    1回答

    我正在製作一個可以返回谷歌圖片的節點應用程序,我正在使用node-google-image-search應用程序來幫助我這樣做。我創建了一個名爲「env.env」一個.ENV文件並導入應用程序與 const imageSearch = require('node-google-image-search'); const dotenv = require('dotenv').config({pat

    0熱度

    1回答

    我正在尋找一個項目,一個簡單的,我可以發送查詢並通過API獲取結果集的一個很好的搜索引擎API。 Google,bing,yahoo似乎都停止提供這些服務,Faroo要求我有一個實際的網站。 謝謝

    1熱度

    2回答

    我想弄清楚谷歌的搜索運算符和如何工作的應用程序,我目前正在建設。 我發現這篇文章: https://supple.com.au/tools/google-advanced-search-operators/ ,指出谷歌使用AND運算符作爲默認搜索操作時 但是我想一些例子,這似乎並沒有成爲整個故事 例如,當我搜索: 谷歌搜索詞:珀斯旅遊海上衝浪 它給了我比: Google搜索詞:珀斯旅遊海 這怎麼可

    0熱度

    1回答

    我正在簡單搜索我的博客。我使用亞美尼亞語,當我搜索時,這些字母總是有意義的。這是我的代碼的一部分。先謝謝你。 search_query = get.get('search') query_list = search_query.split() posts = post.objects.filter( reduce(operator.and_, (Q(title

    -1熱度

    1回答

    我在我的網站上有大約100頁的內容,我不想在google中被索引...有什麼方法可以用robots.txt來阻止它。 .It'd很煩人編輯每個頁面,添加noindex元標記.... 所有這一切我想阻止是這樣的URL ... www.example.com/index-01 html的 www.example.com/index-02.html www.example.com/index-03.ht

    0熱度

    1回答

    背景問題 大家好,我是工作在一堆根據所提供的查詢文檔中搜索相關文件的項目。由於這是一個小型項目,我有一個典型的內存體系結構,我假設我沒有更多的100個文檔,每個文檔包含不超過1000個單詞(一個單詞不超過10個字符)。我收到很多查詢,並且必須儘快處理查詢(絕對不會超過一秒)。 我的第一種方法(天真和不可擴展): 由於允許用戶上傳文件,每當我收到一個文檔,我找了「勢」的關鍵字和存儲關鍵字作爲關鍵並將

    0熱度

    1回答

    我將robots.txt文件添加到本地Web服務器的根目錄。 服務器上的robots.txt文件的url是http://localhost/myserver/robots.txt。 robots.txt文件的內容是 User-agent: * Disallow:/ 我如何驗證robots.txt文件適用於本地Web服務器? 我是否需要在本地安裝一些網絡爬蟲或搜索引擎並運行它來驗證? 謝謝。

    3熱度

    2回答

    我建立一個小的搜索引擎在全世界範圍內取多次往返,這裏是我的旅程表看起來像: 正如你所看到的,departure_checkpoint和arrival_checkpoint是鏈接,這是一個完整的旅程,所有這些目的地屬於同一個announce_id號碼2.我現在想要做的是創建一個表格,在其中插入您的出發點和到達點,搜索引擎將返回包含這些目的地的announce_id。很容易將並排位置(如巴黎)轉到倫敦