我試圖抓取兩個獨立的農場,但無法讓它在任何一個上運行。他們都具有兩個WFE,並將其他WFE配置爲索引服務器。還有一臺專用於查詢的服務器和兩臺用於數據庫的集羣SQL 2005後端服務器。我沒有成功嘗試過至少50個不同的網站,我通過搜索引擎找到了解決方案。我已配置(擴展)我的Web App,以將http://servername:12345用作默認區域,將http://abc.companyname.com用作自定義和Intranet區域。當我進入每個那些到內容源,然後再嘗試運行爬,我得到的爬網日誌幾個錯誤:MOSS 2007爬行
http://servername:12345回報:
「無法連接到服務器請確認網站是可訪問的。「
http://abc.companyname.com回報:
「由採集刪除(起始地址或包含此項目已被刪除,因此該項目被刪除的內容源。)。」
不過,我可以單擊這兩個網址和頁面是可訪問的。
任何想法?
更多信息:
我兩訖,可以這麼說,跑到另一抓取提供更新的樣本。
我的內容來源是這樣:
http://servername:33333
http://sharepoint.portal.fake.com
SPS3://服務器名稱:33333
我現在爬網日誌錯誤是:
SPS3://服務器名稱:33333
PortalCrawl Web服務中的錯誤。
http://servername:33333/mysites
內容是由服務器,因爲沒有一個索引屬性排除。
http://servername:33333/mysites
抓取
STS3://服務器:33333/contentdbid = {62a647a ...
抓取
STS3://服務器:33333
爬
http://sharepoint.portal.fake.com
爬取程序無法與服務器通信。檢查服務器是否可用並且防火牆訪問配置是否正確。
我仔細檢查了上面的錯別字,我沒有看到任何,所以這應該是一個準確的反映。