2010-11-14 77 views
1

我知道防止人們竊取我們的數據是不可能的,但是我有一個大型數據庫,並且我想至少防止自動腳本竊取我的數據庫。防止數據被盜取

我的想法而已:

  • 使用的JavaScript或HTML編碼=很重,很容易被解碼
  • 驗證碼的搜索=沒辦法,用戶將剛剛離開我的網站
  • 插入隨機數據和標籤在網站的HTML,以避免正則表達式rip =好?

任何想法表示讚賞。

+1

這不是一個值得的努力。花時間擔心人們竊取你的數據是浪費時間。你可能會擔心人們會閱讀你的數據,並將它「複製」到他們的大腦中。 *通過設計*,無法讓瀏覽器顯示數據,同時防止複製數據。 – meagar 2010-11-14 17:53:33

回答

0

我認爲Alexa將隨機標籤插入標記,它給了我一段時間,當我試圖挖掘它......他們在Alexa排名中加入了一些額外的標籤,如<span class="a5r">35</span><span class="et4">52</span><span class="arer">16</span>,除非您下載了樣式並且看着渲染規則,你無法弄清楚應該是什麼數字。

但是......如果我足夠耐心,我可以「渲染」數字然後挖掘它,但這對我來說並不值得。將頁面請求限制爲可能的人數可能會運作良好(50 /分鐘或其他)。

2

爲什麼人們想竊取你的數據庫?爲什麼他們這樣做很重要?會問他們不夠?

明確您的政策並確保您的公司法務部門已檢查過措辭。通過明確表示不允許,並阻止未經授權的聯合,您將採取法律措施來阻止它。

還是更好,鼓勵授權聯合。如果沒有合理的方式讓他們以授權的方式這樣做,人們只會進行未經授權的聯合。

技術措施可能會產生一些影響,但只會阻止那些不具備專業能力或決心的人。

1

您提出的這些解決方案都不起作用。一位好的劇本作家可以輕鬆繞過這些。但是,在應用服務器端有一個技術解決方案:實現速率限制。每10秒鐘只允許從一個給定的IP地址進行一次搜索。這將使您的網站的自動數據挖掘非常緩慢。