我知道防止人們竊取我們的數據是不可能的,但是我有一個大型數據庫,並且我想至少防止自動腳本竊取我的數據庫。防止數據被盜取
我的想法而已:
- 使用的JavaScript或HTML編碼=很重,很容易被解碼
- 驗證碼的搜索=沒辦法,用戶將剛剛離開我的網站
- 插入隨機數據和標籤在網站的HTML,以避免正則表達式rip =好?
任何想法表示讚賞。
我知道防止人們竊取我們的數據是不可能的,但是我有一個大型數據庫,並且我想至少防止自動腳本竊取我的數據庫。防止數據被盜取
我的想法而已:
任何想法表示讚賞。
我認爲Alexa將隨機標籤插入標記,它給了我一段時間,當我試圖挖掘它......他們在Alexa排名中加入了一些額外的標籤,如<span class="a5r">35</span><span class="et4">52</span><span class="arer">16</span>
,除非您下載了樣式並且看着渲染規則,你無法弄清楚應該是什麼數字。
但是......如果我足夠耐心,我可以「渲染」數字然後挖掘它,但這對我來說並不值得。將頁面請求限制爲可能的人數可能會運作良好(50 /分鐘或其他)。
爲什麼人們想竊取你的數據庫?爲什麼他們這樣做很重要?會問他們不夠?
明確您的政策並確保您的公司法務部門已檢查過措辭。通過明確表示不允許,並阻止未經授權的聯合,您將採取法律措施來阻止它。
還是更好,鼓勵授權聯合。如果沒有合理的方式讓他們以授權的方式這樣做,人們只會進行未經授權的聯合。
技術措施可能會產生一些影響,但只會阻止那些不具備專業能力或決心的人。
您提出的這些解決方案都不起作用。一位好的劇本作家可以輕鬆繞過這些。但是,在應用服務器端有一個技術解決方案:實現速率限制。每10秒鐘只允許從一個給定的IP地址進行一次搜索。這將使您的網站的自動數據挖掘非常緩慢。
這不是一個值得的努力。花時間擔心人們竊取你的數據是浪費時間。你可能會擔心人們會閱讀你的數據,並將它「複製」到他們的大腦中。 *通過設計*,無法讓瀏覽器顯示數據,同時防止複製數據。 – meagar 2010-11-14 17:53:33