2010-07-29 58 views
2

對於構建用於跟蹤whois記錄更改的系統,最佳存儲機制(從要使用的數據庫的角度來看,系統用於存儲所有記錄)是什麼?該計劃將每天運行一次,並且應該保留以前的值和新的值。用於跟蹤whois記錄變化的系統

建議數據庫與思考如何存儲不同的記錄/字段,以便數據不冗餘/重複


(添加)我在一個機構的想法來存儲數據

例的情況下在2010年1月1日顯示出一個域名「sample.com」從personA到personB的銷售

Table_DomainNames 
DomainId | DomainName 
1   example.com 
2   sample.com 

Table_ChangeTrack 
DomainId | DateTime | RegistrarId | RegistrantId | (others) 
2   1/1/2009   1    1 
2   1/1/2010   2    2 

Table_Registrars 
RegistrarId | RegistrarName 
1    GoDaddy 
2    1&1 

Table_Registrants 
RegistrantId | RegistrantName 
1    PersonA 
2    PersonB 

所有表格均爲「僅附加」。這個模型是否有意義?只有在任何監控字段發生變化時,才應將「變更追蹤」添加到「」。

有沒有什麼方法可以從尺寸的角度來使這個更高效/更緊密?

回答

2

主要數據是whois記錄的存在或變化。這表明,你的主表:

<id, domain, effective_date, detail_id> 

其中detail_id點實際的WHOIS數據,可能歸自己:

<detail_id, registrar_id, admin_id, tech_id, ...> 

但是千萬注意,大多數註冊考慮的信息他們的財產(無論是或沒有),並有類似的警告:

使用條款:您無權 通過U的訪問或查詢我們的Whois數據庫 電子 流程,是高容量和 自動除本身的合理 需要註冊域名或 修改現有的登記......

從中你可以期望他們會如果你砍你關閉讀他們的數據庫太多了。

+0

我有權限自動使用他們的系統。而不是通過「detail_id」存儲它,不會通過registrar_id,admin_id等的'X'值之一來存儲它更有效率......其中這些數字來自另一個表本身。例如:table_registrar(registrar_id,registrar_name)? – DrMHC 2010-07-29 12:51:55

+0

我不確定我是否理解你的評論。域名是主鍵,所有信息都是從屬(取決於)該鍵。由於域名有可能(?)更改註冊商,因此我所概述的結構使第三方正常意義上的域名在registrar_id的許多引用中,admin_id將等於tech_id等。 – msw 2010-07-29 12:59:50

+0

嗯...將信息添加到主要問題來解釋更好 – DrMHC 2010-07-29 16:15:15

0

你可以

  • 店進行比較的WHOIS記錄的數據字段的標準化形式的校驗和。
  • 如果需要,存儲數據的原始版本和當前版本(可能以壓縮格式)。如果需要,
  • 存儲每個檢測到的變化(可能以壓縮形式)的差異。

這很像增量備份系統的工作原理。也許你可以從那裏獲得更多的靈感。

0

您可以在excel文件中寫入vbscript以出去查詢網頁(在這種情況下,特定網站的whois網址),然後將結果存儲回excel中的工作表。