2010-10-24 42 views
4

我想知道是否有人可以指向我可以用來測試一些高性能字符串數據結構的隨機單詞的非常大的字典?我發現一些在〜2MB的範圍內......但是如果可能的話,我想要一些更大的。我猜測必須有一些可以使用的大型標準字符串數據集。謝謝!用於基準測試的隨機單詞的大型文本文件字典?

回答

1

我建議採取通過材料一看可在TREC(文本檢索會議)。一些好的數據集可能會滿足您的要求。