我想知道是否有人可以指向我可以用來測試一些高性能字符串數據結構的隨機單詞的非常大的字典?我發現一些在〜2MB的範圍內......但是如果可能的話,我想要一些更大的。我猜測必須有一些可以使用的大型標準字符串數據集。謝謝!用於基準測試的隨機單詞的大型文本文件字典?
4
A
回答
4
上面的鏈接是在弱勢族羣的拼寫檢查文章中提到 - http://norvig.com/spell-correct.html
1
我建議採取通過材料一看可在TREC(文本檢索會議)。一些好的數據集可能會滿足您的要求。
相關問題
- 1. 字典單詞的隨機選擇
- 2. Python基於文本的隨機問題測驗
- 3. 如何用android中的隨機字母創建字典單詞?
- 4. 經典ASP隨機文字
- 5. 如何從文本文件打印隨機單詞
- 6. 文本文件詞典Java
- 7. 隨機生成可變大小的測試文件
- 8. Python中基於文本的機制:類,字典或列表?
- 9. 牛津詞典的單詞表文件
- 10. 從字符串數組文本文件中獲取一個隨機單詞
- 11. 基於文本文件中使用蝙蝠腳本的單詞複製行
- 12. 創建文本字詞典
- 13. 用於測試性能的C++單元測試(合成基準測試)
- 14. 可用於C的基準測試庫#
- 15. 單元測試的典型大小與測試代碼相比
- 16. 的UnicodeDecodeError當讀字典中的單詞用簡單的Python腳本文件
- 17. 如果單詞存在於字典文本文件中,快速查找
- 18. 檢測文本中的英文單詞
- 19. 基於表單域生成隨機文本
- 20. 如何從iPhone的字典中檢索隨機單詞?
- 21. 如何自動化測試基於文本的菜單
- 22. Vogar簡單基準測試
- 23. Python - 使用字典的基於文本的RPG庫存系統
- 24. Django的單元測試用於測試文件下載
- 25. VS2008:文件創建在單元測試中隨機失敗?
- 26. 的Javascript改變文本基於文本的文字作品,但隨後消失
- 27. XML文件,字典,詞典嵌套
- 28. 如何基於密鑰分離大文件並使用python將文件存儲在單獨的字典中?
- 29. 用於測試C和C++分配器的基準測試?
- 30. 測試基於文本的電子郵件