如果我說了70,000個對象並想對它們進行統計,但統計數據並不需要100%準確,那麼抽出1000個對象的最佳方法是什麼,對這些對象進行統計然後只是將其縮放到接近70,000的統計數據?我似乎無法找到從查詢集中獲取1000個隨機對象的有效方法。用Django逼近對象統計信息
2
A
回答
1
你可以隨意使用對象:
objs = list(MyModel.objects().order_by("?")[:1000])
但是,獲取生成的SQL的基本order by random
不是特別有效。
0
我知道這不是你要找的答案,但有時在做大量報告時,你需要比Django的ORM提供的更多。我和一個使用Django作爲主應用程序的人一起工作,但對於某些報表工具(和JSON服務),他使用了Flask和SQLAlchemy,並且能夠完成更多工作,而無需編寫SQL。
0
關於從數據庫中獲取隨機行的問題,有一個great post(在評論中也沒有幾個優點)。
我唯一要檢查的是通過「in_bulk」方法獲得一些對象,因爲這樣你可能會更快。
相關問題
- 1. 用戶的統計信息
- 2. Ehcache統計信息
- 3. Solr統計信息
- 4. 如何計算信息增益的值以減少浮點逼近誤差?
- 5. 使用awk計算統計信息
- 6. 逼近價格
- 7. 逼近結果
- 8. 如何獲得java進程對象的MemoryUsage統計信息
- 9. 哪裏存儲對象信息django?
- 10. 分數逼近最近
- 11. UIBarButtonSystemItem信息和統計
- 12. Jruby統計信息庫
- 13. Postgres統計信息 - pg_stat_get_db_xact_commit
- 14. MySql表和統計信息
- 15. Memcache統計信息cachedump
- 16. 生成mysql統計信息
- 17. iOS5,iOS4,...統計信息?
- 18. 每組Solr統計信息
- 19. Mesos從站統計信息
- 20. Git統計信息API JSON
- 21. Postgres統計信息收集
- 22. Python:代碼統計信息
- 23. Android Market統計信息
- 24. numpy的統計信息
- 25. 月份統計信息
- 26. 僞造Oracle統計信息?
- 27. 收集mysql統計信息
- 28. Google datastore統計信息
- 29. Java版本統計信息
- 30. Hadoop文件系統統計信息(FileSystem.Statistics)
這正是我碰到的。我讀過的文檔中說過.order_by('?')很慢,如果我試圖通過抽取樣本來加快速度,它無法幫助。 – DantheMan 2011-03-25 03:36:17