2012-02-22 87 views
0

上午建立一個網站,將有文章,政策和法律和文字的東西。我在MSSql 2008數據庫中存儲了所有數據(在某些情況下,超過8000個字符的文章)。我讀了一些文章,他們說文本數據不應該存儲在數據庫中。他們應該在哪裏儲存?在.txt文件或東西?我也想搜索數據。如果它們存儲在數據庫中,我可以使用存儲過程等。如果存儲在文檔中,我需要使用像Lucene這樣的工具。我對嗎?我的方法是在這個項目中使用數據庫錯誤嗎?請賜教。構建文本內容網站的正確方法是什麼?

+0

[引文需要]。文本數據應該存儲在數據庫中,這就是他們的用途。你確定你沒有閱讀過「**圖片**數據不應該存儲在數據庫中」嗎? (甚至有爭議) – Piskvor 2012-02-22 11:39:27

+0

本文中的http://trycatchfail.com/blog/post/Introduction-to-LuceneNET.aspx請參閱「爲什麼不使用SQL Server?」一節。 – heaVenShaker 2012-02-22 11:47:31

+0

你錯了。它說「不要使用SQL Server來存儲*和搜索* **大量的文本**」(重點是我的)。 8000個字符(從數據庫的角度來看)不是大量的文本,而不是2012年。您需要所有文章至少放大一百倍,直到問題開始顯現。對於這樣的網站,你所描述的,MSSQL是足夠的。還要注意文章是*全文搜索*,而不僅僅是存儲和檢索。 – Piskvor 2012-02-22 11:53:24

回答

0

您將使用的一些說明對這一項目DB不管你如何看待它,不管它是: 1)一個老式的平面文件數據庫(TXT文檔,不建議用於大型項目恕我直言) 2)傳統文本存儲數據庫 3)文檔數據庫

是否使用文本數據庫或文檔數據庫的參數取決於您擁有或可能訪問哪些技能/知識(或幫助用)。這聽起來像你對文本數據庫更加舒適,而且我認爲這沒什麼不妥 - 最糟糕的情況是,如果最終確實需要長期使用文檔而不是直接文本存儲你應該能夠從文本數據庫自動生成文檔 - 我懷疑做相反將會更加棘手(將專有文檔的負載轉換爲文本進行存儲和插入)。從文本數據庫生成純文本文件很簡單,大多數供應商文檔格式支持導入純文本文檔以供後續格式化。

對於一個大型項目這樣,你真的需要花一些時間考慮你的文件有可能被用於通過誰,什麼方法最適合他們。如果您爲大量使用MS Word並希望下載數據的用戶提供數據庫,則可能需要考慮使用文檔數據庫。如果它只是你想提供的信息(和基於網絡的工具),你想要考慮如何操縱你自己的數據。

這是所有的意見很明顯,但我最後的建議是一定要使用從一開始就UTF-8文本,如果你走的路線文本(痛苦的經歷)。

+0

:)好的感謝您的意見 – heaVenShaker 2012-02-22 12:17:05

相關問題