2010-02-23 108 views
0

我有一個應用程序,允許用戶上傳文件,主要是PDF和Word文檔。這些文件存儲在數據庫的varbinary字段中。無論用戶如何通過Web或Windows Forms應用程序或任何其他表示層來訪問應用程序,我都需要讓這些文件可用。如何搜索SQL Server中的varbinary字段?

有沒有方法可以搜索這些字段的原始文本內容?例如,如果我上傳簡歷,我希望用戶能夠搜索C#並能夠查看varbinary字段的內容以獲取指定的文本。

此外,如果有更好的策略來處理這個問題,我願意接受。

回答

3

我會說,使用SQL Server是工作的錯誤工具(搜索方式),因爲它不能通過存儲在二進制文檔中的文本進行本地解析。

我建議你找一些像Lucene.NET(Lucene搜索引擎的.NET端口,最初用Java編寫),這樣可以讓你在文件上傳後輕鬆搜索文件。

您應該能夠構建一個解決方案,允許您在SQL Server中保留文檔存儲,但使用Lucene.NET索引和搜索您存儲在其中的文檔。

+0

所以這聽起來像我需要有(2)該文件的副本,一個存儲在數據庫中,另一個存儲爲可以索引的文件。我想知道SharePoint如何進行搜索? – mattruma 2010-02-23 15:22:45

+0

您不需要擁有該文件的兩個副本。 Lucene.NET(有一點幫助)應該能夠索引數據庫中的副本。 SharePoint與Windows搜索服務的功能類似。 – 2010-02-23 15:33:56

2

您需要一層代碼才能提取類型並瞭解格式。到SQL,它只是原始數據

相關問題