2012-04-28 63 views
1

我正在考慮爲我的大學課程開發一個網站,讓學生可以上傳他們自己的教程,內容如何,​​等等。一般來說,所有的文件都是純文字文字,並張貼在我的網站上。但有時會有一些課程材料和其他需要存儲的內容,可以是doc,docx,pdf或任何類似的格式。 PHP可以讀取,寫入,搜索文件,但如果我需要搜索內容,我將需要搜索文件以及數據庫。如果有成千上萬的不同大小的文件可以搜索到,它會很耗時且速度較慢。有沒有可能的解決方案來克服這個問題?我可以使用PHP來搜索一些文件嗎?

這只是一個想法。我發現pdflib提供了類似的功能,但我需要更多。是否有機會索引我的文件以加快搜索速度?

在此先感謝。

+0

那怎麼谷歌的搜索工作,它的索引大量的文件,並保持所有單詞索引,但他們有很多的空間來存儲這個指標。我認爲他們使用大表作爲他們的數據庫,我認爲他們開源它。 – jcubic 2012-04-28 19:22:02

+0

它是你的課程項目嗎?或者您真的想要重新創建WikiPedia或SharePoint這樣的文檔管理系統? – 2012-04-28 19:23:51

+0

當然它的開源和基於社區的項目。當我沒有找到與我的課程有關的問題的適當解決方案時,這個想法就出現了。 – maksbd19 2012-04-28 19:31:54

回答

1

你可以使用獅身人面像。它用於搜索數百萬行文本,因此這些文檔很容易。

http://en.wikipedia.org/wiki/Sphinx_(search_engine)

+0

感謝您的回答。我在谷歌搜索獅身人面像。經過一番搜索後,我發現有人建議將我的文件轉換爲純文本並將它們存儲在我的數據庫中,然後執行一些索引。但是如果我不想對文件進行任何修改/轉換,該怎麼辦?如果沒有辦法,那麼我將不得不通過建議的程序。再次感謝。 – maksbd19 2012-04-28 20:16:06

相關問題