我用這簡單的算法搜索文件的一些文字和taging所在的頁面,我發現它加快字符串搜索算法
for (int i = 1; i <= a.PageCount; i++)
{
Buf.Append(a.Pages[i].Text);
String contain = Buf.ToString();
if (contain != "")
{
// Inside is dictionary of keys and value contain page where I found it
foreach (KeyValuePair<string, List<string>> pair in inside)
{
if (contain.Contains(pair.Key))
inside[pair.Key].Add((i).ToString());
}
}
Buf.Clear();
}
我都沒有問題,但是當我在700多頁的文檔搜索而我正在尋找超過500個按鍵,它的速度非常慢,需要大約1-2分鐘才能通過,有什麼辦法可以加速它?我正在使用c#
謝謝!
什麼樣的文件是?你能開始確定什麼鍵實際上在整個文件中,然後在逐頁的基礎上搜索那些鍵? – 2012-02-10 21:27:45
它的pdf文件,但它沒有關係的文件格式,它的產品目錄和一些頁面包含產品類型的表 - 我需要創建索引的所有鍵 - 它們在哪裏 - 他在頁面 – 2012-02-10 21:30:24