2014-11-05 35 views
0

所以我有多個路徑存儲,每個路徑將包括數據點x1,y1 | x2,y2 | x3,y3 ...等編程機器學習,比較兩個繪製線與xy座標

我想比較這些路徑,以找出是否存在任何相似性。

我可以遍歷每個點並查看它是否與第一個路徑中的任何點匹配,然後查看下一個點是否與下一個點相匹配。

我認爲這將工作,如果沒有異常,但可以跳過,如果下一個點不匹配。

我想建立在寬容如10的一定程度上,10可以匹配12,12或8,8

這是比較數據的好方法,或者是有沒有更好的方法?

作爲第二步,我可能也想考慮時間作爲一個值,所以每個點都會有一個與之相關的時間值。

+0

您可能需要考慮動態時間扭曲,這種方法可以將兩個序列以不同的速度進行對齊並找到最佳匹配。 – 2014-11-06 15:48:26

+0

怎麼樣的一些輸入路徑的例子,所以我們實際上看到你在比較什麼......包括相似和不同的例子,添加比較的條件,比如尺度上的比較不變,旋轉,平移......添加任何其他標準你需要匹配 – Spektre 2015-03-17 12:09:14

+0

我重新標記你的問題,所以檢查是否可以或修復,如果不是。這與機器學習無關,只是混淆了其他人(不管它是否用於它)總是要小心標籤。錯誤選擇的標籤導致沒有或錯誤的答案,因爲大多數人通過標籤排序問題...此外,標題可以改進,以更好地匹配您的問題... – Spektre 2015-03-17 12:17:40

回答

0

你可以比較兩組點的均值和方差。如果它們是直線的,就像你推測的那樣,可以通過兩個數據集擬合直線,然後比較兩條直線的參數來推斷它們的距離。如果你能說出兩個數據集的行爲,那將會更有幫助。

+0

路徑可以去任何網格上的任何地方,所以可以基本上跨越或去任何地方,但我可以翻譯的點,而不是第二點被繪製左邊的第一點,我可以翻譯相同的距離的權利。 – 2014-11-05 17:51:35

+0

你爲什麼要這樣做 – 2014-11-06 05:37:27

0

一些可能的方案,你可以使用:

  1. 手柄展位路徑,多邊形和比較他們這樣

  2. 使用OCR算法/接近

  3. 變換兩個路徑到同步數據集和關聯

[注意事項]

  • 根據輸入數據也可以利用DCT/DFT變換
  • 刪除不重要的數據...(如在JPG壓縮)
  • 和或比較在頻域而不是空間/時域
  • 也可以比較明顯的事情(上旋轉和平移不變)等

    1. 區域
    2. 周長
    3. 號自交的
    4. 數inflex點
+0

感謝你的回覆一些有趣的選項,我實際上已經開始在此工作。我現在有一個工作示例,我有幾個檢查,確定點b1,位於點a1或a2的半徑內,點b1位於a1 + r,a1 - r和a1 + r,a2 + r,這些點將是矩形的兩邊,或者矢量b1,b2是否與a2的半徑相交。 哎呀,這似乎工作我相信有一些路徑會返回誤報,但它給了我我的第一個工作模型。 – 2015-03-17 12:56:32