正是標題所說的。通過在Linux中使用命令行獲取灰度圖片的「文本」邊界框的座標
嚴格地說,我爲灰度圖像定義的「文本」邊界框是一組4個座標(x,y,x +寬度,y +高度),必須在該圖像中定義矩形區域最大數量的非白色像素,同時儘可能少的白色像素數量(沒有改變最大數量的非白色像素)。我有引號中的文本,因爲圖像實際上不包含文本,因爲圖像只包含帶有顏色的像素。
已經在我的Ubuntu安裝的ImageMagick,並在終端輸入命令:$convert input.png -trim ouput.png
,我得到:
打開新的標籤頁的兩個圖像在你的網頁瀏覽器,你將瞭解他們的差異,你也會明白我定義的「文本」邊界框。 output.png實際上是我正在尋找的寬度和高度。我不知道如何獲得x和y座標。
這裏提供的答案(1)對於pdf頁面不符合我的標準,因爲gs給我的「文本」邊界框有很大的白色邊界(並且實際上,據我所知,gs定義爲「文本」邊界框對於pdf而言,與我對圖片的「文本」邊界框的定義有所不同)。
向我們展示您到目前爲止的代碼。 –
我沒有獲取文本邊界框的座標的代碼,因爲我在文章中已經定義了它。我知道一個命令,我已經定義了裁剪圖片的文本邊界框:$ convert input.png -trim output.png。問題是我不知道如何獲得文本綁定框的座標。 – liaguridio
你想爲此創建一個程序嗎?如果是這樣,你需要嘗試寫一些代碼。如果不是的話,你應該在SuperUser上發佈這個問題,並尋求如何使用現有程序的幫助。無論哪種方式,它是目前寫的題外話。 –