我使用的是Google Vision API,主要用於提取文本。我工作得很好,但對於需要API掃描輸入行的特定情況,在移至下一行之前吐出文本。但是,API看起來似乎正在使用某種邏輯,使其在左側從上到下掃描並移動到右側,並執行從上到下的掃描。如果API從左向右讀,向下移動等,我會很喜歡。文本提取 - 逐行
例如,考慮圖像:
的API返回這樣的文字:
「 Name DOB Gender: Lives In John Doe 01-Jan-1970 LA 」
然而,我本來期望是這樣的:
「 Name: John Doe DOB: 01-Jan-1970 Gender: M Lives In: LA 」
我想有一種方法來定義塊大小或ma rgin設置(?)逐行讀取圖像/掃描線?
感謝您的幫助。 亞歷
謝謝,這是一種可能性。 –