transcription

    1熱度

    1回答

    假設我有音頻和該音頻的明文成績單,如何使用語音識別以編程方式從兩者生成字幕? 這與編輯視頻時YouTube在其字幕/字幕頁面上提供的內容非常相似。 有什麼API可以做到這一點?它有哪些挑戰? 我最流利的Java/C#,但這是語言不可知論的。

    0熱度

    1回答

    我可以在我的網站中嵌入免費或付費的交互式腳本服務嗎? 我發現了幾個服務,但我必須給他們視頻來記錄它,然後他們會給我的代碼嵌入我的網站,但我想要的是能夠在我的網站與我的轉錄主持此服務我做了我的自我,甚至爲我的客戶提供免費服務。

    1熱度

    1回答

    萬一有人重溫這有一個建議: 我一直要求創建或查找符合以下要求的系統...... 1)允許上傳視頻文件 - 當前解決方案:將PHP上傳到Web根目錄上方的目錄,然後在允許訪問流之前驗證用戶。 2)標籤的文件,有關視頻的參與者(這些都是調查)供以後搜索元信息。 - 當前解決方案:用「;」分隔項目的關鍵字文本區域然後將項目解析爲數據庫中的「關鍵字」表格以供稍後搜索。如果參與者陳述「我喜歡游泳,騎自行車,

    4熱度

    2回答

    我最近正在使用CMU的sphinx4進行轉錄並最終強制對齊,即將音頻與其轉錄對齊。 我發現一個名爲AutoCap的項目,基本上做了我想開發的項目。所以,我安裝了它,但沒有奏效。我嘗試調整它,但我得到的是不正確的時間戳。 所以,我想到了使用sphinx4,並讓它自己去。我使用Sphinx的Transcriber.jar文件成功轉錄了一個wav文件。 但我無法使用非數字數據的音頻。 readme頁面狀

    0熱度

    1回答

    有一定的組織,其週期性地提供一個「熱線」中所記錄的消息的形式的信息。是否有任何開源解決方案(或可以「連接」在一起的一組組件)可以讓我在網頁上以文本形式呈現這些信息?

    8熱度

    5回答

    我有關於音樂轉錄使用Java的項目,事情是,我創建了一個小程序,記錄聲音並將其保存到一個WAV文件,播放器應該只播放他/她想要轉錄,然後我卡住了,我必須從保存的WAV文件中獲取信息並使用這些信息創建一個MIDI文件,並且在創建MIDI文件之後,我必須爲它生成樂譜(樂譜),所有這些都必須用Java來完成。 我到處搜索瞭解如何完成這些工作的清晰解釋,但是我沒有找到任何直接的東西:(因爲我是Java新手

    0熱度

    2回答

    任何人有足夠的轉錄這個PHP到ASP.NET ?? 非常感謝您提前。 JJ <?php if(isset($_POST['data']) && $_POST['data'] != '') { $output = $_POST['data']; $newfile = time() . ".xml"; $file = fopen ($newfile, "w"); fwrite($file,

    3熱度

    1回答

    我期待爲音頻文件中的每個單詞獲得大致準確的時間戳。我也有原始文本與音頻文件一起使用,可用作各種交叉參考源。這與「音頻挖掘」類似,我相信這是您只有輸入音頻的地方,而在這裏我有音頻和文本。 我最好喜歡使用開源軟件來做到這一點,並希望接受大多數語言作爲輸入(例如英語,法語,德語,西班牙語以及理想的俄語和普通話)。 我甚至會接受一種解決方案,它只能匹配各種單詞的時間戳(例如,如果轉錄不完全準確)。然後將輸

    -1熱度

    1回答

    我和我的朋友正在開發一個iPhone和Android應用程序。我們需要使用文字轉錄。我們應該選擇什麼編碼(甚至是特殊字體)來在我們的應用程序中顯示正確的單詞轉錄? 更新(2011年12月14日):我想提供更多信息。我嘗試閱讀穆勒詞典(http://sourceforge.net/projects/xdxf/files/dicts-XDXF/sdict05/comn_sdict_axm05_muel

    0熱度

    1回答

    我正在製作一個語音識別系統,Julius在這項工作中顯示了不錯的結果。 Sample .voca文件中的單詞完美地識別,但是如何將自己的單詞和副本放到文件中? 我試過VoxForge(http://www.voxforge.org/)最後一個版本,並每晚構建與自己的詞彙量聲學模型,但我已經得到了很多在朱利葉斯錯誤很多像這樣開頭: Error: voca_load_htkdict: line 19: