2017-07-25 54 views
1

我在我的項目中探索Apache OpenNLP產品,其中一個要求是在我的案例中堅持訓練有素的DB - Mongo DB/couchbase模型。 現在主要是我期待的文檔分類模型輸出存儲數據庫,這樣我就不必重新運行,除非它修改Apache OpenNLP堅持型號到DB

我看到庫中的類不能序列例如DocumentCategorizerME和我得到json deserilization異常,如果我試圖檢索持久性記錄,所以想知道是否有人已經這樣做。

一般來說,即使我想使用任何其他開源NLP產品,也會堅持這種方法。

回答

0

一個可以使用DoccatModel.serialize序列化和模型存儲蒙戈DB應遵循的方法 - GridFS的

Couchbase DB具有20 MB大小的硬限制,存儲二進制數據。