mining

0熱度

1回答

我正在構建一個使用連續值（雙打）字段的決策樹。我應該如何創建範圍節點來構建樹（找到最佳範圍值）

-2熱度

1回答

我有一個非常有趣的問題陳述...我有兩個實際上彼此相關的數據集（它們都與汽車製造商和模型有關）。雖然其中一個是處理數據（品牌，型號和變體已被拆分，處理和編輯），而另一列是原始數據。有什麼辦法可以讓兩者有聯繫嗎？我完全失去了，因此，沒有提供任何代碼。問題是沒有辦法鏈接兩列，因爲沒有SID ....它的純名字。

-1熱度

1回答

音頻挖掘和語音處理

我們打算做一個關於音頻挖掘的項目。它基本上是從用戶那裏接受輸入並處理數據輸入並給出想要的結果（但僅限於數字）。我們試圖設計一個android應用程序同樣的。如果用戶輸入「12345」，那麼它應該查找存儲在數據庫中的數據，並做一些處理並提供給我們詳細信息。任何人都可以洞察可以做什麼或從哪裏開始。

0熱度

1回答

使用基於矢量的批量處理的MySQL中的Columnstore索引技術

我正在使用MySQL作爲數據庫，並且由於數據庫很大，因此它已被列爲索引。但現在有使用MSSQL像索引方法的要求，因爲它一直說執行得更快，其鏈接如下： http://blogs.technet.com/b/dataplatforminsider/archive/2011/08/04/columnstore-indexes-a-new-feature-in-sql-server-known-as-pr

0熱度

1回答

python和redis，語法不清

這是中的代碼的副本挖掘社交網絡的書。我是這方面的新人，也是redis。我想了解$在這方面的含義。還打印%s，這是什麼意思？這是（從：https://github.com/ptwobrussell/Mining-the-Social-Web）：下面的源代碼 import sys import redis from twitter__util import getRedisIdByScree

0熱度

1回答

R Web /文本挖掘 - Web查詢JSON閱讀

在Blekko搜索引擎中，您可以使用JSON格式獲取搜索結果，例如，與搜索項「Lifehacker的」： http://blekko.com/ws/?q=lifehacker+%2Fjson 你怎麼能執行從讀該查詢和解析的內容？ [有一個網址，一個RSS網址，並與主文本片段] 我已經試過包tm.plugin.webmining和boilerpipeR，但不能弄明白。

0熱度

2回答

搜索推特並收集來自「挖掘社交網絡」的搜索結果示例

我正在閱讀here上的「挖掘社交網絡2nd E」的代碼，並試圖瞭解示例6如何工作！我試圖打印statuses的長度，並輸出不同的結果，下面我將顯示兩個代碼片段和每個結果，我希望如果有人可以向我解釋爲什麼我會得到不同的結果...謝謝提前。 1st code snippet: q = '#python' count = 100 # See https://dev.twitter.com/d

-3熱度

2回答

挖掘衆包數據的合法性

我有一個項目想法，我想在公衆可用的數據中挖掘它通過衆包獲得的另一個網站。這是因爲我有我自己的項目的初始數據。重申一下，我想寫一個機器人來抓取另一個網站上顯示的數據並將其用於我自己的網站。有人知道這種事情的合法性嗎？原始網站是否擁有人羣提供的數據？即使如此，我可以使用它嗎？

2熱度

2回答

poclbm不報告哈希深度或slush

我在我的系統上運行poclbm，但由於某種原因deepbit和slush不「看到」正在執行的工作。我的系統每秒報告大約200兆字節。我試着用我的cpu使用相同的設置進行挖掘，然後deepbit和slush都認識到工作正在進行。這是我得到了相應的挖掘硬件的錯誤（每分鐘左右）：用12.10版本poclbm與ATI 5800系列 poclbm error: pit.deepbit.net:8332 2

1熱度

1回答

txt文件在R包中生成NA tm（textmining）

我想讀取一個txt文件並執行一些文本挖掘方法。當我在R中使用tm包時，我收到了很多錯誤消息。例如，如果我想關聯最常用的單詞，我只有NA。下面是代碼，我至今使用： library(tm) doc <- c("word1 word1 word2 word1 word2 word3 word1 word2 word3 word4 word1 word2 word3 word4 word5") C