Q

Spark - 評估問題

2017-08-11 106 views 0 likes

0

我正在評估我創建的模型。該模型給出了輸出結果，一個id列表及其核心反應錯誤構造（一個分數），並且id根據這個分數排序。比方說，分數越高，id越可疑。Spark - 評估問題

例子：

ids: t4, c1, s3, d5, a2, ... 
score: 18, 15, 13, 5, 2, ...

另外，我有一個包含真正的可疑IDS另一個列表。

suspicious: c1,d5

我的目標是能夠說的id是x％在我的名單可疑的是在得分列表頂部Y％。

有什麼想法嗎？並在火花實施將是慷慨的你！

2017-08-11 xiaomai

A

回答

0

這裏是我做過什麼，用大熊貓數據幀：

我創建了一個包含所有數據的dataframes DF，並加載可疑數據成系列。
在df中添加了另一列，即我命名的標籤。該記錄的標籤是基於可疑ID存在於可疑或不可疑
與此最終數據框（id，分數，標籤），我能夠根據標籤進行計數，並且能夠具有諸如在問題中。

2017-08-18 23:54:04 xiaomai

相關問題

1. Lightswitch評估和問題
2. SQL數學評估問題
3. Python功能評估問題
4. xgboost4j - spark評估需要RDD [（Double，Double）]
5. Bash腳本評估字符串問題
6. 非常奇怪的評估問題
7. Postfix評估器 - 掃描儀問題？
8. 在Spring中評估$ {error}的問題
9. 嵌套問題無法評估
10. 評估/知識測試問題
11. RazorEngine評估問題.js代碼
12. PHP + HTML代碼的PHP評估問題
13. C＃日期時間評估問題
14. Javascript評估問題（第二部分）
15. 表達評估設計問題
16. 語言評估問題：Eager Vs.懶惰
17. PHP if（）評估問題需要重寫
18. （TeeChart - Java）評估版本性能問題
19. SSRS表達式評估問題
20. Clojure中的Java，評估問題
21. WP7 - 評估主題顏色
22. 火花管道評估
23. 模型OCL評估與對象評估
24. Tensorflow評估：評估所有圖像
25. HTML Javascript自我評估問卷/問卷
26. insertIntoJDBC Spark問題
27. Spark MLLIB問題
28. 使用保存的Spark模型評估新數據
29. 開關評估
30. 評估功能