0
我正在評估我創建的模型。該模型給出了輸出結果,一個id列表及其核心反應錯誤構造(一個分數),並且id根據這個分數排序。比方說,分數越高,id越可疑。Spark - 評估問題
例子:
ids: t4, c1, s3, d5, a2, ...
score: 18, 15, 13, 5, 2, ...
另外,我有一個包含真正的可疑IDS另一個列表。
suspicious: c1,d5
我的目標是能夠說的id是x%在我的名單可疑的是在得分列表頂部Y%。
有什麼想法嗎?並在火花實施將是慷慨的你!