pearson-correlation

    1熱度

    3回答

    我有一個包含兩個類別字段和一個計數值的表。我需要根據其他類別的計數來計算一個類別的行之間的相關性。 因此,例如: Category_A|Category_B|Count Alan |Turkey |7 Alan |Ham |1 Alan |Spam |0 ... Bob |Turkey |2 Bob |Ham |9 Bob |Spam |12 ... 我需要

    1熱度

    1回答

    我的問題是如何關聯我的兩個binned圖並輸出Pearson相關係數? 我不知道如何正確提取np.corrcoef函數所需的合併數組。這裏是我的腳本: import numpy as np import matplotlib.pyplot as plt A = np.genfromtxt('data1.txt') x1 = A[:,1] y1 = A[:,2] B=np.genfro

    2熱度

    1回答

    我正在使用推薦系統。這將是一個Android應用程序,用戶將在其中輸入他們的偏好,並在這些偏好的基礎上,向該用戶顯示其他匹配的簡檔。我從用戶那裏獲取數據並將其存儲在Firebase中。 這些是數值和爲了顯示匹配的簡檔與該用戶,我使用用於計算用戶之間的相似性計數兩種算法:Cosine similarity和Pearson correlation 我擷取算法的名稱從應用程序,然後執行算法,以顯示相似的

    3熱度

    2回答

    我有2個矢量A和B,每個長度爲10,000。對於ind=1:10000中的每一個,我想要計算A(1:ind)和B(1:ind)的Pearson相關性。當我在for循環中執行此操作時,需要太多時間。在我的機器中,parfor不能與超過2名工人一起工作。有沒有辦法快速執行此操作並將結果保存在向量C中(顯然其長度爲10,000,第一個元素爲NaN)?我發現Fast rolling correlation

    0熱度

    1回答

    隨着時間的推移,我有數百個種羣(不同物種,地點等)的相關性。我如何統計分析所有這些相關性(各自的組)? 我有p值,配置文件,相關係數爲每600 +相關,但我怎麼能比較這些組內(物種,位置等)。 我試圖在數據相關人口數(百分比)和年份,物種和位置(變成虛擬變量)上進行大的部分相關性作爲控制因素,當家庭內部以及與位置相關時(作爲虛擬變量)作爲一個控制變量時關聯物種內,但我不知道這是否正確。 下面是一些

    1熱度

    1回答

    試圖在一個矩陣來計算特定基因(這裏其基因1)與所有其它(35999個候選)的相關性 samp1 samp2 samp3 samp4 Gene 1 3.7891 2.4487 1.1939 0.6013 Gene 2 1.4484 3.2316 2.841 1.9545 Gene 3 0.4505 2.6062 2.0729 0.6403 . . Gene 36000 1.8828

    0熱度

    1回答

    我正在嘗試獲取前一週的輸入的相關值到下一週的輸出。 爲了這個例子我已經設置了它,每週的輸入是下一週的輸出,df.corr()應該給出1.000000的結果。 我原來的數據是這樣的:在這裏上傳 Date Input Output 1/1/2010 73 73 1/7/2010 2 73 1/13/2010 3 2 1/19/2010 4 3 全樣本數據: https

    6熱度

    1回答

    我有一個CSV文件,其中包含項目的特徵值:每行都是一個三元組(id_item,id_feature,value),表示特定項目的特定功能的值。數據非常稀少。 我需要計算兩個項目的距離矩陣,一個使用Pearson相關度量,另一個使用Jaccard索引。 目前,我實現了一個內存解決方案,我做這樣的事情: import numpy as np from numpy import genfromtxt

    0熱度

    1回答

    我想檢查熊貓數據框中多個列之間相關性和相關性的顯着性。 用下面的數據幀,我已經構建了以下相關表: ARI Flesch Kincaid time VIX_close FEDFUNDS -2.090000 NaN -3.400000 2016-02-04 20.239333 0.345333 16.060272 38.489788 14.355616 2016-02-04 20.239

    2熱度

    1回答

    我想從數據框(df)獲取列名並將它們關聯到由spearmanr相關函數生成的結果數組。我需要將列名(a-j)與相關值(spearman)和p值(spearman_pvalue)關聯起來。有沒有一種直觀的方式來執行此任務? from scipy.stats import pearsonr,spearmanr import numpy as np import pandas as pd df=