pearson-correlation

1熱度

3回答

1熱度

1回答

Python（numpy） - 關聯兩個binned圖

我的問題是如何關聯我的兩個binned圖並輸出Pearson相關係數？我不知道如何正確提取np.corrcoef函數所需的合併數組。這裏是我的腳本： import numpy as np import matplotlib.pyplot as plt A = np.genfromtxt('data1.txt') x1 = A[:,1] y1 = A[:,2] B=np.genfro

2熱度

1回答

如何實施策略設計模式？

我正在使用推薦系統。這將是一個Android應用程序，用戶將在其中輸入他們的偏好，並在這些偏好的基礎上，向該用戶顯示其他匹配的簡檔。我從用戶那裏獲取數據並將其存儲在Firebase中。這些是數值和爲了顯示匹配的簡檔與該用戶，我使用用於計算用戶之間的相似性計數兩種算法：Cosine similarity和Pearson correlation 我擷取算法的名稱從應用程序，然後執行算法，以顯示相似的

3熱度

2回答

MATLAB：2個矢量中所有指數的快速相關計算

我有2個矢量A和B，每個長度爲10,000。對於ind=1:10000中的每一個，我想要計算A(1:ind)和B(1:ind)的Pearson相關性。當我在for循環中執行此操作時，需要太多時間。在我的機器中，parfor不能與超過2名工人一起工作。有沒有辦法快速執行此操作並將結果保存在向量C中（顯然其長度爲10,000，第一個元素爲NaN）？我發現Fast rolling correlation

0熱度

1回答

比較R中的許多相關性

隨着時間的推移，我有數百個種羣（不同物種，地點等）的相關性。我如何統計分析所有這些相關性（各自的組）？我有p值，配置文件，相關係數爲每600 +相關，但我怎麼能比較這些組內（物種，位置等）。我試圖在數據相關人口數（百分比）和年份，物種和位置（變成虛擬變量）上進行大的部分相關性作爲控制因素，當家庭內部以及與位置相關時（作爲虛擬變量）作爲一個控制變量時關聯物種內，但我不知道這是否正確。下面是一些

1熱度

1回答

一到以矩陣許多相關計算中的R

試圖在一個矩陣來計算特定基因（這裏其基因1）與所有其它（35999個候選）的相關性 samp1 samp2 samp3 samp4 Gene 1 3.7891 2.4487 1.1939 0.6013 Gene 2 1.4484 3.2316 2.841 1.9545 Gene 3 0.4505 2.6062 2.0729 0.6403 . . Gene 36000 1.8828

0熱度

1回答

如何抵消熊貓皮爾遜與日期時間索引的相關性

我正在嘗試獲取前一週的輸入的相關值到下一週的輸出。爲了這個例子我已經設置了它，每週的輸入是下一週的輸出，df.corr()應該給出1.000000的結果。我原來的數據是這樣的：在這裏上傳 Date Input Output 1/1/2010 73 73 1/7/2010 2 73 1/13/2010 3 2 1/19/2010 4 3 全樣本數據： https

6熱度

1回答

計算配對距離矩陣：是一種可用於Python的可擴展的大數據準備方法嗎？

我有一個CSV文件，其中包含項目的特徵值：每行都是一個三元組（id_item，id_feature，value），表示特定項目的特定功能的值。數據非常稀少。我需要計算兩個項目的距離矩陣，一個使用Pearson相關度量，另一個使用Jaccard索引。目前，我實現了一個內存解決方案，我做這樣的事情： import numpy as np from numpy import genfromtxt

0熱度

1回答

熊貓與統計顯着性迴歸的相關性：（nan，1.0）

我想檢查熊貓數據框中多個列之間相關性和相關性的顯着性。用下面的數據幀，我已經構建了以下相關表： ARI Flesch Kincaid time VIX_close FEDFUNDS -2.090000 NaN -3.400000 2016-02-04 20.239333 0.345333 16.060272 38.489788 14.355616 2016-02-04 20.239

2熱度

1回答

python scipy spearman相關

我想從數據框（df）獲取列名並將它們關聯到由spearmanr相關函數生成的結果數組。我需要將列名（a-j）與相關值（spearman）和p值（spearman_pvalue）關聯起來。有沒有一種直觀的方式來執行此任務？ from scipy.stats import pearsonr,spearmanr import numpy as np import pandas as pd df=