2017-10-22 82 views
0

我有一個時間序列數據集,從1992-2017年。我可以爲整個數據點設置顏色,但我想要的是爲特定年份範圍設置所需的顏色。例如;從1992 - 1995年的「藍色」,從1995年到2005年的「紅色」等。我們該怎麼做?如何在一個圖中爲特定年份值範圍指定不同的顏色? (Python)

數據集有2列;年和價值。

import numpy as np 
import pandas as pd 
from scipy import stats 
from sklearn import linear_model 
from matplotlib import pyplot as plt 
import pylab 
import matplotlib.patches as mpatches 
import matplotlib.pyplot as plt 
import seaborn as sns 
from sklearn.linear_model import LinearRegression 

Atlantic = pd.read_csv('C:\\AtlanticEnd.csv', error_bad_lines=False) 

X = Atlantic['year'] 

y = Atlantic['Poseidon'] 

plt.figure(figsize=(20,10)) 
plt.ylabel('Change in mean sea level [mm]', fontsize=20) 
plt.xlabel('Years', fontsize=20) 
plt.title('Atlantic Ocean - Mean Sea Level', fontsize=20) 
colors = ["blue", "red", "green", "purple"] 
texts = ["Poseidon", "Jason1", "Jason2", "Jason3"] 
patches = [ plt.plot([],[], marker="o", ms=10, ls="", mec=None, color=colors[i], 
      label="{:s}".format(texts[i]))[0] for i in range(len(texts)) ] 
plt.legend(handles=patches, loc='upper left', ncol=1, facecolor="grey", numpoints=1) 

plt.plot(X, y, 'ro', color='red') 

slope, intercept, r_value, p_value, std_err = stats.linregress(X, y) 
plt.plot(X, X*slope+intercept, 'b') 

plt.axis([1992, 2018, -25, 80]) 

plt.grid(True) 

plt.show() 

def trendline(Atlantic, order=1): 
    coeffs = np.polyfit(Atlantic.index.values, list(Atlantic), order) 
    slope = coeffs[-2] 
    return float(slope) 

slope = trendline(y) 
print(slope) 

enter image description here

+1

歡迎SO。提供樣本數據並告訴我們您做了什麼:[最小,完整和可驗證示例](https://stackoverflow.com/help/mcve) – skrubber

+0

添加了代碼和輸出圖片。 –

回答

0

我做我自己的隨機數據,此功能工作,但假設你有不重疊的日期範圍,這應該工作。這也好像你的日期不是pd.datetime類型。這應該適用於pd.datetime類型,但字典中的查找值將類似於("1992-01-01","2000-01-01")等。

# Create data 
data = np.random.rand(260,1) 
dates = np.array(list(range(1992,2018))*10) 

df = pd.DataFrame({"y":data[:,0],"date":dates}) 
df = df.sort(columns="date") 

# Dictionary lookup 
lookup_dict = {(1992,2000):"r", (2001,2006):"b",(2007,2018):"k"} 

# Slice data and plot 
fig, ax = plt.subplots() 
for lrange in lookup_dict: 
    temp = df[(df.date>=lrange[0]) & (df.date<=lrange[1])] 
    ax.plot(temp.date,temp.y,color=lookup_dict[lrange], marker="o",ls="none") 

這將產生:

enter image description here

0

我可以想像,使用顏色表爲點的散點圖可以是一個簡單的解決方案。假設年份以十進制格式給出,那麼分散的顏色將僅由年份來定義。 A BoundaryNorm將定義值的範圍,並且可以從顏色列表容易地創建顏色映射。

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 
import matplotlib.colors 

y = np.random.rand(300)*26+1992 
d = (3.075*(y-1992)-17)+np.random.normal(0,5,300) 
df = pd.DataFrame({"year" : y, "data" : d}) 

bounds = [1992,1995,2005,2015,2018] 
colors = ["darkorchid", "crimson", "limegreen", "gold"] 
cmap = matplotlib.colors.ListedColormap(colors) 
norm = matplotlib.colors.BoundaryNorm(bounds, len(colors)) 

fig, ax = plt.subplots() 
sc = ax.scatter(df.year, df.data, c=df.year.values, cmap=cmap, norm=norm) 
fig.colorbar(sc, spacing="proportional") 

fit = np.polyfit(df.year.values, df.data.values, deg=1) 
ax.plot(df.year, np.poly1d(fit)(df.year.values), color="k") 

plt.show() 

enter image description here

相關問題