pandas

    2熱度

    1回答

    下面是大得多/複雜dataframes的蠅頭/玩具版本我的工作: >>> A key u v w x 0 a 0.757954 0.258917 0.404934 0.303313 1 b 0.583382 0.504687 NaN 0.618369 2 c NaN 0.982785 0.902166 NaN 3 d 0.898838 0.472143 N

    0熱度

    1回答

    提取多個組:如何才能讓圖案從熊貓小區列表的所有出現次數?這可能嗎? name_pattern = r'([A]u?[-_\s]?[0-9]{2})' df["Result"] = df["Name"].str.extract(name_pattern, flags=re.IGNORECASE) 示例文本: 是快樂和痛苦A-12真相的消費者選擇在最近的時代已經逃脫。沒有誰發現的歡迎。 E-99

    1熱度

    2回答

    我有一個數據幀,這是一個列 category Search Search Онлайн-магазин Онлайн-магазин Форумы и отзывы Онлайн-магазин Форумы и отзывы Агрегатор Информационный ресурс Онлайн-магазин Телеком Онлайн-магазин 我需

    0熱度

    3回答

    我有一個數據集建立一個classificator: dataset = pd.read_csv(sys.argv[1], decimal=",",delimiter=";", encoding='cp1251') X=dataset.ix[:, dataset.columns != 'class'] Y=dataset['class'] 我想只選擇重要的功能,所以我做的: clf=svm.

    1熱度

    2回答

    給定一個數據幀df那樣: a b 2 nan 3 nan 3 nan 4 nan 4 nan 4 nan 5 nan 5 nan 5 nan 5 nan ... 一個關鍵的規則是,每個數字n在a重複n-1行。而我的預期成果是: a b 2 1 3 1 3 2 4 1 4 2 4 3 5 1 5 2 5 3

    0熱度

    2回答

    我有一個數據幀如下: ref, type, amount 001, foo, 10 001, foo, 5 001, bar, 50 001, bar, 5 001, test, 100 001, test, 90 002, foo, 20 002, foo, 35 002, bar, 75 002, bar, 80 002, test, 150 002, test, 11

    3熱度

    1回答

    注意:下面的文章是我的earlier question的「多鍵」對應文件。這個早期問題的解決方案僅適用於加入單個密鑰的情況,並且我不清楚如何將這些解決方案概括爲下面介紹的多密鑰案例。因爲IME修改已經回答的問題的方式不符合它收到的答案,所以在SO中我不贊成,因此我單獨發佈了這個變體。我還發布了一個question Meta SO,關於我是否應該刪除這篇文章,而是修改原始問題,代價是使其當前答案無效

    1熱度

    1回答

    將元信息保存到數據框的最佳做法是什麼?我知道下面的編碼實踐 import pandas as pd df = pd.DataFrame([]) df.currency = 'USD' df.measure = 'Price' df.frequency = 'daily' ,但在這篇文章Adding meta-information/metadata to pandas DataFram

    2熱度

    1回答

    ,我有以下數據: product Sales_band Hour_id sales prod_1 HIGH 1 200 prod_1 HIGH 3 100 prod_1 HIGH 4 300 prod_1 VERY HIGH 2 100 prod_1 VERY HIGH 5 253 prod_1 VERY HIGH 6 234 要添加一個基於hour_id值的行。

    2熱度

    2回答

    我遍歷數據庫中的表和日期列表以收集數據。這樣的事情: df_list = [] for table in table_list: for date in required_date_range: query = 'SELECT * FROM {} WHERE row_date = {};'.format(table, date) df = pd.read_sql