pandas

2熱度

1回答

下面是大得多/複雜dataframes的蠅頭/玩具版本我的工作： >>> A key u v w x 0 a 0.757954 0.258917 0.404934 0.303313 1 b 0.583382 0.504687 NaN 0.618369 2 c NaN 0.982785 0.902166 NaN 3 d 0.898838 0.472143 N

0熱度

1回答

如何使用電池df.str.extract的open（）1

提取多個組：如何才能讓圖案從熊貓小區列表的所有出現次數？這可能嗎？ name_pattern = r'([A]u?[-_\s]?[0-9]{2})' df["Result"] = df["Name"].str.extract(name_pattern, flags=re.IGNORECASE) 示例文本：是快樂和痛苦A-12真相的消費者選擇在最近的時代已經逃脫。沒有誰發現的歡迎。 E-99

1熱度

2回答

蟒蛇：生成數字柱之間用繩子

我有一個數據幀，這是一個列 category Search Search Онлайн-магазин Онлайн-магазин Форумы и отзывы Онлайн-магазин Форумы и отзывы Агрегатор Информационный ресурс Онлайн-магазин Телеком Онлайн-магазин 我需

0熱度

3回答

如何使用sklearn獲取無用功能列表？

我有一個數據集建立一個classificator： dataset = pd.read_csv(sys.argv[1], decimal=",",delimiter=";", encoding='cp1251') X=dataset.ix[:, dataset.columns != 'class'] Y=dataset['class'] 我想只選擇重要的功能，所以我做的： clf=svm.

1熱度

2回答

如何分組並將數組分配給python-pandas中的列？

給定一個數據幀df那樣： a b 2 nan 3 nan 3 nan 4 nan 4 nan 4 nan 5 nan 5 nan 5 nan 5 nan ... 一個關鍵的規則是，每個數字n在a重複n-1行。而我的預期成果是： a b 2 1 3 1 3 2 4 1 4 2 4 3 5 1 5 2 5 3

0熱度

2回答

熊貓GROUPBY和

我有一個數據幀如下： ref, type, amount 001, foo, 10 001, foo, 5 001, bar, 50 001, bar, 5 001, test, 100 001, test, 90 002, foo, 20 002, foo, 35 002, bar, 75 002, bar, 80 002, test, 150 002, test, 11

3熱度

1回答

關於*多鍵*外連接的默認/填充值

注意：下面的文章是我的earlier question的「多鍵」對應文件。這個早期問題的解決方案僅適用於加入單個密鑰的情況，並且我不清楚如何將這些解決方案概括爲下面介紹的多密鑰案例。因爲IME修改已經回答的問題的方式不符合它收到的答案，所以在SO中我不贊成，因此我單獨發佈了這個變體。我還發布了一個question Meta SO，關於我是否應該刪除這篇文章，而是修改原始問題，代價是使其當前答案無效

1熱度

1回答

如何處理與熊貓數據框關聯的元數據？

將元信息保存到數據框的最佳做法是什麼？我知道下面的編碼實踐 import pandas as pd df = pd.DataFrame([]) df.currency = 'USD' df.measure = 'Price' df.frequency = 'daily' ，但在這篇文章Adding meta-information/metadata to pandas DataFram

2熱度

1回答

在大熊貓擴大行數據幀

，我有以下數據： product Sales_band Hour_id sales prod_1 HIGH 1 200 prod_1 HIGH 3 100 prod_1 HIGH 4 300 prod_1 VERY HIGH 2 100 prod_1 VERY HIGH 5 253 prod_1 VERY HIGH 6 234 要添加一個基於hour_id值的行。

2熱度

2回答

將for循環調整爲列表理解

我遍歷數據庫中的表和日期列表以收集數據。這樣的事情： df_list = [] for table in table_list: for date in required_date_range: query = 'SELECT * FROM {} WHERE row_date = {};'.format(table, date) df = pd.read_sql