2011-01-13 139 views
3

希望能得到一些幫助與此查詢,我在現在工作了一段時間,並不能更快得到任何:MySQL的左外連接速度慢

SELECT date, count(id) as 'visits' FROM dates 
LEFT OUTER JOIN visits 
ON (dates.date = DATE(visits.start) and account_id = 40) 
WHERE date >= '2010-12-13' AND date <= '2011-1-13' 
GROUP BY date ORDER BY date ASC 

該查詢花費約8秒跑步。我在dates.date,visits.start,visits.account_id和visits.start + visits.account_id上添加了索引,並且無法使其更快運行。

表結構(只顯示在訪問表中相關列):

create table visits (
    `id` int(11) NOT NULL AUTO_INCREMENT, 
    `account_id` int(11) NOT NULL, 
    `start` DATETIME NOT NULL, 
    `end` DATETIME NULL, 
    PRIMARY KEY (`id`) 
) ENGINE=MyISAM DEFAULT CHARSET=utf8; 

CREATE TABLE `dates` (
    `date` date NOT NULL, 
    PRIMARY KEY (`date`) 
) ENGINE=MyISAM DEFAULT CHARSET=latin1; 

日期表包含2010-1-1至2020年1月1日所有天(〜3K行)。訪問表包含約2010年4月1日至昨天約400k行。我使用的是日期表,因此連接將在沒有訪問的情況下返回0次訪問。

結果我想以供參考:提前任何幫助

+------------+--------+ 
| date  | visits | 
+------------+--------+ 
| 2010-12-13 | 301 | 
| 2010-12-14 | 356 | 
| 2010-12-15 | 423 | 
| 2010-12-16 | 332 | 
| 2010-12-17 | 346 | 
| 2010-12-18 | 226 | 
| 2010-12-19 | 213 | 
| 2010-12-20 | 311 | 
| 2010-12-21 | 273 | 
| 2010-12-22 | 286 | 
| 2010-12-23 | 241 | 
| 2010-12-24 | 149 | 
| 2010-12-25 | 102 | 
| 2010-12-26 | 174 | 
| 2010-12-27 | 258 | 
| 2010-12-28 | 348 | 
| 2010-12-29 | 392 | 
| 2010-12-30 | 395 | 
| 2010-12-31 | 278 | 
| 2011-01-01 | 241 | 
| 2011-01-02 | 295 | 
| 2011-01-03 | 369 | 
| 2011-01-04 | 438 | 
| 2011-01-05 | 393 | 
| 2011-01-06 | 368 | 
| 2011-01-07 | 435 | 
| 2011-01-08 | 313 | 
| 2011-01-09 | 250 | 
| 2011-01-10 | 345 | 
| 2011-01-11 | 387 | 
| 2011-01-12 |  0 | 
| 2011-01-13 |  0 | 
+------------+--------+ 

謝謝!

+0

查找`explain`和MySQL手冊`解釋extended` – goat 2011-01-13 19:55:31

回答

4

你的問題是在這裏:

ON (dates.date = DATE(visits.start) and account_id = 40) 

因爲您正在使用visits.startDATE功能,MySQL是無法使用索引的加入。

可能最好的解決方案是將start_dateend_date列添加到dates表中併爲這些列編制索引。因此,對於日期爲2011-01-01的行,開始日期爲2011-01-01 00:00:00,結束日期爲2011-01-01 23:59:59。

然後你就可以直接加入到日期表所示:

SELECT date, count(id) as 'visits' FROM dates 
LEFT OUTER JOIN visits 
ON (visits.start BETWEEN dates.start_date AND dates.end_date and account_id = 40) 
WHERE date >= '2010-12-13' AND date <= '2011-1-13' 
GROUP BY date ORDER BY date ASC 

另一種選擇是單獨存儲的訪問表中的日期和時間部分,在僅使用日期部分加入。

+0

謝謝,做了招。我在訪問表中添加了一個`start_date`列,並在其上添加了一個索引。下降到300ms! – 2011-01-13 20:35:37

0

我認爲它主要是由於DATE()函數慢。您可以將日期列添加到存儲整個日期的訪問,並編寫一個觸發器,以便在插入訪問或更新其日期時間時自動更新它。這將允許MySQL更好地使用連接中使用的索引。

0

這樣的事情如何:從eumiro中選擇的結果外連接?

SELECT date, v.visits as 'visits' FROM dates 
LEFT OUTER JOIN (SELECT DATE(start) as dt, count(id) as 'visits' 
FROM visits 
WHERE account_id = 40 
AND date BETWEEN '2010-12-13' AND '2011-01-13' 
GROUP BY DATE(start) 
ORDER BY 1) 
v 
ON (dates.date = v.dt) 
WHERE date >= '2010-12-13' AND date <= '2011-1-13' 

編輯:編輯SQL 編輯:另一種選擇 - 在線選擇,這樣的事情:

SELECT date, (select count(*) as 'visits' 
FROM from visits 
where date = DATE(visits.start) and account_id = 40) 
) from dates 
WHERE date >= '2010-12-13' AND date <= '2011-1-13' 
ORDER BY date ASC