2014-10-31 34 views
1

我是新來卡桑德拉分貝,我想從一個CSV文件導入到Cassandra的數據導入,我執行以下命令,導入表,第一,我創​​建使用卡桑德拉複製命令將只有部分數據

create table cdma_mkt_bte(date_value timestamp主鍵,region varchar,vendor varchar);

,然後使用

拷貝cdma_mkt_bte(DATE_VALUE,區域,供應商)複製從與HEADER = TRUE '的/ usr /共享/ DSE/bin中/ cdma_mkt_bte';

問題是在csv文件中的表有大約43,000行,而只有211行被導入到卡桑德拉,我看着211和212行,看看是否有奇怪的事情發生,似乎是好的。你能幫我麼?以及將csv導入cassandra數據庫的其他選項有哪些。

謝謝!非常感謝幫助!

+0

我得到了同樣的問題... – Robert 2014-10-31 16:18:40

回答

0

您的主鍵似乎是date_value。 cassandra中的所有插入和更新實質上都是主鍵上的插入。如果兩個記錄具有相同的主鍵,則第二個記錄將覆蓋第一個記錄。如果以唯一標識記錄的方式是DATE_VALUE +區域+供應商,那麼你的架構應該想:

create table cdma_mkt_bte (date_value timestamp, region varchar, vendor varchar, 
primary key (date_value, region, vendor)); 

這可能是你沒有得到記錄的預期數量的原因是什麼?