presto

    1熱度

    3回答

    我們有在S3上存儲數據的流式應用程序。 S3分區可能有重複的記錄。我們通過Athena查詢S3中的數據。 有沒有一種方法可以從S3文件中刪除重複項,以便我們在從雅典娜查詢時不會得到它們?

    0熱度

    1回答

    我們將使用Oracle Big Data Spatial和Graph。我們需要使用PGQL查詢我們的分佈式圖。 (使用PGX的默認/給定算法對我們來說是不夠的。)該圖將在下面使用HBase。 問題是,PGQL只適用於CDH羣集的單個節點。您可以一次查詢單個節點,但不能使用羣集的整個內存。我們需要一種方法來查詢所有節點,然後彙總(組合)來自節點的結果並將其提供給用戶。 Presto可以幫助我們解決這

    1熱度

    2回答

    所以我遇到了能夠通過AWS EMR執行Presto查詢的問題。 我已經啓動了運行配置單元/ presto並使用AWS Glue作爲Metastore的EMR。 當我進入主節點並運行配置單元的SSH時,我可以運行「show schemas;」它向我展示了我們在AWS Glue上的3個不同的數據庫。 如果我再進入普雷斯托CLI及運行「上蜂巢節目模式」我只看到兩個「默認」和「INFORMATION_SC

    0熱度

    2回答

    我有一列存儲「小額支付」中的交易金額 例如, 127740000小數點對應127.74 USD 我不知道如何得到寫一個查詢返回127.74對我來說。如果我做。 SELECT microcents/1000000 截斷它返回到127,我失去了仙

    0熱度

    1回答

    我已經在我的羣集上安裝了presto以執行一些查詢。我有4個節點和16GB的RAM。我已經按照步驟來配置presto,但是當我運行一個查詢時,它會比永遠相同的查詢花費更多的時間。所以我想我的配置有問題。 我想也許我在我的node.properties文件屬性中的錯誤值 query.max-memory和query.max-memory-per-node。考慮到每個節點有16GB內存,這些屬性的正確

    0熱度

    1回答

    什麼是正確的regexp語法產生期望的結果小寫字母之間的下劃線?謝謝! 表1是這樣的: user_id city_state 123 MiamiFlorida 234 PhiladelphiaPennsylvania 345 ClevelandOhio 我想它看起來就像這樣: user_id city_state 123 Miami_Florida 234 P

    -1熱度

    2回答

    我有一個關於Hive DB的快速問題。 如果我有一個表,可以說我通過「CREATE EXTERNAL TABLE TEMP」創建了一個表,並且具有一定的位置 - 並且我想更改列名(只有名稱 - 不是類型)。如果我將使用不同的列名運行相同的CREATE命令 - 會發生什麼?表列將自行更新?我會得到「表已存在」的錯誤? 我在問這個問題,因爲我有列名存儲在一個數據庫中,我想做一個自動過程 - 所以我不想

    -1熱度

    1回答

    我有日期和時間組織CSV文件如下 logs/YYYY/MM/DD/CSV files... 我有安裝的Apache鑽取到這些CSV文件之上執行SQL查詢。由於有許多CSV文件,可以利用文件的組織來優化性能。例如, SELECT * from data where trans>='20170101' AND trans<'20170102'; 在此SQL中,目錄logs/2017/01/01

    0熱度

    2回答

    如何在Presto中跳出'(單引號)? 這是我想用它 select count(*) as count from uploads where title not in ('Driver's License') 我已經試過通常逃逸:,'Driver\'s License',"Driver's License",E'Driver\'s License'但似乎沒有任何工作。 Presto的文檔含糊不清。

    0熱度

    1回答

    無法識別的VM選項'G1HeapRegionSize = 32M'您的意思是'G1HeapRegionSize ='?錯誤:無法創建Java虛擬機。錯誤:發生致命異常。程序將會退出。