presto

1熱度

3回答

我們有在S3上存儲數據的流式應用程序。 S3分區可能有重複的記錄。我們通過Athena查詢S3中的數據。有沒有一種方法可以從S3文件中刪除重複項，以便我們在從雅典娜查詢時不會得到它們？

0熱度

1回答

我們可以使用Presto來查詢Oracle Spatial和Graph with PGQL嗎？

我們將使用Oracle Big Data Spatial和Graph。我們需要使用PGQL查詢我們的分佈式圖。（使用PGX的默認/給定算法對我們來說是不夠的。）該圖將在下面使用HBase。問題是，PGQL只適用於CDH羣集的單個節點。您可以一次查詢單個節點，但不能使用羣集的整個內存。我們需要一種方法來查詢所有節點，然後彙總（組合）來自節點的結果並將其提供給用戶。 Presto可以幫助我們解決這

1熱度

2回答

AWS EMR Presto使用AWS膠水找不到正確的Hive模式

所以我遇到了能夠通過AWS EMR執行Presto查詢的問題。我已經啓動了運行配置單元/ presto並使用AWS Glue作爲Metastore的EMR。當我進入主節點並運行配置單元的SSH時，我可以運行「show schemas;」它向我展示了我們在AWS Glue上的3個不同的數據庫。如果我再進入普雷斯托CLI及運行「上蜂巢節目模式」我只看到兩個「默認」和「INFORMATION_SC

0熱度

2回答

如何將微分轉換爲美元而不丟失小數精度？

我有一列存儲「小額支付」中的交易金額例如， 127740000小數點對應127.74 USD 我不知道如何得到寫一個查詢返回127.74對我來說。如果我做。 SELECT microcents/1000000 截斷它返回到127，我失去了仙

0熱度

1回答

如何配置Presto

我已經在我的羣集上安裝了presto以執行一些查詢。我有4個節點和16GB的RAM。我已經按照步驟來配置presto，但是當我運行一個查詢時，它會比永遠相同的查詢花費更多的時間。所以我想我的配置有問題。我想也許我在我的node.properties文件屬性中的錯誤值 query.max-memory和query.max-memory-per-node。考慮到每個節點有16GB內存，這些屬性的正確

0熱度

1回答

使用REGEXP函數來插入大寫字母和它前面

什麼是正確的regexp語法產生期望的結果小寫字母之間的下劃線？謝謝！表1是這樣的： user_id city_state 123 MiamiFlorida 234 PhiladelphiaPennsylvania 345 ClevelandOhio 我想它看起來就像這樣： user_id city_state 123 Miami_Florida 234 P

-1熱度

2回答

更新配置單元列名稱

我有一個關於Hive DB的快速問題。如果我有一個表，可以說我通過「CREATE EXTERNAL TABLE TEMP」創建了一個表，並且具有一定的位置 - 並且我想更改列名（只有名稱 - 不是類型）。如果我將使用不同的列名運行相同的CREATE命令 - 會發生什麼？表列將自行更新？我會得到「表已存在」的錯誤？我在問這個問題，因爲我有列名存儲在一個數據庫中，我想做一個自動過程 - 所以我不想

-1熱度

1回答

基於時間的目錄結構Apache的鑽

我有日期和時間組織CSV文件如下 logs/YYYY/MM/DD/CSV files... 我有安裝的Apache鑽取到這些CSV文件之上執行SQL查詢。由於有許多CSV文件，可以利用文件的組織來優化性能。例如， SELECT * from data where trans>='20170101' AND trans<'20170102'; 在此SQL中，目錄logs/2017/01/01

0熱度

2回答

我如何逃避Presto中的單引號？

如何在Presto中跳出'（單引號）？這是我想用它 select count(*) as count from uploads where title not in ('Driver's License') 我已經試過通常逃逸：，'Driver\'s License'，"Driver's License"，E'Driver\'s License'但似乎沒有任何工作。 Presto的文檔含糊不清。

0熱度

1回答

當我啓動Apache Presto服務器使用$ bin/launcher運行我得到錯誤

無法識別的VM選項'G1HeapRegionSize = 32M'您的意思是'G1HeapRegionSize ='？錯誤：無法創建Java虛擬機。錯誤：發生致命異常。程序將會退出。