dataflow

0熱度

1回答

我有一種情況，我需要將管道中的主數據流（1.5TB）連接到2個不同的數據集（4.92GB和17.35GB）。我用來爲兩者執行CoGroupByKey的關鍵是相同的。有沒有辦法避免在第一次完成後重新排列連接的左側？目前我只是將輸出作爲KV>。這似乎比在第一次連接之後分段發射每個元素要好，但第二個groupByKey似乎仍然比我預期的要長很多。我打算開始考慮拆分CoGroupByKey，看看我是否可以

1熱度

1回答

如何在LEVEL 3的表單提交中獲得LEVEL 4的select元素值？

抽象出實際的複雜代碼以使其更具可讀性。在我們Angular 2的項目，我們有這樣的組件<top-component>（LEVEL 1）： <top-component> </top-component> 它具有以下的模板：<some-form>（LEVEL 2）： <some-form> </some-form> 其中有以下模板（LEVEL 3）： <form #f="ngForm"

0熱度

1回答

春季雲數據流 - 無法從卡夫卡

轉換郵件使用Spring雲數據流的版本1.2.2具有以下配置： spring.cloud.dataflow.applicationProperties.stream.spring.cloud.stream.binders.kafka1.type=kafka spring.cloud.dataflow.applicationProperties.stream.spring.cloud.stream

0熱度

1回答

英特爾TBB計算圖：如何指定節點的輸入隊列容量

我正在尋找.NET TPL Dataflow庫的C++模擬。在TPL數據流中，您可以指定塊的容量選項的並行度&。如果該塊的輸入隊列的大小達到它的容量，則相應的塊的生成器的執行被掛起： var buffer = new BufferBlock<int>(new DataflowBlockOptions() { BoundedCapacity = 10 }); var producer = ne

0熱度

2回答

使用DataFlow作業分區表加載

我想要讀取文件，並根據文件字段中存在的日期值將其寫入BigQuery分區表。例如如果文件包含7月25日和26日的兩個日期，則DataFlow應根據文件中存在的數據將該數據寫入2個分區。 public class StarterPipeline { private static final Logger LOG = LoggerFactory.getLogger(Starter

2熱度

1回答

SSIS數據流任務和「混合」選擇

無法繼續工作。注意使用SQL Server 2000 DTS包可以很好地工作。 AXDB是外部服務器（SQL Server 2000 Enterprise），OLAP是本地數據庫，SQL Server 2008 R2標準（olap是使用select語句獲取日期以在外部SQL Server上傳遞）。添加服務器名稱不起作用。服務器鏈接，如果它很重要，可能不是。如果我只是在那裏寫日期，而不是試圖通過

-1熱度

1回答

用於在氣流上運行數據流作業的jar路徑

首先，我是氣流新手。我想要做的是使用氣流運行數據流作業。搜索了很多鏈接，發現我們需要創建一個jar文件，然後使用airflow腳本我們可以運行它。有沒有人知道這個罐子應放在哪裏，意味着谷歌雲桶或本地路徑。我們可以通過氣流直接運行模板嗎？

0熱度

2回答

SSIS不承認索引？

我在varchar列'A'上有一個非聚集索引的表。當我使用Order By A子句我可以看到它掃描索引並在幾秒鐘內給出結果。但是，當我使用排序組件列'A'，我可以看到它需要幾分鐘來排序記錄。所以我明白，它不承認我的非聚集索引沒有人有使用的SSIS指標而不是使用查詢，而不是組件的任何想法？

0熱度

1回答

airflow.exceptions.AirflowException：使用密鑰文件時應該定義作用域

問題：使用airflow運行數據流作業時，出現錯誤，是否與我們提供的關鍵路徑有關。如果是的話應該是正確的道路。錯誤： File "/usr/lib/python2.7/site-packages/airflow/models.py", line 1374, in run result = task_copy.execute(context=context) File "/usr/lib/pyt

1熱度

1回答

將Java對象轉換爲BigQuery TableRow

我正在探索Google Cloud Dataflow。我想知道如果Java對象或JSON自動轉換爲TableRow是否可以完成。就像我們可以自動分析JSON到POJO類一樣。我找不到相關信息。希望不要重複的問題。將不勝感激的任何信息！問候