如果我在HFDS或本地文件系統中有文件,是否可以在啓用了EMRFS的情況下將其複製到S3,請立即關閉羣集並確保文件可用一旦這個複製操作完成,這兩個列表和閱讀外部讀者?或者EMRFS在其啓用的特定EMR羣集內是否一致?什麼會通過EFSFS從HDFS複製文件到S3看起來像?從本地文件系統?EMRFS是否使S3與外部客戶端保持一致
回答
我在AWS開發者論壇 - https://forums.aws.amazon.com/thread.jspa?threadID=257220&tstart=25上提出了同樣的問題 - 這包含了很多有價值的細節,它提供了一個比所有EMRFS文檔結合IMO更好的EMRFS概覽,但我會提供一個崩潰摘要的崩潰摘要:
1)一致視圖是必須在EMRFS配置中明確啓用的功能,否則您只有S3一致性保證。
2)EMRFS一致的視圖只需要共享簇內效果相同的EMRFS configuration--其對外部客戶端訪問S3沒有影響正常
3)的唯一真正一致性保證S3提供的是一個新的文件以前未寫入的內容保證讀取一致,但不能列出。因此,如果客戶端特別要求通過路徑知道文件是新創建的文件,它將始終得到它,但它可能會或可能不會在列表操作中獲取文件的路徑,並且如果該文件以前存在並不能保證客戶端在讀取操作時獲得哪個版本。
EMRFS是爲由EMR hadoop作業創建的對象啓用的一致視圖。
1)EMRFS的主要目的是,由hadoop作業創建的對象是立即一致的。因此,如果存在依賴關係,這些文件可以用於下一個作業。
2)將文件複製到S3以使imediate與下一個hadoop作業保持一致的方式是,將該文件複製到hdfs,然後複製到s3 使用以下命令的命令。
- HDFS DFS -put file.txt的/用戶/ hadoop的/
- HDFS DFS -cp /user/hadoop/file.txt S3://桶名
列出s3中的文件非常昂貴,如果你希望數據在s3上立即一致,你必須在s3上實現索引。以下是使用dynamodb使文件立即一致的鏈接 https://aws.amazon.com/blogs/big-data/building-and-maintaining-an-amazon-s3-metadata-index-without-servers/?
當您使用s3 api時,s3一致性會進入畫面,因爲它不會通過EMRFS元數據。
- 1. emrfs是否支持s3 url中的自定義查詢參數?
- 2. RESTeasy客戶端是否支持TLS/SSL?
- 3. 「will_paginate」是否支持客戶端分頁?
- 4. Weblogic.Messaging.dll .NET客戶端是否支持T3S?
- 5. 是否支持ssh客戶端配置
- 6. Danga客戶端保存的Memcached條目是否與Spy客戶端兼容?
- 7. GWT客戶端外部庫
- 8. S3 Python客戶端與boto3 SDK
- 9. Citrix客戶端驅動器是否爲外部客戶端映射了一個壞主意?
- 10. 是否有可能使客戶端與HTML5的客戶端連接
- 11. 通過https的plainText密碼保存在客戶端時是否保持安全。
- 12. box.com是否支持自主客戶端或客戶端憑據授權?
- 13. 保持ServerSocket監聽客戶端
- 14. 客戶端插座保持隊列/池
- 15. 如何使用Modernizr檢測客戶端是否支持WebFonts?
- 16. AWS S3數據保護使用客戶端加密
- 17. REST客戶端HTTP多部分支持
- 18. 如何保持與Google地球客戶端的會話狀態?
- 19. 保持Android客戶端與服務器同步
- 20. 與客戶端的持久連接
- 21. 如何使用IP和端口直接與外部客戶端進行通信
- 22. 一個客戶端與另一個客戶端聊天
- 23. 富Web客戶端與瘦客戶端
- 24. Windows客戶端與Web客戶端
- 25. 此WCF客戶端代碼是否會導致內存泄漏?
- 26. 是否有可能爲Android創建一個「客戶端到客戶端」系統?
- 27. 一般如何找出客戶端是否分配了靜態Ip或是否是DHCP客戶端
- 28. 如何保持連接到一個指定的客戶端
- 29. 保持一個連接爲每個客戶端打開php
- 30. Exchange Online是否支持MAPI客戶端應用程序