avro

    0熱度

    1回答

    我試圖將一些CSV文件轉換爲AVRO文件。 我寫的代碼在我測試過的很多CSV文件上運行良好,但在某些文件中,我發現AVRO文件中缺少一些數據。 以下是csv-> avro轉換中的代碼大綱。我使用C庫1.7.5 // initialize line counter lineno = 0; // make a schema first avro_schema_from_json_length

    1熱度

    1回答

    我是用Avro編寫Hadoop MapReduce的初學者,並且不清楚傳遞給map/reduce方法與String之間的區別是什麼,CharSequence還是Utf8? 如果字符串只是簡單的像「hello world」那麼該怎麼辦? 使用的CharSequence作爲輸出密鑰類型下面是例如一個簡單的地圖方法,在這種情況下: public void map(Pair<CharSequence, I

    16熱度

    2回答

    我在Spark,我有一個Avro文件的RDD。我現在想要做對RDD一些轉換,並將其保存回爲Avro的文件: val job = new Job(new Configuration()) AvroJob.setOutputKeySchema(job, getOutputSchema(inputSchema)) rdd.map(elem => (new SparkAvroKey(doTransf

    0熱度

    1回答

    我有一個avro模式,我正在將該模式的數據寫入AvroSequenceFileOutputFormat。我查看了該文件並可以確認該架構在那裏可以讀取。我調用函數 avro = load 'part-r-00000.avro' using AvroStorage(); ,它給我的錯誤消息 ERROR org.apache.pig.tools.grunt.Grunt - ERROR 2245: C

    2熱度

    1回答

    我想讀取存儲在HDFS中的Avro文件文件的數據。到目前爲止,我可以通過使用DataFileReader或DataFileStream來讀取整個數據。 現在我想實現分頁。有沒有具體的方法來做到這一點? 我已經通過他們的基本文件,並根據我的理解,我認爲這可以通過使用同步標記來完成。 我已經試過: SeekableInput seekableInput = new AvroFSInput(dataIn

    2熱度

    4回答

    一個獨立的ASP.NET MVC應用程序有沒有一種方法來創建,將在獨立的方式在Windows XP計算機上運行ASP.NET MVC應用程序的安裝(理想的XCopy安裝)版本? 我不介意爲此安裝SQL Server Express,所以我想這個問題歸結爲:Visual Studio 2008附帶的Cassini Web服務器是否可以與應用程序捆綁在一起?還有其他選擇嗎? 注意:安裝僅用於演示目的,

    1熱度

    1回答

    我是Maven的新手,一直在尋找關於如何從模式文件.avsc構建.avro的教程和Web文檔。基於apache.maven.org網站上的文檔。我必須添加以下內容 <dependency> <groupId>org.apache.avro</groupId> <artifactId>avro</artifactId> <version>1.7.5</version>

    0熱度

    1回答

    我對avro更新。我想測試avro-rpc,並使用avro-1.7.5.jar,avro-ipc-1.7.5和avro-tools-1.7.5.jar編寫一些代碼。 當我運行測試代碼,我得到下面的異常: java.lang.ClassCastException: org.apache.avro.ipc.generic.GenericRequestor cannot be cast to org.a

    2熱度

    3回答

    我使用Apache的緊縮和已得到的Avro一個神祕的錯誤消息: java.lang.NoSuchMethodError: org.apache.avro.mapred.AvroKey: method <init>()V not found at org.apache.crunch.types.avro.AvroKeyConverter.getWrapper(AvroKeyConverte

    4熱度

    1回答

    我有兩種類型的AvroRecord,都擴展avro.SpecificRecord。有沒有辦法讓一個成爲另一個Java的子類?其中之一是PersonRecord,我想成爲它的子類EmployeeRecord。我不想用avro數據填充普通Java類的原因是我正在使用hadoop,如果可能的話,我想直接使用avro文件。 爲了澄清,這是我感興趣的多態性。我希望能夠使用一個函數,作爲一個PersonRec