delimiter

    0熱度

    1回答

    我有以下文本文件佈局: 人:尤金桑多瓦爾; 26;男 記者 藝術家 人:約翰娜吉布斯; 34;女 馬戲團工人 製片 銀行職員 第一行有關於此人的一些信息,下一行是他或她以前的工作。 這是我做了類: #pragma once #include <string> #include <vector> class Person { public: Person() {};

    0熱度

    1回答

    比方說,我有一個像下面這樣的文件: 1,aaa,2016-12-01 01:02:03 EST,bbb 2,ccc,2016-12-02 04:05:06 CST,ddd 3,eee,2016-12-03 07:08:09 EST,fff 我想補充第5場,這是場3時間戳,但轉換爲UTC。 這可以調用date或Linux內的任何內容。我並不太在意性能,因爲它只是經常在少量文件上被調用一次。

    1熱度

    1回答

    我有一個分隔符分隔路徑的數組: Dim paths = New List(Of String)() From { "C:\WINDOWS\AppPatch\MUI\040C", "C:\WINDOWS\Microsoft.NET\Framework\v2.0.50727", "C:\WINDOWS\Microsoft.NET\Framework\addins\M

    0熱度

    1回答

    在我需要重新從我們的Salesforce實例記錄每週不正確的地址工作的自定義公式的Excel單元格中。我們使用報告收集格式不正確的地址並將它們導出到Excel文件。我的工作僅僅是處理文件中的數據以正確格式化,然後將它們重新插入到數據庫中。 通常的地址格式爲這樣: 5芝麻街,北京市東城,隨地 分離這些都可以很容易地通過手工完成,但我通常有數百個地址中的一個工作時間,並使用默認的Excel公式傾向於需

    0熱度

    1回答

    我被給了一個非常奇怪的格式和字段名稱和那種事情的大CSV文件。舉例來說,我們有這兩條記錄: Text18;Text30;Text5;Text6;Text7;Text27;Text14;Text9;Text11;Text19;Text12;Text13;Text24;Text32;Text4;Text34 Supervisor:;Tom Stringer;;;;;;;;;;;;;; Ethan

    1熱度

    2回答

    我想分割一個字符串到數組中。我希望單詞和元字符在數組中分開。 像這樣: $string = 'This is a string? Or an array?'; 我想: array[0] = 'This', array[1] = 'is', array[2] = 'a', array[3] = 'string', array[4] = '?', array[5] = 'Or', ar

    -1熱度

    1回答

    在文本文件中搜索並計數單詞,但無法使用分隔符忽略句號。我使用分隔符來忽略單詞後面的句號。我試圖通過使用用戶輸入創建一個文件,然後詢問他們想要在文本文件中搜索的詞,並向他們顯示文本中發生的次數。 這是我的主類 公共類主要 { public static void main(String []args) throws IOException { str s=new str();

    0熱度

    2回答

    鑑於字符串: 老師說:「你們要記住國父說的『青年要立志做大事,不要做大官』這句話。」 任務是分割基於一組定界符標點的串,即 puncts = [u'!', u'"', u'#', u'$', u'%', u'&', u"'", u'(', u')', u'*', u'+', u',', u'-', u'.', u'/', u':', u';', u'<', u'=', u'>', u'?',

    0熱度

    1回答

    我正在用spark scala讀取分隔文本文件。我正在嘗試爲分隔符之前的所有內容以及後面的所有內容創建正則表達式。目前,我已經將所有空間都修剪掉了。我正在尋找關於如何完成此項改進的任何建議。也許某種修剪功能會更簡單。 def truncateRDD(fileName : String): RDD[String] = { val rdd = sc.textFile(fileName)

    0熱度

    1回答

    我有一個用〜分隔的文本文件,我需要在轉換爲數據框之前執行一些分析。該代碼讀取文本文件爲RDD [String]做一些解析。然後,它轉換爲RDD [行]。然後用模式創建一個數據框。 所以下面是我有下面的代碼。它的工作原理,但問題是實際的模式長達400個字段。我想知道是否有比輸入屬性(1),屬性(2),屬性(3)等更簡單的方法。 我目前在Spark 1.6上。 CDH 5.2.2 示例輸入: 2016