2013-02-24 85 views
0

二進制文件經常附加到美國證券交易委員會文件(see example here),我正在編寫一個解析器來捕獲此文本並重新創建該文件。什麼是在這裏使用的文件編碼方法?

如果文件是Excel電子表格或PDF(下面是示例並鏈接到該示例),則無關緊要,編碼方法看起來相同。它不是Base64;我不認識它。

是嗎? TIA。

<DOCUMENT> 
<TYPE>LETTER 
<SEQUENCE>1 
<FILENAME>filename1.pdf 
<TEXT> 
<PDF> 
begin 644 filename1.pdf 
M)5!$1BTQ+C4-)>+CS],-"C,W(#`@;V)J#3P\+TQI;F5A<[email protected],2],(#$T 
M-C0S,2]/(#,[email protected],[email protected],2]4(#$T-C$R,R]((%[email protected]#8X(#$V,ET^ 
M/@UE;F1O8FH-("`@("`@("`@("`@("`@#0HT-R`P(&]B:@T\/"]$96-O9&50 
M87)M<SP\+T-O;'5M;G,@-2]0<F5D:6-T;W(@,3(^/B]&:6QT97(O1FQA=&5$ 
M96-O9&4O241;/#`T-#$S,4$Q.#`Q-D,X-#!!-S$X0S-%,T$X1D5$0S!!/CQ! 
M,31&,S%#,T(Y-T(T-#0P.3)"-#<P148U,D8W0C,X13Y=+TEN9&5X6S,W(#,R 
.... 
...<snip>... 
.... 
M``$F1B;-S0Q,#`S,"2"2-PU$,O:!2(:C0-E_QTS!;`;&H4$R/0&1C`P``08` 
M_(\&40T*96YD<W1R96%M#65N9&]B:@US=&%R='AR968-"[email protected]*)25%3T8- 
!"C\_ 
` 
end 
</PDF> 
</TEXT> 
</DOCUMENT> 

回答

1

答案竟然是老同學:UUEncoding

感謝所有誰看的問題。