2010-08-26 46 views
0

我有這樣的文件解析(從報廢)與Python:解析HTML與阿賈克斯的JSON內

some HTML and JS here... 
SomeValue = 
{ 
    'calendar': [ 
    {  's0Date': new Date(2010, 9, 12), 
      'values': [ 
        { 's1Date': new Date(2010, 9, 17), 'price': 9900 }, 
        { 's1Date': new Date(2010, 9, 18), 'price': 9900 }, 
        { 's1Date': new Date(2010, 9, 19), 'price': 9900 }, 
        { 's1Date': new Date(2010, 9, 20), 'price': 9900 }, 
        { 's1Date': new Date(2010, 9, 21), 'price': 9900 }, 
        { 's1Date': new Date(2010, 9, 22), 'price': 9900 }, 
        { 's1Date': new Date(2010, 9, 23), 'price': 9900 }] 
    }, 
    'data': [{ 
    index: 0, 
    serviceClass: 'Economy', 
    prices: [9900, 320.43, 253.27], 
    eTicketing: true, 
    segments: [{ 
      indexSegment: 0, 
      stopsCount: 1, 
      flights: [{ 
        index: 0, 

... and a lot of nested data and again HTML and JS... 

我需要分析它,並提取所有JSON數據。現在我使用正則表達式來清理所有'\ n'和'\ t'和eval()函數,將它轉換爲Python字典..我真的不喜歡這個解決方案,尤其是eval()。但是我看着BeautifulSoup和lxml,沒有找到有助於解析它的東西。
你能爲這個任務提供比正則表達式和eval()更好的東西嗎?
頁例如:http://codepaste.ru/3830/

+0

是否在'