0
我有這樣的文件解析(從報廢)與Python:解析HTML與阿賈克斯的JSON內
some HTML and JS here...
SomeValue =
{
'calendar': [
{ 's0Date': new Date(2010, 9, 12),
'values': [
{ 's1Date': new Date(2010, 9, 17), 'price': 9900 },
{ 's1Date': new Date(2010, 9, 18), 'price': 9900 },
{ 's1Date': new Date(2010, 9, 19), 'price': 9900 },
{ 's1Date': new Date(2010, 9, 20), 'price': 9900 },
{ 's1Date': new Date(2010, 9, 21), 'price': 9900 },
{ 's1Date': new Date(2010, 9, 22), 'price': 9900 },
{ 's1Date': new Date(2010, 9, 23), 'price': 9900 }]
},
'data': [{
index: 0,
serviceClass: 'Economy',
prices: [9900, 320.43, 253.27],
eTicketing: true,
segments: [{
indexSegment: 0,
stopsCount: 1,
flights: [{
index: 0,
... and a lot of nested data and again HTML and JS...
我需要分析它,並提取所有JSON數據。現在我使用正則表達式來清理所有'\ n'和'\ t'和eval()函數,將它轉換爲Python字典..我真的不喜歡這個解決方案,尤其是eval()。但是我看着BeautifulSoup和lxml,沒有找到有助於解析它的東西。
你能爲這個任務提供比正則表達式和eval()更好的東西嗎?
頁例如:http://codepaste.ru/3830/
是否在'