在做爬虫时,对方网站是json格式,于是在解析详细信息时,用到以下方法:
try:
com_name = com_names[0][u'候选人']
duration = com_names[0][u'候选人工期']
money = com_names[0][u'候选人报价']
ar_name = com_names[0][u'候选人项目经理']
except:
return None
但部分网站是没有后面‘候选人’、‘候选人工期’这些key的,例如:
有一种方法是每个都try,except,一下,如:
try:
com_name = com_names[0][u'候选人']
except:
com_name = ''
try:
duration = com_names[0][u'候选人工期']
except:
duration = ''
try:
money = com_names[0][u'候选人报价']
except:
money = ''
但那样太繁琐,有没有优雅的方法处理以下呢?
建议好好看看python的文档。
com_name = com_names[0].get(u'候选人’,’')