JSON

火车头抓取网页数据工具新增功能json提取示例

字号+ 作者:H5之家 来源:H5之家 2017-05-30 15:01 我要评论( )

使用过最新版火车采集器V9的朋友应该都发现V9新增了json提取的功能,但是许多使用抓取网页数据工具的朋友在操作此功能的时候都会觉得有点弄不明白,这里特意为大

火车头抓取网页数据工具新增功能json提取示例

作者:未知 来源: ww.zhimengzhe.com

随机为您推荐的文章:火车头采集器网址采集规则登录采集设置方法

登录信息设置: 对于部分需要登录的网站,需要设置此项。点击 点击设置 按钮,跳转到第四步其他设置——Http请求设置点击 使用浏览器获取网页登录信息 按钮,登录网址,输

 使用过最新版火车采集器V9的朋友应该都发现V9新增了json提取的功能,但是许多使用抓取网页数据工具的朋友在操作此功能的时候都会觉得有点弄不明白,这里特意为大家整理了json提取的教程示例,感兴趣的朋友可以仔细研究一下。

 

     首先大家需要明白JSON 是有两种结构,简单的说json就是javascript中的对象和数组,所以这两种结构就是对象和数组两种,通过这两种结构可以表示各种复杂的结构。下面具体说明一下。

 

1、对象:对象在js中表示为“{}”括起来的内容,数据结构为 {key:value,key:value,...}的键值对的结构,在面向对象的语言中,key为对象的属性,value为属性值,所以很容易理解,取值方法为对象key 获取属性值value,这个属性值的类型可以是数字、字符串、数组、对象几种。

 

2、数组:数组在js中是中括号“[]”括起来的内容,数据结构为["java","javascript","vb",...],取值方式和所有语言中一样,使用索引获取,字段值的类型可以是 数字、字符串、数组、对象几种。

 

  经过对象、数组2种结构就可以组合成复杂的数据结构了。如下:

{ "name": "中国", "province": [{ "name": "黑龙江", "cities": { "city": ["哈尔滨", "大庆"] } }, { "name": "广东", "cities": { "city": ["广州", "深圳", "珠海"] } }, { "name": "台湾", "cities": { "city": ["台北", "高雄"] } }, { "name": "新疆", "cities": { "city": ["乌鲁木齐"] } }] }

    我们可以借助工具 测试是否是JSON,格式化后如图:

火车头抓取网页数据工具新增功能json提取示例

  下面举例说明JSON提取的2种方式:

1、JSON数据源:URL网址

  如我们需要对JSON网址?_callback=LoadDealerPrice&type=1&seriesid=3170&city=340100 做采集

  分析得出:此URL的整个源代码是个完整的JSON。 所以JSON数据源选择 URL网址然后勾选循环匹配,就可以采集到整个JSON里的数据。

如图:

火车头抓取网页数据工具新增功能json提取示例

火车头抓取网页数据工具新增功能json提取示例

2、JSON数据源:JSON文本: 另外一种情况,网址里的源码不全是JSON,而只是一部分代码是JSON形式,此时我们需要提取出这段JSON文本,然后再格式化。例如网址

火车头抓取网页数据工具新增功能json提取示例

  所以我们需要通过多页的形式,来获取本页地址里这部分JSON代码,然后再设置JSON表达式。

火车头抓取网页数据工具新增功能json提取示例

如图:

火车头抓取网页数据工具新增功能json提取示例

  按照上面的步骤,两种JSON提取就完成了,广大用户朋友们是不是觉得简单又好用,所以抓取网页数据工具首选火车采集器V9,功能全面且易用,新手朋友们多多联系,一定能快速上手!

这些内容可能对你也有帮助

更多火车头采集器教程可查看火车头采集器教程列表页。

TAGS: json   网页数据工具

 

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 微信小程序教程五:配置app.json

    微信小程序教程五:配置app.json

    2017-05-30 16:00

  • OpenCart json_decode函数中存在远程PHP代码执行漏洞

    OpenCart json_decode函数中存在远程PHP代码执行漏洞

    2017-05-29 11:00

  • 易语言json操作例程源码

    易语言json操作例程源码

    2017-05-29 10:02

  • 编写网络数据采集免费服务器IP代理应用自学Python入门

    编写网络数据采集免费服务器IP代理应用自学Python入门

    2017-05-29 09:02

网友点评