jQuery技术

python 爬取w3shcool的JQuery的课程并且保存到本地(2)

字号+ 作者:H5之家 来源:H5之家 2017-04-09 09:00 我要评论( )

所以我们所有的代码如下: import urllib.request from bs4 import BeautifulSoup import time def head():headers = { : } return headers def parse_url(url):hea = head()resposne =urllib.request.Request(url,

所以我们所有的代码如下:

import urllib.request from bs4 import BeautifulSoup import time def head(): headers={ : } return headers def parse_url(url): hea=head() resposne=urllib.request.Request(url,headers=hea) html=urllib.request.urlopen(resposne).read().decode() return html def url_s(): url= html=parse_url(url) soup=BeautifulSoup(html) me=soup.find_all(id=) m_url_text=[] m_url=[] for link in me: m_url_text.append(link.text) m=link.find_all() for i in m: m_url.append(i.get()) for i in m_url_text: h=i.encode().decode() m_url_text=h.split() return m_url,m_url_text def XmlRss/ target=_blank class=infotextkey>Xml(): url,url_text=url_s() url_jque=[] for link in url: url_jque.append(+link) return url_jque def xiazai(): urls=XmlRss/ target=_blank class=infotextkey>Xml() i=0 for url in urls: html=parse_url(url) soup=BeautifulSoup(html) me=soup.find_all(id=) with open(r%i,) as f: for h in me: f.write(h.text.encode()) print(i) i+=1 : xiazai() import urllib.request from bs4 import BeautifulSoup import time def head(): headers={ : } return headers def parse_url(url): hea=head() resposne=urllib.request.Request(url,headers=hea) html=urllib.request.urlopen(resposne).read().decode() return html def url_s(): url= html=parse_url(url) soup=BeautifulSoup(html) me=soup.find_all(id=) m_url_text=[] m_url=[] for link in me: m_url_text.append(link.text) m=link.find_all() for i in m: m_url.append(i.get()) for i in m_url_text: h=i.encode().decode() m_url_text=h.split() return m_url,m_url_text def Xml(): url,url_text=url_s() url_jque=[] for link in url: url_jque.append(+link) return url_jque def xiazai(): urls=xml() i=0 for url in urls: html=parse_url(url) soup=BeautifulSoup(html) me=soup.find_all(id=) with open(r%i,) as f: for h in me: f.write(h.text.encode()) print(i) i+=1 : xiazai()

 

结果

好了至此,我们的爬取工作完成,剩下的就是小修小布,大的内容我们都应该完成了。

其实python的爬虫还是很简单的,只要我们会分析网站的元素,找出所有元素的通项就可以很好的去分析和解决我们的问题

学习的道路上我们每个人都需要加油,趟更多坑,才能有利于自己的发展。

学无止境。

 

【python 爬取w3shcool的JQuery的课程并且保存到本地】的相关资料介绍到这里,希望对您有所帮助!如果您支持1jtx.com就请把教程吧添加至收藏夹哦!

或者返回【首页 > 脚本编程入门 > python脚本】查看更多相关的资料!

转载请保留本文连接地址:

 

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 逐行分析jQuery源码的奥秘

    逐行分析jQuery源码的奥秘

    2017-04-02 17:02

  • jQuery 语法

    jQuery 语法

    2017-03-26 12:02

  • nodejs HTML分析利器node

    nodejs HTML分析利器node

    2017-02-17 17:03

  • AngularJS压缩JS的操作技巧分析

    AngularJS压缩JS的操作技巧分析

    2017-02-15 15:02

网友点评
/