如下所示:
import urllib.request import sys import http.cookiejar import urllib.parse from bs4 import BeautifulSoup import codecs import re #登錄頁(yè)面 url = "http://www.abc.com/login.asp" #登錄Post數(shù)據(jù) postdata =urllib.parse.urlencode({ "username":"abc", "password":"abc" }).encode('utf-8') #構(gòu)造header header = { "Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8", "Accept-Encoding":"utf-8", "Accept-Language":"zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3", "Connection":"keep-alive", "Host":"www.abc.com", "Referer":"http://www.abc.com/login.asp", "User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64; rv:32.0) Gecko/20100101 Firefox/32.0" } req = urllib.request.Request(url,postdata,header) #獲得cookie cj = http.cookiejar.CookieJar() opener=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj)) r = opener.open(req) #繼續(xù)訪問(wèn)登陸后的頁(yè)面 get_url = 'http://www.abc.com/user/' get_request = urllib.request.Request(get_url, headers=header) get_response = opener.open(get_request) #打印獲得的頁(yè)面信息 print(get_response.read().decode("utf-8")) #用bs4可以獲得你需要的標(biāo)簽內(nèi)容 soup = BeautifulSoup(get_response.read(),"html.parser") jie = soup.find_all('span') #這里利用正則表達(dá)式過(guò)濾掉html語(yǔ)言 dr = re.compile(r'<[^>]+>',re.S) #這里jie[2]表示取符合條件的第三個(gè)標(biāo)簽 dd = dr.sub('',str(jie[2])) print(dd)
網(wǎng)站題目:Python3Post登錄并且保存cookie登錄其他頁(yè)面的方法-創(chuàng)新互聯(lián)
本文鏈接:http://m.newbst.com/article6/cejiog.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站改版、服務(wù)器托管、營(yíng)銷型網(wǎng)站建設(shè)、App開(kāi)發(fā)、品牌網(wǎng)站建設(shè)、云服務(wù)器
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容