昨天我写了两篇博客,介绍:
2) 如何解析Cookies字符串、创建CookieJar对象,自动管理Cookies的添加、更新、删除
本篇顺着介绍如何在Python中使用Chrome浏览器已有的Cookies发起HTTP请求。
Chrome的Cookies文件保存路径类似于:
C:\Users\Lucas Lee\AppData\Local\Google\Chrome\User Data\Default\Cookies
其中C:\Users\Lucas Lee\AppData可通过环境变量os.environ[‘LOCALAPPDATA’]获取。
Cookies是一个Sqlite3数据库文件。
了解完上述事实,问题就非常简单了:
从数据库中查询到所需的Cookies,更新到一个CookieJar对象中。再使用这个CookieJar创建opener即可。
函数build_opener_with_chrome_cookies展示了一个基本的实现,当省略domain时,会导入所有的Cookie,建议提供domain参数。
import os import sqlite3 import cookielib import Cookie import urllib2 def build_opener_with_chrome_cookies(domain=None): cookie_file_path = os.path.join(os.environ['LOCALAPPDATA'], r'Google\Chrome\User Data\Default\Cookies') if not os.path.exists(cookie_file_path): raise Exception('Cookies file not exist!') conn = sqlite3.connect(cookie_file_path) sql = 'select host_key, name, value, path from cookies' if domain: sql += ' where host_key like "%{}%"'.format(domain) cookiejar = cookielib.CookieJar() # No cookies stored yet for row in conn.execute(sql): cookie_item = cookielib.Cookie( version=0, name=row[1], value=row[2], port=None, port_specified=None, domain=row[0], domain_specified=None, domain_initial_dot=None, path=row[3], path_specified=None, secure=None, expires=None, discard=None, comment=None, comment_url=None, rest=None, rfc2109=False, ) cookiejar.set_cookie(cookie_item) # Apply each cookie_item to cookiejar conn.close() return urllib2.build_opener(urllib2.HTTPCookieProcessor(cookiejar)) # Return opener if __name__ == '__main__': opener = build_opener_with_chrome_cookies(domain='192.168.1.253') html_doc = opener.open('http://192.168.1.253').read() import re print 'Title:', re.search('(.*?) ', html_doc, re.IGNORECASE).group(1)
测试代码中,我在Chrome浏览器登陆了无线路由器,opener打开的页面同样显示处于已登陆状态。