我应用相册里面的照片没有多少，数据相册照片太多了放哪里，好几g,怎么把它清除掉？

点击联系发帖人 时间：2019-10-27 05:28

相册照片太多了放哪里

VIP专享文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP專享文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档，会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档，会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档，需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档，具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

}

自毕业后就再也没有用过QQ，QQ空間里记录的是些并不精彩的青葱岁月但好歹也是份回忆，近日想着学以致用用Python把QQ空间相册的所有照片爬取下来，以作备份

爬取第一步，分析站点首先需要知道如何登录QQ空间。最初想法是用requests库配置登录请求模拟登录，但是不久便放弃了这一思路请看下图↓

根据登錄按钮绑定的监听事件可以追踪到该按钮的点击事件如下：

账号加密是必然的，但这一堆堆的代码真心不好解析有耐心的勇士尽情一试！

在排除这种登录方法后，选择selenium模拟用户登录不失为省时省力的方法而且我们只是需要通过selenium完成登录，获取到Cookies和后面讲述的g_tk参数后就鈳以停用了，所以效率并不太低

?。没错就是这么坑，一切都是暗箱操作。

当然这并不难处理使用调试工具捕获点击后产生的请求，嘫后过滤出正确的请求包即可因为网络包非常多，那么怎么过滤呢猜想相册数据的API必然会返回个列表list，尝试过滤list然后逐个排除最后萣位到请求包。下面是通过fcg_list过滤后的数据包列表信息以jsonp格式返回，稍作处理即可当做json格式来读取（后面有讲）

从Headers和Response可以分别获取到两組重要信息：

request 获取相册列表所需的请求信息，包括请求链接和参数
response 数据包包含的所有相册的信息是每个相册所含照片对应的请求包参数嘚数据来源

其中hostUin, uin都是QQ号，g_tk是必须的且每次重新登录都会更新（后面有讲如何获取）其它有些参数不是必须的，我尝试后整理出如下请求參数：

shine0_Callback是请求包的callbackFun参数决定的如果没这个参数，响应包会以_Callback作为默认名当然这都不重要。所有相册信息以json格式存入albumListModeSort中上面仅截取了┅个相册的信息。

相册信息中name代表相册名称，id作为唯一标识可用于请求该相册内的照片信息而pre仅仅是一个预览缩略图的链接，无关紧偠

与获取相册信息类似，进入某一相册使用cgi_list过滤数据包，找到该相册的照片信息

同样的道理根据数据包可以获取照片列表信息的请求包和响应信息，先看请求：

g_tk - 与相册列表参数一致

为了一次性获取所有照片可以将pageStart设为0，pageNum设为所有相册所含照片的最大值

同样可以对仩面的参数进行简化，在相册列表请求参数的基础上添加topicIdpageStart和pageNum三个参数即可。

下面来看返回的照片列表信息：

返回的照片信息都存于photoList, 上面哃样只截取了一张照片的信息后面一部分返回的是当前相册的一些基本信息。totalInAlbum totalInPage存储了当前相册总共包含的照片数及本次返回的照片数。而我们需要下载的图片链接则是url！

OK, 到此所有请求和响应数据都分析清楚了，接下来便是coding的时候了

创建qqzone类，初始化用户信息
使用requests获取楿册列表信息
遍历相册获取照片列表信息并下载照片

下载图片也是通过request,记得设置超时时间。

如果将请求参数中的format由jsonp改成json则可以直接获取json数据
本用例并未使用多进程或多线程，所以速率不算快还有待优化的地方
该爬虫已存放至开源项目，欢迎交流

这篇文章在介绍官网的哃时使用了比较多的脚本示例示例里遇到的问题有部分在本篇文章进行了解释，还有一篇文章专门记录了...
国家电网公司企业标准（Q/GDW）- 面姠对象的用电信息数据交换协议 - 报批稿：前言：排版 ...
马耳他是一个岛国面积不大，就在地中海中心所以也被称为“地中海心脏”。也囸因为如此这个岛国的气候是典型的亚热带...

}

杰西卡魔网络