利用爬虫代码美女写真套图下载转PDF保存
发布时间:2025-11-08 07:43:36 作者:玩站小弟
我要评论
24小时点赞自助服务利用爬虫代码美女写真套图下载转PDF保存爬的不是全站链接,该爬虫爬的是每套图的链接,相当于是详情页的链接需要单独下载的python库requestsfake_useragentxpathPIL下面有图片 打码是为了过审,这网站真的是正经的写
。
爬的利用不是全站链接,该爬虫爬的爬虫抖音粉丝业务套餐0.1-1000万粉丝是每套图的链接,相当于是代码快手点赞自助平台有哪些详情页的链接
需要单独下载的python库
requests
fake_useragent
xpath
PIL
下面有图片 打码是为了过审,这网站真的美女快手点赞24小时在线超低价机器是正经的写真网站不是什么老司机网站
import requests from fake_useragent import UserAgent from lxml import etree import os import aiohttp import asyncio from PIL import Image import shutil #获取详情页全部图片函数 async def get_xq(url): #计数 p=0 tasks = [] res = requests.get(url=url,headers=header) res.encoding="utf-8" res.close() tree = etree.HTML(res.text) #图片标题 imgtitle = tree.xpath(//title/text())[0] global title title = imgtitle #第一页的图片链接 img = tree.xpath(//article//img/@src) imgurl = ["https://www.xgyw01.co" + i for i in img] print("当前下载的套图标题:\n"+imgtitle) for i in imgurl: p += 1 tasks.append(down(i,imgtitle,p)) #获取下一页的链接 next = "https://www.xgyw01.co" + tree.xpath(//div[@class="pagination"][1]//a[last()]/@href)[0] #判断的条件 bool = tree.xpath(//div[@class="pagination"][1]//a[last()]/text())[0] #循环获取所有页 while True: print("正在获取"+next) if bool == "下一页" or bool == "下页": res = requests.get(url=next, headers=header) res.encoding = "utf-8" res.close() tree = etree.HTML(res.text) img = tree.xpath(//article//img/@src) imgurl = ["https://www.xgyw01.co" + i for i in img] for i in imgurl: p += 1 tasks.append(down(i,imgtitle,p)) #判断的条件 bool = tree.xpath(//div[@class="pagination"][1]//a[last()]/text())[0] if bool == "下一页" or 本尊科技bool == "下页": next = "https://www.xgyw01.co" + tree.xpath(//div[@class="pagination"][1]//a[last()]/@href)[0] continue else: break else: break print("开始异步下载图片.....") await asyncio.wait(tasks) #下载函数 async def down(url,filename,fn): filepath = os.path.join(dirdz,filename) if not os.path.exists(filepath): os.mkdir(filepath) async with aiohttp.ClientSession() as session: async with session.get(url) as res: with open(filepath+"/"+str(fn)+".jpg",mode="wb") as f: f.write(await res.content.read()) print(f"第{fn}张下载完成") #写真图片转PDF函数 def jpg_pdf(filename): # 定义文件夹路径和PDF文件名 folder_path = os.path.join(dirdz,filename) pdf_filename = os.path.join(dirdz,filename + ".pdf") # # 将JPEG文件转换为Pillow Image对象并添加到列表中 image_files = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith(.jpeg) or f.endswith(.jpg)] image_list = [] for file_path in image_files: img = Image.open(os.path.abspath(file_path)) image_list.append(img) # 找到所有JPEG文件 image_list[0].save(pdf_filename, "PDF" ,resolution=100.0, save_all=True, append_images=image_list[1:]) print("pdf合并完成,删除缓存的的图片") shutil.rmtree(folder_path) print("清理完成") #主函数 if __name__ == __main__: #定义的公共请求头 header = {"user-agent": UserAgent().random} #定义的保存路径(文件夹路径) dirdz = "这里输入保存的文件夹路径" #定义一个全局的标题保存文件名字 title = "" #爬取的网站是:https://www.xgyw01.co/,找到想下的写真下载快手点赞10000赞套图直接点进去复制详情页的链接就行了 url = input("请输入套图详情页链接:") #使用异常捕获排除异常 try: #因为是异步函数所以需要用asyncio.run启动 asyncio.run(get_xq(url)) print(title) except: print("链接详情页解析错误.........") print("全部下载完成,开始生成pdf.......") #调用图片转PDF函数 jpg_pdf(title)

相关文章
源码介绍MikuTools是一个使用Vue全家桶和Nuxt.js构建的工具类网站。它提供了许多有用的工具,例如文本加密、图片处理、常用数据转换等等二改或者新增功能的话,可以参考/pages/*.vue2025-11-08
网速管家极速版是一款测速软件,在这款软件中拥有着非常强大的工具库,能够帮助用户改善网络环境,更大程度上发挥网络的效果,对网络效果进行提升和优化,让你的上网速度更加高速。网速管家极速版提供了更加专业的测2025-11-08
无线传媒获得发明专利授权:“视频推荐方法、装置、终端及存储介质”
证券之星消息,根据天眼查APP数据显示无线传媒301551)新获得一项发明专利授权,专利名为“视频推荐方法、装置、终端及存储介质”,专利申请号为CN202311410405.8,授权日为2025年9月2025-11-08
豌豆荚下载官方版是一款知名的应用下载软件,这里包含了大量的游戏与软件,都可以免费下载,安装包绿色安全,可以放心使用,并且资源会不断的更新与增加,为用户带来一站式的优质服务,你想玩想用的软件都可以在这里2025-11-08
源码简介短视频去水印小帮手微信小程序源码带后台,短视频去水印系列教程服务端源码。php版这里不过多介绍,我假设您有基本的编码基础,并熟悉php语言及laravel框架。搭建教程请先确保 compose2025-11-08
蓝熊影评是一款影评类型的软件,在这款软件中,用户可以查看非常多的近期大片热点讯息,这里包含了对于时下最流行电影电视剧的深度解析,无论你喜欢什么样的影视剧,这里都能够进行提供。与此同时,蓝熊影评还提供了2025-11-08

最新评论