网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
05月09日漏签0天
python吧 关注:473,919贴子:1,966,058
  • 看贴

  • 图片

  • 吧主推荐

  • 视频

  • 游戏

  • 5回复贴,共1页
<<返回python吧
>0< 加载中...

【求助】手机Qpython爬豆瓣电影

  • 取消只看楼主
  • 收藏

  • 回复
  • 新英格兰
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
一楼给大佬


  • 新英格兰
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
通过百度AI勉勉强强搞出一段代码,下面是测试用的。我在windows的python上面可以跑出结果,但是在安卓手机Qpython上面就爬不出任何东西。手机上各种库都有了,运行没有报错。
【求助】
import requests
from datetime import datetime, timedelta
from lxml import etree
import re
from android import Android
# 初始化 Android 对象
#Android = Android()
# 设置请求头
Header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'}
current_year = datetime.now().year
Url = 'https://movie.douban.com/cinema/later/shanghai/'
Reqs = requests.get(url=Url, headers=Header)
text = Reqs.text
# 获取正在上映的的list
A_Html = etree.HTML(text)
Title = A_Html.xpath('//*[@id="showing-soon"]//*[@class="intro"]/h3/a[1]/text()')
Date = A_Html.xpath('//*[@id="showing-soon"]//*[@class="intro"]/ul/li[1]/text()')
#获取字段
i = 0
while i < len(Title) :
Date[i]=Date[i].replace("月","-").replace("日"," ")
Start_date=f"{current_year}-"+Date[i]+"09:00"
End_date=f"{current_year}-"+Date[i]+"10:00"
# 调用addCalendarEvent方法添加事件
#Android.addCalendarEvent(Title[i], Start_date, End_date, "")
#检查字段
print(Title[i],Start_date,End_date,i)
i = i + 1


成都苍瀚科技有限公司
Pytnom,环境搭建,一次长期使用;全系列版本都有,致力用户高效开发,支持远程协助,支持重置,使用便捷放心。
2025-05-09 13:13广告
立即查看
广告
立即查看
  • 新英格兰
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼


  • 新英格兰
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
关于爬取失败,我找到原因了。是while函数下必须都缩进一格。现在的困难是calendarevent写不进去,爬取都成功了。


  • 新英格兰
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
好吧,addcalendarevent又是个大坑。。


  • 新英格兰
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
经过几天的研究,目前最实际的解决方案是在安卓上每个月手动跑一次qpython,爬数据,保存在一个ics里面,然后手动导入日历。代码如下
import requests
from datetime import datetime
from lxml import etree
import re
from ics import Calendar, Event
#爬取电影信息
Header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'}
current_year = datetime.now().year
Url = 'https://movie.douban.com/cinema/later/shanghai/'
Reqs = requests.get(url=Url, headers=Header)
text = Reqs.text
A_Html = etree.HTML(text)
Title = A_Html.xpath('//*[@id="showing-soon"]//*[@class="intro"]/h3/a[1]/text()')
Date = A_Html.xpath('//*[@id="showing-soon"]//*[@class="intro"]/ul/li[1]/text()')
Des = A_Html.xpath('//*[@id="showing-soon"]//*[@class="intro"]/ul/li[2]/text()')
#写入ics文件
cal=Calendar()
event=Event()
i = 0
while i < len(Title) :
MMDD=Date[i].replace("月","-").replace("日"," ")
Start_datetime_string=f"{current_year}-"+MMDD+"01:00:00"
Start_datetime=datetime.strptime(Start_datetime_string,"%Y-%m-%d %H:%M:%S")
event = Event(
begin=Start_datetime,
name=f"{Title[i]} {Des[i]}")
cal.events.add(event)
print(Date[i],Title[i],Des[i])
i = i + 1
#存入ics
output_path_str="/storage/emulated/0/Download/icstest"+datetime.now().strftime("%Y%m%d%H%M%S")+".ics"
with open(output_path_str,'w') as f:
f.writelines(cal.serialize_iter())


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 5回复贴,共1页
<<返回python吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示