https://changelog.com/practicalai网站有很多关于AI的英文播客,都是mp3文件。一页好几十个mp3,怎么自动批量下载呢?

右击,点击inspect,查看要下载mp3文件和标题对应的源代码:
首先,搞清楚所有mp3文件的结构,都是放在article元素里面:
文件标题放在h2里面:
Creating instruction tuned models
Mp3文件放在a元素里面:
Play
然后就可以写Python编程的提示词了,然后让GP4来生成代码:
网站https://changelog.com/practicalai上有很多class="news\_item js-track-news" 的article元素,如下:
article元素里面有class="news_item-title"的h2元素,h2元素里面有a元素,a元素有href值,是一个mp3文件的标题,如下:
Creating instruction tuned models
article元素里面还有 class="news_item-toolbar" 的div元素,里面有class="news_item-toolbar-play_button" 的a元素,a元素有href值,是一个mp3文件的URL地址。
写一段Python程序,实现批量下载网页中所有mp3的功能,具体步骤如下:
打开网站https://changelog.com/practicalai,解析源代码;
定位article元素,然后定位其中class="news_item-title"的h2元素,然后提取h2元素里面a元素的href值,作为mp3文件的标题;
定位article元素里 class="news_item-toolbar" 的div元素,提取a元素中的href值,作为MP3文件下载链接;
下载所有mp3文件,保存到本地电脑d盘的mp3文件夹;
第一次运行,出错,错误信息如下:
复制这些错误信息丢给ChatGPT,让它修正错误
再次运行,还是出错
找不到mp3文件链接,检查了下代码,原来是我自己的错,把Div元素的class值写错了,改正
然后运行。前面一些mp3文件成功下载,但是有一个不行,卡在这里了:
问了ChatGPT,说这个错误是由于文件名中的特殊字符(如斜杠)导致的。需要对文件名进行清理以确保它们不包含任何无法在文件系统中使用的特殊字符。然后ChatGPT又修改代码
Ok,这次成功了,很快全部mp3都下载完成,并且根据名称自动命名了。
一共60个和AI相关的播客,已经放在知识星球“AIGC部落”中,感兴趣的可以加入下载。
扫描即可加入AIGC部落