钱袋子往哪走?教你用Python爬取基金数据

年关将至,钱袋子往哪走?

有人买了定期存款,3年,年利率:3.987。

picture.image

按存50w计算

0.0385 50 万, 3 年息: 6 万,月息: 1666.72 元

0.039785 50 万, 3 年息: 6.21 万,月息: 1724.53 元

0.04125 50 万, 3 年息: 6.45 万,月息: 1790.62 元

picture.image

picture.image

还有推荐买基金,

进入支付宝页面,

随机选了一个基金看看,那么:

从未买过基金的我,应该买它吗?

picture.image

带着疑问,开始准备爬基金的数据

python 爬基金数据 流程图

第一步:选择网站:天天基金网

第二步:确认网址:https://fund.eastmoney.com/

第三步:提取相关数据对应的网址:

→打开chrome的开发者调试,选择Network,然后刷新一下,很快我们就能发现这是基金代码加当前时间的一个接口请求的url:

picture.image

http://fund.eastmoney.com/pingzhongdata/005352.js?v=20210105201244

↓ 转换格式后

http://fund.eastmoney.com/pingzhongdata/基金代码.js?v=当前时间

python 爬基金数据 流程图

第四步:上代码,爬取净值,测试,看与网站数据是否一致。

picture.image

PS : 代码如上

picture.image

可以看到,最近一天的净值是2.1403,

picture.image

从网站上我们也可以验证一下,这个数据正确。

picture.image

picture.image

python 爬基金数据 流程图

第五步:画个图,看下走势。

picture.image

从网站上,再验证一下图形是否正确。

picture.image

picture.image

两图比较后,OK

不过这个方法获取的数据有个小问题,就是无法获得对应的确切日期。我们如果分析最近几个周、几个月的数据,其实也可以不需要了解具体某一天的数据,取最近20天、40天等方式即可。当然,也可以从当天开始逆推回去,给每个净值标上日期,不过这个需要忽略节假日,处理起来比较麻烦且必要性不大,就没有做这个处理。

python 爬基金数据 流程图

第五步:获取所有基金数据

http://fund.eastmoney.com/js/fundcode\_search.js’

可以直接获取到所有的基金代码,再通过基金代码可以遍历爬取所有基金的数据,将下载的数据存成了csv,方便excel打开或用代码读取。

picture.image

picture.image

代码运行后

picture.image

picture.image

picture.image

picture.image

picture.image

更多阅读

2020 年最佳流行 Python 库 Top 10

2020 Python中文社区热门文章 Top 10

Top 10 沙雕又有趣的 GitHub 程序

特别推荐

picture.image

picture.image

点击下方阅读原文加入 社区会员

0
0
0
0
评论
未登录
暂无评论