如何用 Matplotlib 画一张好看的图

技术

picture.image

本文用的数据如图所示,Dataframe中显示的是相关职位对应的地区和相应的薪水状况,单位是千,要统计 各个城市的薪资状况

picture.image

最终目的是用 Matplotlib 结合 Seaborn 得到这种可视化效果

picture.image

首先,导入要用到的包,由于需要在图中显示中文字,还需要进行一些字体的设置。


              
import matplotlib.pyplot as plt
              
import seaborn as sns
              
%matplotlib inline
              

              
# 设置中文字体为微软雅黑
              
plt.rcParams['font.sans-serif'] = 'SimHei'
          

先用Seaborn生成一张基础的柱状图,并给图加上标题,之后围绕这张图进行进一步的修改。


              
fig,ax = plt.subplots(figsize=(9,6))
              
sns.barplot(x='city',y='salary',data=df,ci=95,ax=ax)
              
ax.set_title('各城市薪资水平对比')
          

picture.image

可以比较明显看出 横纵坐标的刻度标签的字体有点小 ,同时 刻度线显示起来不好看 ,所以第一步把 刻度标签的字体放大去掉刻度线

由于刻度的设置是tick的属性,所以用ax.tick_param()进行设置,用参数labelsize指定刻度标签的大小,将length参数设置刻度线长短。


              
fig,ax = plt.subplots(figsize=(9,6))
              
sns.barplot(x='city',y='salary',data=df,ci=95,ax=ax)
              
ax.set_title('各城市薪资水平对比')
              

              
# 字体为16px大小,刻度线长度为0
              
ax.tick_params(labelsize=16,length=0)
          

picture.image

第二步,去掉四边的边框(真的不好看),这里有两种实现方式。

第一种是用上篇文章说过的ax.spines['xx'].set_visible(False)分别对topbottoomleftright进行设置。

第二种方式,由于这里只有一个Axes且四个边框都去掉,所以也可以直接使用plt.box(False)


              
fig,ax = plt.subplots(figsize=(9,6))
              
sns.barplot(x='city',y='salary',data=df,ci=95,ax=ax)
              
ax.set_title('各城市薪资水平对比')
              

              
# 字体为16px大小,刻度线长度为0
              
ax.tick_params(labelsize=16,length=0)
              

              
#法一:
              
ax.spines['left'].set_visible(False)
              
ax.spines['top'].set_visible(False)
              
ax.spines['right'].set_visible(False)
              
ax.spines['bottom'].set_visible(False)
              

              
#法二
              
plt.box(False)
          

picture.image

接下来,为了使条形图呈从小到大渐变的效果,可以 指定各个城市的排列顺序 ,并 设置相应的颜色映射

对各个城市的薪水求均值并从小到大排序,获取城市排序列表city_order


              
city_order = df.groupby("city")["salary"].mean()\
              
               .sort_values()\
              
               .index.tolist()
          

然后用Seaborn中的orderpalette分别设置 排列顺序颜色。


              
fig,ax = plt.subplots(figsize=(9,6))
              
sns.barplot(x='city',y='salary',data=df,ci=95,ax=ax,
              
           order = city_order,palette = "RdBu_r")
              
ax.set_title('各城市薪资水平对比')
              

              
# 字体为16px大小,刻度线长度为0
              
ax.tick_params(labelsize=16,length=0)
              
plt.box(False)
          

picture.image

紧接着在y轴上添加网格线便于观察每个柱子的数值大小,因为是在y轴上,网格线为grid,所以用ax.yaxis.grid()进行设置


              
fig,ax = plt.subplots(figsize=(9,6))
              
sns.barplot(x='city',y='salary',data=df,ci=95,ax=ax,
              
           order = city_order,palette = "RdBu_r")
              
ax.set_title('各城市薪资水平对比')
              

              
# 字体为16px大小,刻度线长度为0
              
ax.tick_params(labelsize=16,length=0)
              
plt.box(False)
              

              
# 设置y轴网格线
              
ax.yaxis.grid(linewidth=0.5,color='black')
              
# 将网格线置于底层
              
ax.set_axisbelow(True)
          

picture.image

由于x轴和y轴含义比较清晰,所以可以将横纵坐标的标签去掉,同时,为了更直观,可以将y轴的刻度标签由20,15...换成20k,15k...

这个过程分别用到ax.set_xlabel(),ax.set_ylabel()ax.set_yticklabels()


              
fig,ax = plt.subplots(figsize=(9,6))
              
sns.barplot(x='city',y='salary',data=df,ci=95,ax=ax,
              
           order = city_order,palette = "RdBu_r")
              
ax.set_title('各城市薪资水平对比')
              

              
# 字体为16px大小,刻度线长度为0
              
ax.tick_params(labelsize=16,length=0)
              
plt.box(False)
              

              
# 设置y轴网格线
              
ax.yaxis.grid(linewidth=0.5,color='black')
              
# 将网格线置于底层,
              
ax.set_axisbelow(True)
              

              
ax.set_xlabel('')
              
ax.set_ylabel('')
              
# 将0处设为空字符串,其他地方加上k
              
ax.set_yticklabels([" ","5k","10k","15k","20k"])
          

picture.image

最后对标题进行设置,让标题更加好看,这一步主要是对ax.set_title()中的参数进行调整,主要包括

  • backgroundcolor:控制背景颜色
  • fontsize:控制字体大小
  • weight:控制字体粗细
  • color:控制字体颜色

              
fig,ax = plt.subplots(figsize=(9,6))
              

              
sns.barplot(x='city',y='salary',data=df,ci=95,ax=ax,
              
           order = city_order,palette = "RdBu_r")
              

              
# 字体为16px大小,刻度线长度为0
              
ax.tick_params(labelsize=16,length=0)
              
plt.box(False)
              

              
# 设置y轴网格线
              
ax.yaxis.grid(linewidth=0.5,color='black')
              
# 将网格线置于底层,
              
ax.set_axisbelow(True)
              

              
ax.set_xlabel('')
              
ax.set_ylabel('')
              
# 将0处设为空字符串,其他地方加上k
              
ax.set_yticklabels([" ","5k","10k","15k","20k"])
              

              
ax.set_title('               各城市薪资水平对比             ',backgroundcolor='#3c7f99',
              
            fontsize=24, weight='bold',color='white')
          

picture.image

我讲的比较细,所以可能会让大家觉得画起来挺复杂的,其实数数最后的代码也就10行代码,只是细节的地方比较多。如果把之前两篇相关文章看懂了,相信这篇理解起来难度并不大。

好了,从此之后你用Matplotlib画出来的图就是和别人不一样!

picture.image

推荐阅读:

一文读懂高并发情况下的常见缓存问题

用 Django 开发基于以太坊智能合约的 DApp

一文读懂 Python 分布式任务队列 celery

5 分钟解读 Python 中的链式调用

用 Python 创建一个比特币价格预警应用

picture.image

▼点击 成为社区会员 喜欢就点个 在看吧 picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动客户端性能优化最佳实践
在用户日益增长、需求不断迭代的背景下,如何保证 APP 发布的稳定性和用户良好的使用体验?本次分享将结合字节跳动内部应用的实践案例,介绍应用性能优化的更多方向,以及 APM 团队对应用性能监控建设的探索和思考。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论