常用的清理 Kubernetes 集群资源命令

容器混合云MySQL

长时间运行的集群,常会面临各种资源耗尽的问题,另外磁盘不足时 Kubelet 还会主动清理镜像增加不确定因素,本文提供了一些命令片段用于清理工作。

  1. Kubernetes 基础对象清理

  • 清理 Evicted 状态的 Pod

        
          
kubectl get pods --all-namespaces -o wide | grep Evicted | awk '{print $1,$2}' | xargs -L1 kubectl delete pod -n  

      
  • 清理 Error 状态的 Pod

        
          
kubectl get pods --all-namespaces -o wide | grep Error | awk '{print $1,$2}' | xargs -L1 kubectl delete pod -n  

      
  • 清理 Completed 状态的 Pod

        
          
kubectl get pods --all-namespaces -o wide | grep Completed | awk '{print $1,$2}' | xargs -L1 kubectl delete pod -n  

      
  • 清理没有被使用的 PV

        
          
kubectl describe -A pvc | grep -E "^Name:.*$|^Namespace:.*$|^Used By:.*$" | grep -B 2 "<none>" | grep -E "^Name:.*$|^Namespace:.*$" | cut -f2 -d: | paste -d " " - - | xargs -n2 bash -c 'kubectl -n ${1} delete pvc ${0}'  

      
  • 清理没有被绑定的 PVC

        
          
kubectl get pvc --all-namespaces | tail -n +2 | grep -v Bound | awk '{print $1,$2}' | xargs -L1 kubectl delete pvc -n  

      
  • 清理没有被绑定的 PV

        
          
kubectl get pv | tail -n +2 | grep -v Bound | awk '{print $1}' | xargs -L1 kubectl delete pv  

      
  1. Linux 清理

  • 查看磁盘全部空间

        
          
df -hl /  
  
Filesystem      Size  Used Avail Use% Mounted on  
/dev/sda2       100G   47G   54G  47% /  

      
  • 查看指定目录占用

        
          
du -sh .  
  
24G .  

      
  • 删除指定前缀的文件夹

        
          
cd /nfsdata  
ls | grep archived- |xargs -L1 rm -r  

      
  • 清理僵尸进程

        
          
ps -A -ostat,ppid | grep -e '^[Zz]' | awk '{print }' | xargs kill -HUP > /dev/null 2>&1  

      
  1. Docker 清理

  • 查看磁盘使用情况

        
          
docker system df  
  
TYPE                TOTAL               ACTIVE              SIZE                RECLAIMABLE  
Images              361                 23                  178.5GB             173.8GB (97%)  
Containers          29                  9                   6.682GB             6.212GB (92%)  
Local Volumes       4                   0                   3.139MB             3.139MB (100%)  
Build Cache         0                   0                   0B                  0B  

      
  • 清理 none 镜像

        
          
docker images | grep none | awk '{print $3}' | xargs docker rmi  

      
  • 清理不再使用的数据卷

        
          
docker volume rm $(docker volume ls -q)  

      

或者


        
          
docker volume prune  

      
  • 清理缓存

        
          
docker builder prune  

      
  • 全面清理

删除关闭的容器、无用的存储卷、无用的网络、dangling 镜像(无 tag 镜像)


        
          
docker system prune -f  

      
  • 清理正则匹配上的镜像

这里清理的是 master-8bcf8d7-20211206-111155163 格式的镜像。


        
          
docker images |grep -E "([0-9a-z]*[-]){3,}[0-9]{9}" |awk '{print $3}' | xargs docker rmi  

      
  1. 设置定时

  • 查看定时任务

        
          
crontab -l  

      
  • 设置定时任务

        
          
crontab -e   

      

文本新增定时任务


        
          
*/35 */6 * * *  docker images | grep none | awk '{print $3}' | xargs docker rmi  
45 1 * * * docker system prune -f  

      

这里第一个任务是每隔六个小时的第 35 分钟执行,第二个任务每天的 1 时 45 分执行。

  • 定时任务的格式

设置定时格式: * * * * * shell

第一个星号,minute,分钟,值为 0-59 第二个星号,hour,小时,值从 0-23 第三个星号,day,天,值为从 1-31 第四个星号,month,月,值为从 1-12 月,或者简写的英文,比如 Nov、Feb 等 第五个星号,week 周,值为从 0-6 或者简写的英文,Wen、Tur 等,代表周几,其中 0 代表周末

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
云原生机器学习系统落地和实践
机器学习在字节跳动有着丰富业务场景:推广搜、CV/NLP/Speech 等。业务规模的不断增大对机器学习系统从用户体验、训练效率、编排调度、资源利用等方面也提出了新的挑战,而 Kubernetes 云原生理念的提出正是为了应对这些挑战。本次分享将主要介绍字节跳动机器学习系统云原生化的落地和实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论