仅需一小时，教你用豆包MarsCode 学会图像物体识别 - 文章 - 开发者社区

picture.image

上周四晚豆包MarsCode AI 编程云课堂

「新手开发者系列」迎来收官课程！

这节课讲授了如何通过豆包MarsCode

低代码实现图像物体智能检测~

轻松了解购物同款识别

动植物品种识别

车辆违章识别的底层逻辑

picture.image

并进行初步应用~

错过直播的小伙伴快码住这期课程回顾‍‍

一起用代码炼出火眼金睛~

课前准备

安装豆包MarsCode

在启动编码工作前，我们需要先下载安装豆包MarsCode 编程助手。

以在 Visual Studio Code 中为例，需要先打开 VSCode 扩展窗口，在搜索框搜索MarsCode，找到豆包MarsCode 后单击「install」，完成安装，登录后即可使用豆包MarsCode 编程助手。

picture.image

获取课程代码

复制如下链接至浏览器，即可获取代码：

https://sourl.cn/2WRZVH


            
                

              git clone https://gitcode.com/langgptai/ImageDetection.git

安装 Python 环境

Windows 系统安装 Python

打开如下官方网站，点击适合自己电脑配置的版本即可下载👇

https://www.python.org/downloads/

🌟注意要记住自己安装的 Python 版本，之后会用到~

配置 VSCode

安装 Python 必备扩展：

打开 VSCode，点击左侧扩展图标（或直接按快捷键：Ctrl+Shift+X ），搜索并安装以下扩展：

Python（Microsoft 出品，必装）

picture.image

Python Extension Pack（包含多个实用工具）
Python Indent（自动缩进）
Python Path（路径管理）

配置 Python 环境

按快捷键 Ctrl+Shift+P（macOS用Command+Shift+P）
输入"Python: Select Interpreter"

picture.image

选择之前安装的 Python 版本

picture.image

创建和运行第一个 Python 程序

点击"文件 > 新建文件"
保存为.py 文件（如：hello.py）
输入示例代码：


          
              

            printf("hello world!");

右键点击编辑器，选择"在终端中运行 Python 文件" 或点击右上角的运行按钮（三角形图标）

picture.image

安装 Git（可选，用于下载模型）

访问以下网址： https://git-scm.com/downloads
下载并安装 Git
验证安装：git--version

FFmpeg 安装

Windows：

访问如下网址后：

https://www.ffmpeg.org/download.html，下载 Windows 版本（选择 Windows builds），解压下载的文件到指定目录（如 C:\ffmpeg）并添加以下环境变量：

右键"此电脑" → 属性 → 高级系统设置 → 环境变量
在"系统变量"中找到 Path
点击"编辑" → "新建"
添加 FFmpeg 的 bin 目录路径（如 C:\ffmpeg\bin）

验证安装：打开新的命令行窗口，输入 ffmpeg -version

Linux：


              
sudo apt update
              
sudo apt install ffmpeg

Mac：


          
              

            brew install ffmpeg

Python 依赖安装

升级 pip：


          
              

            python -m pip install --upgrade pip

安装主要依赖：


            
# 基础依赖
            
pip install torch torchvision
            
pip install transformers
            
pip install pillow
            
pip install opencv-python
            
pip install ultralytics
            
pip install tqdm
            
pip install ffmpeg-python
            

            
# 如果下载速度慢，可以使用清华源：
            
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple torch torchvision
            
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple transformers pillow opencv-python ultralytics tqdm ffmpeg-python

完成一系列的准备工作之后，终于来到了我们的实操环节！现在正式开始我们的课程跟练，开启 AI 视觉之旅~

课程跟练

首先打开前文提到的课程代码~


          
              

            git clone https://gitcode.com/langgptai/ImageDetection.git

再打开豆包MarsCode，输入提示词获取代码


          
              

            你能否用最新的yolo 进行目标检测

picture.image

通过更改代码中的图片路径，跟随图片操作运行代码即可对图像进行物体检测，得到如图效果，成功识别出照片中的人物。

picture.image

下一步需要对图片中的物体是什么进行标注，我们可以在对话框输入如下关键词：

picture.image

替换代码后,可获得如下效果：

picture.image

观察图像可知有图片中还有其他低概率杂框，比如 Bench 和 Bottle 的识别框

低概率：指代码识别物体正确概率

如果需要去除掉低概率杂框，我们只需要在对话框输入如下提示词：


          
              

            概率在 0.5以下的不绘制，其他代码不变

即可得到如下图效果：

picture.image

想要核对答案的朋友，公众号后台发送【图像检测】即可获取完整代码～

接下来继续进行应用升级，进行车流检测。打开视频接下里输入如下提示词：


          
              

            检测视频 cars.mp4 并保存检测结果

picture.image

可获取如下效果：

picture.image

在其他常见的生活应用场景中，抖音的滤镜检测年龄玩法也是运用了类似的原理。现在我们来进行情绪识别的应用，或许也能轻松复刻类似滤镜玩法。

我们对豆包MarsCode 输入如下命令：


          
              

            HF\_ENDPOINT=https://hf-mirror.com python emotion.py

picture.image

即可加载情绪识别模型识别图像中人物情绪。

picture.image

同样的，在模式选择中选择 3 并打开视频路径，类似的也可获得如下图效果👇

picture.image

以上就是图像物体智能检测课程的全部内容

类似的原理还能用在非常多生活领域

欢迎大家运用今天所学知识

多多探索生活中更多可能性！

虽然 「新手开发者系列」 已收官

但我们的课程仍会继续

接下来的**「初级开发者系列」**

将由字节跳动内部资深程序员为大家授课

带练工作中的常见实战项目

助力初级程序员“码”力飞升！

欢迎大家点击阅读原文点击报名参与课程~

picture.image