论文汇总
整理网站发布过的论文调研,涉及多模态、模型训练、目标分类、目标检测、目标分割、图像检索、OCR、人脸检测/识别、模型蒸馏、模型剪枝、视频识别、细粒度分类、行人属性识别、视频压缩等领域。
整理网站发布过的论文调研,涉及多模态、模型训练、目标分类、目标检测、目标分割、图像检索、OCR、人脸检测/识别、模型蒸馏、模型剪枝、视频识别、细粒度分类、行人属性识别、视频压缩等领域。
距离上一次搭建Hexo/NexT博客网站已过去四年。虽然整体交互体验并未发生颠覆性的变化,但在交互细节与部署实现方面,确实持续进行了打磨与优化。这一次我打算使用最新版本(hexo 8.1.1 / NexT 8.26.0)重新构建我的博客网站,同时会结合更多的工具(Docker、Github Action/Pages、Gitea Actions/Nginx)来优化整个部署PIPELINE。
使用 FFmpeg + MediaMTX 搭建 RTSP 视频流仿真平台,覆盖认证、传输模式、多路推流,以及海康摄像头 URL 仿真。
从源码到可执行文件,C/C++ 的编译过程涉及多个阶段和工具链。本文梳理编译流程、GCC/G++ 的使用、CMake 构建系统,以及交叉编译的配置方式。
开发者可以使用他们选择的 AI 工具,借助这一开源工具集进行规范驱动开发。
2026 年,Vibe Coding 已经成为程序员的日常开发手段。我在 3 月份用 Claude Code + DeepSeek V3.2 进行了一次完整的 Vibe Coding 实践——没有手写一行代码,从零开发了 DataFlow-CV:一个跨平台的标签格式转换命令行工具。这篇文章记录整个过程和踩过的坑。
项目地址:https://github.com/zjykzj/DataFlow-CV

Use DeepSeek in Claude Code。