welcome to x-jeff blog

【论文阅读】You Only Learn One Representation：Unified Network for Multiple Tasks

YOLOv4-CSP-fast，YOLOv4-CSP-SSS，YOLOv4-CSP-SSSS，YOLOv4-P6-light，YOLOR-P6，YOLOR-W6，YOLOR-E6，YOLOR-D6

本文为原创文章，未经本人允许，禁止转载。转载请注明出处。 1.Introduction 源码：https://github.com/WongKinYiu/yolor。个人感觉整篇文章写的有点云里雾里的，有困惑的同学可以直接跳到Appendix部分查看清晰的网络框架图。如Fig1所示，根据一张图片，人类可以回答多个不同的问题。但对于一个训练好的CNN来说，其...

Posted by x-jeff on July 18, 2025

【论文阅读】Scaled-YOLOv4：Scaling Cross Stage Partial Network

Scaled-YOLOv4，YOLOv4-CSP，YOLOv4-Tiny，YOLOv4-Large

本文为原创文章，未经本人允许，禁止转载。转载请注明出处。 1.Introduction 模型缩放（model scaling）技术非常重要，这可以让模型在各种设备上都达到高精度和实时推理的最佳平衡。最常见的模型缩放方法就是改变backbone网络的深度（即卷积层的数量）和宽度（即卷积核的数量）。我们基于YOLOv4，提出了YOLOv4-CSP，并在此基础上开发出了scal...

Posted by x-jeff on July 15, 2025

【机器学习基础】第六十四课：[概率图模型]条件随机场

条件随机场（Conditional Random Field，CRF），链式条件随机场

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书，自己所做的读书笔记。本文为原创文章，未经本人允许，禁止转载。转载请注明出处。 1.条件随机场条件随机场（Conditional Random Field，简称CRF）是一种判别式无向图模型。【机器学习基础】第六十二课：[概率图模型]隐马尔可夫模型中提到过，生成式模型是直接对联合分布进行建模，而判别式模型则是对条件分布...

Posted by x-jeff on June 29, 2025

【LLM】LangChain：Chat with Your Data

用LangChain构建基于文档的智能问答系统

本文为参考DeepLearning.AI的”LangChain: Chat with Your Data”课程所作的个人笔记。课程地址：https://www.deeplearning.ai/short-courses/langchain-chat-with-your-data/。本文为原创文章，未经本人允许，禁止转载。转载请注明出处。 1.Introduction...

Posted by x-jeff on June 26, 2025

【机器学习基础】第六十三课：[概率图模型]马尔可夫随机场

马尔可夫随机场（Markov Random Field，MRF）

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书，自己所做的读书笔记。本文为原创文章，未经本人允许，禁止转载。转载请注明出处。 1.马尔可夫随机场马尔可夫随机场（Markov Random Field，简称MRF）是典型的马尔可夫网，这是一种著名的无向图模型。图中每个结点表示一个或一组变量，结点之间的边表示两个变量之间的依赖关系。马尔可夫随机场有一组势函数（pote...

Posted by x-jeff on June 21, 2025

【论文阅读】SSD：Single Shot MultiBox Detector

SSD

本文为原创文章，未经本人允许，禁止转载。转载请注明出处。 1.Introduction 官方源码：https://github.com/weiliu89/caffe/tree/ssd。当前SOTA的目标检测方法，均是以下流程的变体：首先生成候选bbox；对每个box内的像素或特征进行重采样；然后应用高质量的分类器。这种方法虽然精度高，但它们...

Posted by x-jeff on June 12, 2025

【机器学习基础】第六十二课：[概率图模型]隐马尔可夫模型

隐马尔可夫模型

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书，自己所做的读书笔记。本文为原创文章，未经本人允许，禁止转载。转载请注明出处。 1.隐马尔可夫模型机器学习最重要的任务，是根据一些已观察到的证据（例如训练样本）来对感兴趣的未知变量（例如类别标记）进行估计和推测。概率模型（probabilistic model）提供了一种描述框架，将学习任务归结于计算变量的概率分布。在...

Posted by x-jeff on June 7, 2025

【LLM】LangChain for LLM Application Development

LangChain应用开发入门

本文为参考DeepLearning.AI的”LangChain for LLM Application Development”课程所作的个人笔记。课程地址：https://www.deeplearning.ai/short-courses/langchain-for-llm-application-development/。本文为原创文章，未经本人允许，禁止转载。转载...

Posted by x-jeff on June 6, 2025

【LLM】Building Systems with the ChatGPT API

搭建基于ChatGPT的问答系统

本文为参考DeepLearning.AI的”Building Systems with the ChatGPT API”课程所作的个人笔记。课程地址：https://www.deeplearning.ai/short-courses/building-systems-with-chatgpt/。本文为原创文章，未经本人允许，禁止转载。转载请注明出处。 1.Intro...

Posted by x-jeff on April 30, 2025

【论文阅读】Enriching Variety of Layer-wise Learning Information by Gradient Combination

PRN

本文为原创文章，未经本人允许，禁止转载。转载请注明出处。 1.Introduction 根据以往的研究工作，提高深度卷积神经网络性能的策略分为两个方面：如何组合特征并将其传播到后续层。如何使梯度更高效地传播到所有层。我们提出一个新的角度：在训练过程中，如何组合各层的梯度以获得更好的学习效果。因此，我们提出了PRN（partial residual netwo...

Posted by x-jeff on April 24, 2025

x-jeff blog