x-jeff blog

Make progress every day.

【CUDA编程】【4】【3.Programming Interface】【3.2.CUDA Runtime】【3.2.1.Initialization】

CUDA Runtime,Initialization

【CUDA编程】系列博客参考NVIDIA官方文档“CUDA C++ Programming Guide(v12.6)”。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.CUDA Runtime CUDA runtime在cudart库中实现。该库可以以静态链接(通过cudart.lib或libcudart.a)或动态链接(通过cudart.dll或libcudar...

【CUDA编程】【3】【3.Programming Interface】【3.1.Compilation with NVCC】

Compilation Workflow,Binary Compatibility,PTX Compatibility,Application Compatibility,C++ Compatibility,64-Bit Compatibility

【CUDA编程】系列博客参考NVIDIA官方文档“CUDA C++ Programming Guide(v12.6)”。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Compilation with NVCC 所有包含CUDA代码的源文件都需要使用nvcc编译器进行编译。nvcc是NVIDIA提供的专门用于编译CUDA程序的编译器。 2.Compilation...

【机器学习基础】第五十三课:[计算学习理论]VC维

VC维,增长函数,对分,打散,Sauer引理

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.VC维 现实学习任务所面临的通常是无限假设空间,例如实数域中的所有区间、$\mathbb{R}^d$空间中的所有线性超平面。欲对此种情形的可学习性进行研究,需度量假设空间的复杂度。最常见的办法是考虑假设空间的“VC维”(Vapnik-Ch...

【程序是怎样跑起来的】第11章:硬件控制方法

I/O控制器,I/O地址,IRQ,DMA,VRAM

博客为参考《程序是怎样跑起来的》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.应用和硬件无关? 👉第11章热身问答: 在汇编语言中,是用什么指令来同外围设备进行输入输出操作的? IN指令和OUT指令。在x86系列CPU用的汇编语言中,通过IN指令来实现I/O输入,OUT指令来实现I/O输出。 ...

【C++并发编程】【1】【Hello, world of concurrency in C++!】What is concurrency?

并发,多进程并发,多线程并发,并行

【C++并发编程】系列博客为参考《C++ Concurrency IN ACTION (SECOND EDITION)》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.What is concurrency? 从最简单、最基本的层面上,并发(concurrency)就是指两个或更多的独立活动同时进行。 2.Concurrency in ...

【机器学习基础】第五十二课:[计算学习理论]有限假设空间

可分情形,不可分情形

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.可分情形 可分情形意味着目标概念$c$属于假设空间$\mathcal{H}$,即$c\in \mathcal{H}$。给定包含$m$个样例的训练集$D$,如何找出满足误差参数的假设呢? 容易想到一种简单的学习策略:既然$D$中样例标记都...

【论文阅读】VarifocalNet:An IoU-aware Dense Object Detector

VarifocalNet(VFNet),Varifocal Loss,IACS

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 现在的目标检测器,无论是单阶段方法还是两阶段方法,通常首先会生成一组冗余的bbox,并带有分类分数,然后再使用NMS来去除同一目标上的重复bbox。通常分类分数被用于在NMS中对bbox进行排序。然而,这会影响检测性能,因为分类分数并不总是能够很好的估计bbox的定位精度,因此那些定位准确但分...

【论文阅读】PP-YOLOE:An evolved version of YOLO

PP-YOLOE

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 源码和预训练模型:PaddleDetection。 单阶段目标检测器因在速度和精度上的良好权衡,一直受到欢迎。单阶段检测器中,最著名的就是YOLO系列。 受到YOLOX的启发,我们对PP-YOLOv2进行了优化,提出了PP-YOLOE(E表示evolved version)。PP-...

【论文阅读】Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection

ATSS(Adaptive Training Sample Selection)

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction github源码地址:ATSS。 anchor-based检测器通常分为单阶段方法(比如SSD、RetinaNet)和两阶段方法(比如Faster R-CNN、R-FCN)。两种方法的共同点是首先在图像上排列大量预设的anchor,然后通过一次或多次预测这些anchor的类别,并re...

【C++基础】第一百一十三课:[特殊工具与技术]固有的不可移植的特性

不可移植特性,位域,volatile限定符,链接指示,extern "C"

【C++基础】系列博客为参考《C++ Primer中文版(第5版)》(C++11标准)一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.固有的不可移植的特性 为了支持低层编程,C++定义了一些固有的不可移植(nonportable)的特性。所谓不可移植的特性是指因机器而异的特性,当我们将含有不可移植特性的程序从一台机器转移到另一台机器上时,...