从零入门 cuda 编程?🦴深入理解 sgemmNN 算法! 深入理解 sgemmNN 算法时隔近一年,CUDA 系列的第三篇终于来了。上篇讲访存优化时留了一个尾巴——说好要专门写一篇讲 SGEMM 的。今天我们就来填这个坑,深入分析一个经典的、手写的 sgemmNN 内核,看看 Volkov 在 2008 年的那篇著名论文 《Benchmarking GPUs to tune dense linear algebra》 中到底做了什么。 从问题说起:为什么 2026-06-28 💻 技术干货 > 并行程序计算 #cuda 编程 #并行程序
三月份杂谈:销声匿迹的3月份 消失的3月份杂谈 “Time flies like an arrow; fruit flies like a banana.”— Groucho Marx 敲下这段文字时,已经离三月远去了。原本应该在月底就落笔的月度杂谈,被各种琐事一拖再拖,竟拖到了六月的尾巴上。现在补写三月,有种说不出的荒诞感——像是在给一个已经走远的月份立碑,碑文却迟迟才刻上。 时间是如何悄悄蒸发的🕳️现在回想三月,记忆像 2026-03-31 ⛺ 心灵之旅 > 博客日常 #杂谈 #感受 #心情
一次 pacman 中断引发的内核崩溃与修复记录 一次 pacman 中断引发的内核崩溃与修复记录 lazypool:不要随便中断 pacman,真的会很麻烦😢 事故起因前天在更新 Arch Linux 系统时,我习惯性地用我自制的 DWM状态栏的脚本调用终端运行 pacman -Syu。这是因为我的状态栏脚本提供了点击某个模块就可以打开一个终端并运行一条指令的功能,其中有一个就是打开终端后运行 pacman 指令。之前,为了保持桌面整洁,我 2026-03-03 📢 技术杂谈 > 纠错日常 #Archlinux #DWM #pacman #内核 #系统修复
2025年终杂谈:好像今年,也没那么糟 2025 年终杂谈:好像今年,也没那么糟十几个小时前,2025年悄然走完了全程,我们这些平凡人被时光轻轻推入2026年。新岁首日,空气里都浸着几分微醺的喜悦。忙完期末考试与期末汇报,终于能抽出身做些真正想做的事——写博客、敲代码、健身、读论文,一切似乎与往日无差。尽管仍在求职路上跋涉,前方依旧横亘着不少挑战与阻碍,但我总算沉下心来了。船到桥头自然直,有时不由船主掌控,只随水流自在前行。 看着QQ、 2026-01-01 ⛺ 心灵之旅 > 博客日常 #杂谈 #感受 #心情
如何写更好的 git 提交信息 (git message) 确保编写有意义的 commit message最近我在编写我的 dwm 下一代的代码,开了很多 feature 分支,也做了很多 commit。在实际项目中,我注意到我过去提交的很多信息都很混乱,缺乏统一规范,比如有的使用了中文,有的表述不清,等等。实际上,关于 git 的提交信息已经有一个很成熟的约定了,那就是 『conventional commits』。这个约定被大家默默地遵守了很多年,已经 2025-12-10 🔧 工具使用 > 实用工具指南 #git #规范化
你不得不学的线段树 (segment tree) 基础 🌳 你不得不学的线段树基础 🌳最近刷力扣时遇到了很多和线段树有关的题目,所以这篇博客是用来讲解 线段树 的。 线段树是算法竞赛和面试中常用的数据结构,专门用来高效处理区间信息。它能在 $O(\log N)$ 的时间复杂度内完成区间查询(求和、求最值等)和区间修改操作,将原本 $O(N)$ 的操作大幅优化。 为什么需要线段树?想象一下,你有一个长度为 $N$ 的数组,你需要频繁地进行以下两种操作: 2025-12-06 💻 技术干货 > 数据结构与算法 #数据结构与算法 #线段树 #树结构
深入理解 Linux 字体配置:我的 fontconfig 实践 🧭 理解 Linux 字体配置:我的 fontconfig 实践 🧭说来惭愧,linux 系统我也用了将近 4 年了,但是它的字体配置一直没有搞得很清楚。特别是终端中的 emoji 显示,总是时好时坏,让人困扰。最近在查阅资料时,我参考了 luboQAQ 关于 fontconfig 的博客,决定系统性地解决这个问题。 本文将分享我的抄作业配置实践,帮助大家理解如何在 Linux 下实现完美的字体渲染 2025-10-25 🔧 工具使用 > Oh-my-Linux #字体 #emoji #nerd font #fontconfig
一块旧时代的墓志铭:大数据、区块链、元宇宙 一块旧时代的墓志铭:大数据、区块链、元宇宙 俺曾见金陵玉殿莺啼晓,秦淮水榭花开早,谁知道容易冰消。眼看他起朱楼,眼看他宴宾客,眼看他楼塌了。 —— 清·孔尚任《桃花扇》 100 年后,人们习惯将 大数据、元宇宙 与 区块链 并称为本体纪元的三大往事。作为 21 世纪初互联网领域最具影响力的三场技术浪潮,它们曾何等喧嚣,一时风头无两,吸引无数开发者与投资者竞相涌入;却又如何渐次归于沉寂, 2025-10-22 📢 技术杂谈 > 琐碎的杂谈 #大数据 #区块链 #元宇宙 #技术热潮
九月份杂谈:秋招滑铁卢、武大Offer、躺平加拖延 九月份杂谈:秋招滑铁卢、武大Offer、躺平加拖延 “Some people believe holding on and hanging in there are signs of great strength. However, there are times when it takes much more strength to know when to let go and then do 2025-09-30 ⛺ 心灵之旅 > 博客日常 #杂谈 #感受 #心情
从零入门 cuda 编程?🦴访存优化! Cuda 的访存优化继上篇从零入门 Cuda 编程已经 6 个月了,这篇博客已经不能再拖了。我之前早有规划,写完 Cuda 编程入门之后,还要写一篇 访存优化,还要写一篇 执行配置优化,还要写一篇讲 SGEMM 的。这样算是起了一个 Cuda 编程的头,也好后面继续深入。然而,人一旦在学校,做什么事情便由不得自己了。忙完 6 月份,又忙 7、8 月份的保研和秋招,真是让人火大。 总而言之,这一篇是 2025-08-19 💻 技术干货 > 并行程序计算 #cuda 编程 #并行程序