侯瑞哲的博客

如何判断什么是你最核心的事

发表于 2026-05-19

五种方法从不同角度切入：贝索斯的后悔最小化框架（用80岁视角照亮当下）、找那件一直被推迟的事（推迟它是因为太重要而有压力）、问"做了之后什么会改变"、巴菲特25/5规则（最危险的是好但不最重要的选项）、愿意为什么放弃睡眠，以及一个反直觉标准：真正重要的事做完带来的是平静感而非完成感。

如何控制注意力：专注在真正核心的事情上

发表于 2026-05-19

注意力比时间更稀缺，而且一旦付出不可逆。真正的问题不是"如何集中注意力"，而是把它放在哪里。找到那一件最核心的事、识别忙碌的三种来源、用环境设计代替意志力、每天主动分配而非被动响应、学会说不、保护深度工作时间——以及最后那句：注意力就是生命，你把它给了什么，你的生命就在那里。

什么是第一性原理：从底层事实出发重建答案

发表于 2026-05-19

从亚里士多德到马斯克，第一性原理的本质是：把问题分解到最基本的不可再分的事实，从事实出发重建答案，而不是在已有方案基础上修改。与类比思维的核心区别、三步操作方法、SpaceX电池/Airbnb/日常工作中的具体案例、什么时候用什么时候不用，以及常见的四个误解。

职业规划与选择：没有标准答案，只有适合你的框架

发表于 2026-05-17

大厂 vs 小厂问错了，技术 vs 管理不是非此即彼，跳槽的最佳时机是高光时刻而非被推着走。六个职业维度的权衡框架、四个常见陷阱、以及"职业规划是持续反思而非一次性任务"——不给标准答案，给你真正思考职业选择的方式。

如何在职场快速成长

发表于 2026-05-17

真正的成长只有一种：让自己真正变强，变得不可替代。选赛道比努力更重要、做难而正确的事、建立个人信用、管理向上关系、主动扩大影响范围——不是升职技巧，而是让你真正变强的底层方法论。

如何构建一个大规模推荐系统：从架构到算法到工程

发表于 2026-05-15

大规模推荐系统完整构建指南：层级漏斗架构（召回/粗排/精排/重排）、多路并行召回策略（协同过滤/双塔模型/ANN检索）、DIN 注意力排序模型、多目标学习、实时特征工程与存储体系、Parameter Server Embedding、MMR 多样性重排、A/B 测试体系、冷启动解决方案。

训练大模型最强的公司，会是用大模型最好的公司吗

发表于 2026-05-14

不一定——训练能力和应用能力是两套几乎不重叠的能力栈，激励机制天然分裂。从施乐 PARC 的历史先例，到 OpenAI 的模型被 Cursor/Perplexity 用得比自己更好，到谷歌的广告利益冲突，深度分析这种分离为何是结构性的，行业四层格局如何形成，以及"应用层护城河比基础模型层更持久"这一反直觉结论。

AI 时代，什么才是最重要的能力

发表于 2026-05-14

不是学会用工具，而是那些 AI 无法替代的能力：判断力、提问与定义问题的能力、跨领域整合、深度思考，以及抵抗平庸的意志。从"AI 是平均值生成器"出发，分析什么在 AI 时代变得更稀缺，以及"真正的问题不是怎么用好 AI，而是当 AI 能做的越来越多，我要成为什么样的人"。

马斯克五步工作法：最有效率的人是怎么思考的

发表于 2026-05-14

深度解析马斯克五步工作法：质疑需求、删除冗余、简化优化、加速迭代、自动化兜底。顺序本身就是精髓——大多数人犯的错误是把步骤搞反了。从 SpaceX 火箭零件到特斯拉生产地狱，理解这套反直觉方法论的底层逻辑与适用边界，以及它在软件工程中的映射。

JVM GC 图解：从入门到真正理解垃圾回收

发表于 2026-05-12

JVM GC 全图解：堆内存 Eden/Survivor/Old 结构、分代假说、Minor GC 四步执行过程（标记→复制→年龄晋升）、Full GC 与 Stop-The-World、可达性分析与循环引用、四种引用类型、标记清除/复制/整理三种算法，以及 Serial/Parallel/CMS/G1/ZGC 五大收集器原理与选型，附 GC 调优实践。

Python、Java、Go、Rust：四门语言的设计哲学与适用场景

发表于 2026-05-12

从设计哲学深度对比 Python、Java、Go、Rust：每门语言诞生时解决什么问题、为何做出这样的设计选择（动态类型/GIL/所有权系统/goroutine）、核心权衡与最适合的场景，附横向对比表、常见误区澄清，以及同一并发问题的四种语言实现对比。

从理论角度系统剖析流式计算：流 vs 批的数学本质与 Lambda 架构的历史妥协、Event Time/Processing Time 二元时间模型、Watermark 形式化定义与生成策略、四种窗口类型、DataFlow 的 What/Where/When/How 四问模型、Chandy-Lamport 算法与 Checkpoint 状态一致性、Exactly-Once 两阶段提交实现，以及流批统一的理论基础。

Apache Flume 深度解析

发表于 2026-05-11

Apache Flume 深度解析：Agent 三层架构（Source/Channel/Sink）与事务机制、Taildir/Kafka Source、Memory/File/Kafka Channel 可靠性对比、HDFS Sink 文件滚动策略、拦截器与多路复用路由、扇入/扇出 Agent 拓扑、Sink Processor 高可用、性能调优与监控，以及与 Filebeat/Kafka Connect 的选型对比。

百万 QPS LLM 推理服务系统性优化

发表于 2026-05-09

Continuous Batching、PagedAttention、Prefix Caching、投机解码、FP8/INT4 量化、Prefill-Decode 分离部署、Chunked Prefill、并行策略——深入剖析大规模 LLM 完整对话推理的核心挑战与工业级解法，附规模估算与框架选型。

Apache Doris 深度解析

发表于 2026-05-08

Apache Doris 深度解析：FE/BE 分离架构、四种数据模型（Duplicate/Aggregate/Unique/Primary Key）、Segment 列存引擎与三层索引、向量化执行引擎与 Pipeline 模型、四种数据导入方式、Colocate Join 零 Shuffle 原理、Workload Group 资源隔离、Multi-Catalog 联邦查询，附实战建表要点与常见坑。

什么是 AI Native？从零理解这个正在改变软件行业的概念

发表于 2026-05-07

AI Native 不是「给产品加个 AI 功能」，而是从设计之初就把 AI 的理解和生成能力当作核心基础设施。本文用云原生类比、搜索引擎演变、Cursor/Perplexity/Harvey 三个案例，解释 AI Native 的本质、五大特征、与 AI Enhanced 的区别，以及它对工程师意味着什么。

OLAP 选型对比：Doris vs ClickHouse vs Hive

发表于 2026-05-07

从架构原理出发对比 Apache Doris、ClickHouse、Hive：存储模型、查询执行、数据导入、并发能力、运维复杂度全维度横向评测，附五大典型场景选型分析与决策树，帮你避开选错技术栈的坑。

Kubernetes 实战指南：从零部署到熟练使用

发表于 2026-05-06

Kubernetes 实战指南：从搭建本地集群（minikube）到熟练使用 Pod、Deployment、Service、HPA，覆盖滚动更新、回滚、ConfigMap/Secret 配置管理、三类健康检查 Probe，以及常用 kubectl 调试命令速查。

手写 SQLite 09：索引 B-Tree 与加速查询

发表于 2026-05-05

「从零用 Rust 实现 SQLite」系列终篇。解析索引 B-Tree（叶节点 Cell 格式：key+rowid），实现 scan_index() 和 lookup_by_rowid()，支持索引辅助的 WHERE 查询，自动回退全表扫描。含完整系列回顾。

手写 SQLite 08：实现 WHERE 条件过滤

发表于 2026-05-05

「从零用 Rust 实现 SQLite」系列第 08 篇。解析 WHERE col = value 语法（支持字符串和整数），实现全表扫描后按列值过滤，完成 SELECT * FROM users WHERE name = 'Alice' 的完整执行。

手写 SQLite 07：实现 SELECT count(*) FROM table

发表于 2026-05-05

「从零用 Rust 实现 SQLite」系列第 07 篇。count(*) 只需 collect_leaf_cells() 的长度，无需解码任何 Record 数据，实现极速行数统计。包含 count_all() 函数实现、main.rs 扩展，以及与 SELECT * 的性能对比。

手写 SQLite 06：实现 SELECT * FROM table 带列名输出

发表于 2026-05-05

「从零用 Rust 实现 SQLite」系列第 06 篇。解析 CREATE TABLE SQL 提取列定义（处理引号/表级约束），正确处理 INTEGER PRIMARY KEY 别名 rowid（Record 中为 NULL 需用 rowid 填充），实现完整的 SELECT * FROM table 带列名输出，并处理浮点格式化等边界情况。

手写 SQLite 05：解析 sqlite_schema，实现 .tables 命令

发表于 2026-05-05

「从零用 Rust 实现 SQLite」系列第 05 篇。解析 sqlite_schema 表（Page 1 的 B-Tree），读取所有表的名称和根页号，实现 .tables 命令，彻底告别硬编码根页号；同时处理内部表过滤、rootpage=0 的视图/触发器等边界情况。

手写 SQLite 04：Record 格式解析——varint、Serial Type 与列值还原

发表于 2026-05-05

「从零用 Rust 实现 SQLite」系列第 04 篇。解析叶节点 Cell 完整格式，实现 varint 可变长整数解码、Serial Type 类型映射（NULL/整数/浮点/TEXT/BLOB），最终从字节流还原出 rowid 和所有列值，并用 hexdump 逐字节验证。

手写 SQLite 03：遍历 B-Tree，从根节点走到所有叶节点

发表于 2026-05-05

「从零用 Rust 实现 SQLite」系列第 03 篇。实现完整的 B-Tree 递归遍历：处理内部节点（读取 Cell 的左子页指针 + right_most_pointer），递归走到所有叶节点，收集所有 Cell 的（页号, 偏移）地址——为下一篇解码行数据做好铺垫。

手写 SQLite 02：B-Tree 页结构解析与 Rust 实现

发表于 2026-05-04

「从零用 Rust 实现 SQLite」系列第 02 篇。解析 B-Tree 页的内存布局（页头+Cell指针数组+Cell内容区），实现 Rust 页读取器 Pager 和页头解析器，读取叶/内部节点页头（8/12字节），遍历 Cell 指针数组获取每行数据的偏移量，并用 hexdump 逐字节验证。

手写 SQLite 01：SQLite 文件格式全景 + 用 Rust 解析文件头

发表于 2026-05-04

「从零用 Rust 实现 SQLite」系列第 01 篇。先从宏观视角介绍 SQLite 文件格式三层结构（文件→页→B-Tree），再动手用 Rust 解析文件头的 100 字节，读取页大小、总页数、文本编码、SQLite 版本等核心元数据，并用 hexdump 逐字节验证。

Hermes Agent 如何用 SQLite FTS5 实现跨会话记忆召回

发表于 2026-05-02

通过阅读 Hermes Agent 真实源码，深度解析一个生产级 AI Agent 如何用 SQLite FTS5 实现跨会话记忆召回：双 FTS5 索引（unicode61+trigram）的设计、FTS5+LLM 两阶段检索流程、智能窗口截取算法，以及多进程写入竞争的处理方案。

SQLite FTS5 全文检索深度解析

发表于 2026-05-02

SQLite 内置的 FTS5 扩展基于倒排索引，查询速度比 LIKE 快几个数量级，同时支持短语、前缀、布尔、NEAR 距离搜索和 BM25 相关性排序。零依赖、零部署，是个人项目和嵌入式场景被严重低估的全文检索方案。

Hermes Agent 深度解析：会自我进化的开源 AI Agent

发表于 2026-05-01

NousResearch 开源的 Hermes Agent 有一个让它区别于所有其他 Agent 框架的特性：内置学习闭环。它能自动从经验中生成技能、在使用中改进技能、跨会话积累对用户的理解。本文深度解析其技能系统、多平台接入、模型无关设计与 RL 训练集成。

算法工程师在财经业务中的作用：风控、量化与推荐全景解析

发表于 2026-05-01

财经业务是算法工程师最密集的应用场景之一。风控反欺诈、量化交易策略、个性化理财推荐——每一个模型决策背后都直接对应真实的钱。本文全景解析算法工程师在这三大方向的核心价值、关键模型与特殊挑战。

研发效能工程师是做什么的：工作内容与典型的一天

发表于 2026-04-30

研发效能工程师是做什么的？CI/CD 平台建设、研发度量、代码质量门禁、开发者体验……他们的客户是工程师，产品是工具和平台。本文详解主要工作内容、核心技能要求，以及一个典型工作日从早到晚的真实样子。

软件工程最佳实践：2026 年的工程师手册

发表于 2026-04-30

2026 年软件工程最佳实践：从代码设计（SOLID/设计模式）、测试策略（测试金字塔/TestContainers）、持续交付（CI/CD/金丝雀发布）、可观测性（Metrics/Traces/Logs）到 AI 辅助开发，系统梳理现代软件工程师必须掌握的工程实践方法论。

批流统一特征定义语言：业界最佳实践解析

发表于 2026-04-26

批流统一特征定义语言业界最佳实践：从 Training-Serving Skew 的时间语义/NULL 处理/数值精度三大根因出发，深入对比 Python SDK 代码生成（Tecton）、Flink SQL 批流一体、YAML DSL 声明式配置（字节/阿里）、共享算子库四种方案，附渐进式落地路径与特征一致性校验代码。

模型平台研发工程师技能图谱

发表于 2026-04-26

模型平台研发工程师技能图谱：岗位定位（做什么/不做什么）、编程语言（Java/Scala/Python/Go/SQL）、大数据基础（Spark/Flink/Redis/HBase/Kafka）、特征平台（Training-Serving 一致性）、训练框架（分布式训练/K8s 调度）、推理服务（性能优化/稳定性）、系统设计（高并发/可观测性），以及三阶段学习路径。

数据湖选型全景：存储、表格式、计算引擎怎么选

发表于 2026-04-26

数据湖四层选型全景：存储层（HDFS vs 云对象存储 S3/OSS）、表格式层（Delta Lake/Iceberg/Hudi 深度对比与代码示例）、计算引擎层（Spark 批处理/Flink 流批/Trino 交互查询/StarRocks OLAP）、元数据管理层（HMS/Glue/Nessie），以及四种典型组合方案。

数据湖入门：它到底是做什么的

发表于 2026-04-25

数据湖入门：从真实问题出发讲清楚数据湖是什么、Schema on Read 与 Schema on Write 的区别、与数据仓库的对比、湖仓一体（Delta Lake/Iceberg/Hudi）解决了什么问题，以及什么时候该用数据湖。

特征平台深度对比：Feast、Tecton、字节与阿里的实践

发表于 2026-04-25

特征平台深度对比：从 Training-Serving Skew 痛点出发，解析 Feast（开源轻量，特征注册+PIT查询）、Tecton（批流统一全栈，自动生成 Spark/Flink 作业）、字节 Feature Platform（百亿次/天超大规模，统一 DSL）、阿里 FeatureStore（MaxCompute/Hologres 深度集成，特征市场）的架构差异，附选型建议与自建最小核心模块。

金融风控业务深度解析：支付、消费金融与保险

发表于 2026-04-25

金融风控三大场景深度解析：支付风控（ATO/盗卡/羊毛党/洗钱，100-300ms 实时决策链路，图风控关联网络）、消费金融风控（贷前/贷中/贷后全流程，A/B/C 评分卡，WOE 特征编码，核心业务指标）、保险风控（核保逆向选择，理赔欺诈识别，GLM 精算定价），以及三场景横向对比与共通技术体系。

大型模型平台系统建设

发表于 2026-04-25

大型模型平台系统建设全景：五层架构（数据/特征/训练/推理/管理）、批流一体特征生产与 Training-Serving Skew 治理、样本构建与在线学习、推理性能优化（量化/蒸馏/缓存）、数据隔离与多租户、三层监控体系与自动化再训练，以及金融增长场景下的技术选型。

MySQL 索引优化深度解析

发表于 2026-04-25

MySQL 索引优化深度解析：B+ Tree 原理与树高计算、聚簇索引与回表、覆盖索引、联合索引最左前缀与列顺序设计、7 类索引失效场景、EXPLAIN 执行计划关键字段解读、深分页优化，以及生产环境索引设计原则与在线 DDL。

HBase 深度解析

发表于 2026-04-19

HBase 深度解析：数据模型（RowKey/列族/Cell/多版本）、HMaster/RegionServer/ZooKeeper 架构、LSM-Tree 存储引擎（WAL/MemStore/HFile/Compaction）、读写流程、RowKey 散列设计与热点处理、过滤器与协处理器，以及生产参数调优。

模型平台训练框架架构深度解析

发表于 2026-04-18

大模型训练平台架构全景：分层架构（硬件/调度/框架/平台）、三维并行策略（DP+TP+PP）、主流框架（PyTorch FSDP/Megatron-LM/DeepSpeed ZeRO）、显存优化（Flash Attention/梯度检查点/混合精度）、通信调优，以及工程师五层技能图谱与学习路径。

Java 工程师学 Rust：从 JVM 思维到所有权模型

发表于 2026-04-17

从 Java 工程师视角系统学习 Rust：所有权与移动语义、借用检查器、生命周期、类型系统对比（trait vs interface、Option vs null、Result vs 异常）、并发模型、Java→Rust 概念映射，以及最容易踩的坑和四阶段学习路径。

HiveQL 与 SQL 深度对比

发表于 2026-04-17

HiveQL 与标准 SQL 的全面对比：相同的查询语法、核心 DML 差异（无行级 UPDATE/DELETE）、DDL 扩展（分区/分桶/存储格式）、复杂数据类型（ARRAY/MAP/STRUCT）、特有函数体系，以及迁移建议。

批流特征生产架构深度解析

发表于 2026-04-17

批流特征生产架构深度解析：批式特征计算与 Point-in-Time Join、Flink 流式特征状态管理、批流一体架构、训练-服务一致性保障、特征存储设计与大厂特征平台实践。

时序数据库深度解析

发表于 2026-04-17

时序数据库深度解析：核心数据模型、InfluxDB TSM 存储引擎、Prometheus TSDB 原理、高基数问题、压缩算法、集群高可用，以及生产环境最佳实践。

ClickHouse 查询与存储机制深度解析

发表于 2026-04-14

ClickHouse 查询与存储机制深度解析：MergeTree 存储引擎、列式存储与数据压缩、稀疏索引与跳数索引、向量化执行引擎、分布式查询，以及生产环境最佳实践。

Hive 深度解析

发表于 2026-04-14

Hive 深度解析：架构原理、存储格式（ORC/Parquet）、执行引擎（MapReduce/Tez/Spark）、HiveQL 优化、数据倾斜处理、分区分桶机制，以及生产环境最佳实践。

Claw Code 解析：用 Rust 重写 Claude Code，4 天 18 万 star

发表于 2026-04-03

Claw Code 是一个用 Rust 重写的 Claude Code 开源实现，4 天内积累 18 万 star。分析它的架构设计：9 个 Rust crate、多智能体协调系统、以及它真正想证明的事情。

直播间消息系统设计

发表于 2026-04-03

直播间消息系统的核心挑战：百万并发下的实时推送、消息分类与差异化处理、礼物的可靠投递、弹幕的限流采样，以及扇出问题的分层解决方案。

从零实现一个 RPC 框架

发表于 2026-04-03

从零实现一个 RPC 框架：协议设计、序列化、Netty 网络通信、动态代理、ZooKeeper 服务注册与发现、负载均衡、超时重试，逐层拆解 RPC 的核心设计。

分布式锁深度解析

发表于 2026-04-03

分布式锁深度解析：从 Redis SET NX、Redlock 算法、ZooKeeper 临时顺序节点，到数据库乐观锁，逐一分析实现原理、适用场景与常见陷阱。

MySQL 深度解析

发表于 2026-04-03

深入解析 MySQL InnoDB 存储引擎：Buffer Pool、redo/undo log、B+ Tree 索引、MVCC 多版本并发控制、主从复制原理与生产实践。

QUIC 协议深度解析

发表于 2026-04-03

QUIC 是 Google 设计、IETF 标准化的新一代传输层协议，也是 HTTP/3 的底层基础。深入解析 0-RTT 握手、多路复用、连接迁移、拥塞控制等核心设计。

AI Agent 架构深度解析

发表于 2026-04-03

从 ReAct、Plan-and-Execute 到多 Agent 协作，系统梳理 AI Agent 的核心架构模式、Memory 管理、可靠性设计和工程实践。

解包 Claude Code：从 13MB 的 npm 包里看到了什么

发表于 2026-04-03

Claude Code 是 Anthropic 发布的 AI 编程助手，整个工具打包成一个 13MB 的 npm 包。本文对其解包分析，记录了验证专家 Agent、流式降级、Prompt 缓存分层等有意思的内部实现。

Lucene 深度解析

发表于 2026-03-30

Apache Lucene是一个高性能、全功能的文本搜索引擎库，完全用Java编写。它是ElasticSearch、Solr等搜索引擎的核心，为全文检索提供了强大的基础设施。

Rust 深度解析

发表于 2026-03-30

Rust是一种系统级编程语言，专注于安全性、并发性和性能。它由Mozilla研究院开发，旨在提供C++级别的性能，同时保证内存安全。本文将深入解析Rust的核心概念、特性和最佳实践。

Spark 分布式计算原理

发表于 2026-03-28

Spark 是当今最流行的分布式计算框架之一。本文将深入探讨 Spark 的核心架构、RDD 原理、DAG 调度、内存管理以及性能优化策略。

Kafka 深度解析

发表于 2026-03-28

Apache Kafka是一个分布式流处理平台，以高吞吐量、低延迟、可扩展性和持久性著称，是大数据生态系统中的核心组件。

Zookeeper 深度解析

发表于 2026-03-28

Apache Zookeeper是一个开源的分布式协调服务，为分布式应用提供一致性服务。它以简单、高效、可靠著称，是很多分布式系统的基石。

ClickHouse 深度解析

发表于 2026-03-28

ClickHouse是一个面向列的OLAP数据库管理系统，以高性能、低延迟、高压缩比著称，是实时数据分析领域的明星产品。

分布式一致性算法

发表于 2026-03-28

分布式一致性算法是解决分布式系统中一致性问题的核心理论，包括Paxos、Raft等经典算法，以及2PC、3PC、TCC、Saga等分布式事务方案。

ElasticSearch 深度解析

发表于 2026-03-28

ElasticSearch 是基于 Lucene 的分布式搜索引擎，以其强大的全文检索、实时分析和可扩展性著称。本文将深入剖析 ElasticSearch 的核心概念、查询语法、聚合分析以及集群架构。

Flink 流式计算原理

发表于 2026-03-28

Flink 是新一代大数据流式计算引擎，以其低延迟、高吞吐、精确一次等特性著称。本文将深入剖析 Flink 的核心架构、运行时机制以及流式计算的关键技术。

Redis 深度解析

发表于 2026-03-28

Redis 是高性能的键值存储数据库，以其丰富的数据结构、持久化机制和高可用特性著称。本文将深入剖析 Redis 的核心原理、数据结构、持久化机制以及集群架构。

MySQL 索引优化

发表于 2026-03-27

索引是数据库优化中最重要的一环。本文将深入探讨 MySQL 索引的原理、类型、失效场景以及优化技巧，帮助你构建高效的数据库查询。