系统日知录

系统日知录

青藤木鸟
112篇文章
专栏最后更新于: 2024年9月22日

推荐购买理由

系统日知录会持续更新数据库分布式系统存储MLSystem相关的想法翻译笔记和文章通过深入浅出的持续解析帮助业务开发程序员建立底层知识体系写代码不是全部系统是综合学问不谋全局者不足谋一域不学系统者不足学编程专栏是买断制在保证每篇文章的知识密度的基础上持续不定期更新会随缘将一些文章分享到公众号木鸟杂记关注该公众号后回复优惠券可以领取本专栏八折优惠券关于专栏内容想交流可以留言也可加我微信qtmuniao

专栏介绍

《系统日知录》会持续更新数据库、分布式系统、存储、ML System 相关的想法、翻译、笔记和文章,通过深入浅出的持续解析,帮助业务开发程序员建立底层知识体系。

写代码不是全部,系统是综合学问。

不谋全局者,不足谋一域; 不学系统者,不足学编程。

专栏是买断制,在保证每篇文章的知识密度的基础上,持续不定期更新。会随缘将一些文章分享到公众号:“木鸟杂记”。关注该公众号后回复:“优惠券”,可以领取本专栏八折优惠券。

关于专栏内容,想交流可以留言、也可加我微信 qtmuniao。有个交流群,如果想加群可备注。 如果想要试读,可以点击标签页的“免费预览”,查看当前几篇露出的免费文章。

简介

现在初步打算围绕“系统”开几个系列:

图数据库101系列

每天学点数据库系列

工业界架构解析系列

论文导读系列

好文翻译系列

系统,既是数据库系统中的系统,也是分布式系统中的系统,也是人类组织系统中的系统,也可是一切有迹可循、有规律可考的系统。学习系统的架构,借鉴系统的组织,使我们的认知也系统起来。

由于是买断制,因此会不定期更新,请谨慎订阅。作为给先订阅同学的福利,如果有同学通过你的分享订阅本专栏,你可以拿到该同学订阅费用的 20% 的抽成~ 分享方式见专栏介绍。另外,可以关注我的公众号:“木鸟杂记”,回复:“优惠券”,即可获取订阅的八折优惠券。

如果有任何建议以及想看的系统文章,欢迎留言~ 另外我们还有个专门读者群和大家进行写作方向沟通、技术交流、职场交流,在订阅后可以加我微信:qtmuniao 拉你入群。订阅后,任何关于数据库和分布式系统方向的就业和发展咨询,也可以找我聊。

最后,欢迎在微信中打开订阅:https://xiaobot.net/p/system-thinking

ps:我的公开博客:https://www.qtmuniao.com/

注:

📘 代表该篇是论文解读

🔥 表示该篇启发+留言人数较多

当前文章列表 面试系列

Infra 面试之数据结构(一):阻塞队列

Infra 面试之数据结构(二):无锁队列

infra 面试之数据结构(三):事件队列 🔥

infra 面试之数据结构(四):哈希表 🔥

Infra 面试之数据结构(五):顺序组装

Infra 面试之数据结构(六):LRU

infra 面试之数据结构(七):堆

infra 面试之数据结构(八):前缀树

RocksDB 相关的一些面试题

数据库面试的几个常见误区 🔥

图数据库系列

图数据库资料汇总

译: Factorization & Great Ideas from Database Theory

Memgraph 系列(二):可串行化实现 📘

Memgraph 系列(一):数据多版本管理 📘

【图数据库系列四】与关系模型的“缘”与“争”

【图数据库系列三】图的表示与存储

【图数据库系列二】 Cypher 初探

【图数据库系列一】属性图模型是啥、有啥不足 🔥

数据库

译:数据库五十年来研究趋势

译:数据库中的代码生成(Codegen in Databas…

Facebook Velox 运行机制解析

分布式系统架构(二)—— Replica Placement

【好文荐读】DuckDB 中的流水线构建

数据处理的大一统——从 Shell 脚本到 SQL 引擎

Firebolt:如何在十八个月内组装一个商业数据库 📘

论文:NUMA-Aware Query Evaluation Framework 赏析 📘

优质信息源:分布式系统、存储、数据库 🔥

ER 模型背后的建模哲学

什么是云原生数据库?

译:时下大火的向量数据库,你了解多少?

向量数据库 Milvus 架构解析(三):索引构建和数据检索

向量数据库 Milvus 架构解析(二):数据插入

向量数据库 Milvus 架构解析(一):架构概览

Azure DB SQL 背后系统 Socrates 📘

架构速览(一):LinkedIn 的分布式 NoSQL 存储 Espresso

数据库如何进行序列化和反序列化,如何进行索引设计?

Snowflake:云原生数仓的开创者 📘

存储

存储引擎概述和资料汇总 🔥

译:RocksDB 是如何工作的

RocksDB 优化小解(二):Prefix Seek 优化

RocksDB 优化小解(三):Async IO

大规模系统中使用 RocksDB 的一些经验

一文带你重新认识“宕机一致性”

现代操作系统最核心抽象之一 —— 文件 🔥

像推公式一样推出 LSM-Tree

大道至简,返璞归真——构建和维护星球最强对象存储系统的一点微小经验 🔥

数据处理

使用 ray.data 进行大规模数据处理(一):用户接口

使用 ray.data 进行大规模数据处理(二):全局视角

Spark:如何在云上做缩容 🔥

分布式系统

用 Raft 术语来表述 MultiPaxos 📘

Basic Paxos 再回首

流批一体 Apache Hudi (一):概念和架构速览 🔥

分布式存储系统在大数据处理中扮演着怎样的角色?

一文带你重新认识“宕机一致性”

“一文打尽” Google Borg(k8s 前身)的精华 —— 任务调度 🔥 📘

代码&编程基础

不变性——写“对”代码的利器

影响我写代码的三个 “Code” 🔥

Folly 异步编程之 futures

关于接口和实现

C++ 私有函数的 override

ErrorCode 还是 Exception ?

数据结构与算法(四):递归和迭代

所有递归都可以改写成循环吗?

为什么要学数据结构和算法?对程序员来说有多重要?

从零构造一个极简文件系统

从“丰巢”快递柜看 jemalloc 的内存管理 📘

每天学点数据库系列

【每天学点数据库】Lecture #14:查询优化概述

【每天学点数据库】Lecture #13:并行粒度

【每天学点数据库】Lecture #13: 并行执行

【每天学点数据库】Lecture #12:数据访问

【每天学点数据库】Lecture #12:执行模型

【每天学点数据库】Lecture #11:Join 算法

【每天学点数据库】Lecture #10: 排序和聚合算法

【每天学点数据库】Lecture #09:索引的并发安全

【每天学点数据库】Lecture #09:Locks 和 Latches

【每天学点数据库】Lecture #08:B+ 树的权衡和优化

【每天学点数据库】Lecture #07:哈希表概要

【每天学点数据库】Lecture #07:哈希模式

【每天学点数据库】Lecture #08:树型索引

【每天学点数据库】Lecture #06:内存管理

【每天学点数据库】Lecture #05:数据压缩

【每天学点数据库】Lecture #05:负载类型和存储模型

【每天学点数据库】Lecture #04:数据编码

【每天学点数据库】Lecture #04:日志构型存储

【每天学点数据库】Lecture #03:Data Layout

【每天学点数据库】Lecture #03: Database and OS

【每天学点数据库】Lecture #03:存储层次体系

【每天学点数据库】Lecture #01:关系代数

【每天学点数据库】Lecture #01:关系模型

【每天学点数据库】Lecture #01:数据模型

杂谈

生活工程学(一):多轮次拆解🔥

生活工程学(二):处理复杂依赖

系统中一些有趣的概念对

系统设计时的简洁和完备

工程经验的周期

关于“名字”拿来

Cache 和 Buffer 都是缓存有什么区别?

英国剑桥初次见闻(一)

从系统设定来聊聊最近看的一部动画

Y Combinator 2024 年关注 20 个创业领域

数学系列

有趣的线性代数(一):矩阵向量乘法的一种理解

有趣的线性代数(二):所谓空间

有趣的线性代数(三):方程求解中的“分治”思想

该专栏创作了以下内容

本专栏的正确“打开姿势”和“优惠信息”

内容主要来自 CMU 15445 Fall 2022 的课程讲义和授课视频,结合笔者的一些内核开发实践,形成一系列相对独立、但又相对勾连的小文。如果你对数据库内核开发感兴趣,欢迎关注。<…

【每天学点数据库】Lecture #14:代价估计

Memgraph 是一个内存型图数据库,使用 OpenCypher 作为查询语言,主打小数据量、低延迟的图场景。由于 Memgraph 是开源的(repo 在这,使用 C++ 实现)我们可以一窥…

Memgraph 系列(三):高效扫描和垃圾回收

引子在某些工作负载中,随着时间的推移,内存的使用会逐渐增长,直到 OOM。后面发现是内存碎片问题,而将系统默认的内存分配器(glibc malloc)换成 jemalloc ,能有效控制内存的增…

从“丰巢”快递柜看 jemalloc 的内存管理

Snowflake 由甲骨文的两位员工在 2012 年出来创办,一开始就瞄准云原生数仓,因此架构设计(在当时看来)非常“激进”。超前的视野带来超额的回报,Snowflake 在 2020 年正式…

Snowflake:云原生数仓的开创者

在云上进行大规模的数据处理时,做扩容很容易——只要觉得负载过高,加机器,调度新任务即可;但是缩容相对较麻烦,因为通常来说,一个节点通常不会只运行一个任务、还可能会有状态。计算碎片为…

Spark:如何在云上做缩容

ray.data 是基于 ray core 的一层封装。依赖 ray.data,用户用简单的代码,就可以实现数据大规模的异构处理(主要指同时使用 CPU 和 GPU)。一句话总结:很简单好用,同…

使用 ray.data 进行大规模数据处理(二):全局视角

由于对各种矩阵运算物理意义的理解总是跟不上,因此尽管多年多次尝试入门机器学习,却总是被拒之门外。偶然间同事推荐了 MIT 那门经典的线性代数公开课,听了几节,煞是过瘾,之前紧闭的大门竟有打开一丝…

有趣的线性代数(三):方程求解中的“分治”思想

由于对各种矩阵运算物理意义的理解总是跟不上,因此尽管多年多次尝试入门机器学习,却总是被拒之门外。偶然间同事推荐了 MIT 那门经典的线性代数公开课,听了几节,煞是过瘾,之前紧闭的大门竟有打开一丝…

有趣的线性代数(二):所谓空间

由于对各种矩阵运算物理意义的理解总是跟不上,因此尽管多年多次尝试入门机器学习,却总是被拒之门外。偶然间同事推荐了 MIT 那门经典的线性代数公开课,听了几节,煞是过瘾,之前紧闭的大门竟有打开一丝…

有趣的线性代数(一):矩阵向量乘法的一种理解

我之前在数据处理的大一统——从 Shell 脚本到 SQL 引擎这篇文章中提到过,进行数据处理的一个标准模型是:数据集标准化、算子可组合标准化的数据集合:对应待组装对…

相关的专栏

查看所有专栏 »

500精选量化策略源码解析持续更新是一本致力于帮助投资者高效构建和优化实盘策略的小册计划陆续发布500套量化交易策略从基础入门到高级应用涵盖多个市场标的本书包括多因子综合评分动量与股息率优选指数增强择

73 读者
105 文章

系统日知录会持续更新数据库分布式系统存储MLSystem相关的想法翻译笔记和文章通过深入浅出的持续解析帮助业务开发程序员建立底层知识体系写代码不是全部系统是综合学问不谋全局者不足谋一域不学系统者不足学

320 读者
112 文章

作者Keegan小钢公众号知乎B站等平台同名作者已在Web3领域深耕7年资深Web3技术专家本手册内容源自作者未完成的书籍稿件内容包括Web3基础智能合约技术和语言基础智能合约开发测试和部署标准Tok

584 读者
111 文章

欢迎订阅小白零基础入门股票量化小册1小编使用Python已经很多年累计在公众号上原创写了500多篇Python的案例也是量化的资深爱好者2所以想写一个小册从小白的角度浅浅介绍一下从零基础入门pytho

518 读者
46 文章

终身订阅C客户端埋点相关的SDK实战项目适合入门和进阶C的同学

305 读者
19 文章

这里是中文读者最多的Python技术周刊也是全世界知识密度最高知识广度最大的Python技术周刊没有之一自2023年5月连载至今口碑极佳好评如潮从全网挑选最值得分享的文章教程开源项目软件工具播客和视频

268 读者
75 文章