Ceph
Ceph 是一个Linux 的 PB 级分布式文件系统,提供块、文件和对象存储三个层次的抽象,并已部署在大规模生产集群中。
局部敏感哈希是为了解决一个核心问题:在海量数据中快速找到相似或近似的项目,避免进行代价高昂的“两两比较”。
想象一下,你有几百万张图片、几百万篇文档,或者几亿个用户的行为记录。你想找出相似的图片、相似的文档,或者兴趣相似的用户。如果每对数据都去精确计算它们的相似度(比如余弦相似度、Jaccard相似系数),那计算量是天文数字。这就是 LSH 这类技术大展身手的地方。
我记得很早之前,我写过一篇文章,介绍CentOS中引入的Systemd,后面我又从CentOS切换到了Debian,今天服务器又碰到了一个事故,用ChatGPT重温了一下Systemd的演变历史。
Linux 启动系统(init system)的演进过程体现了 Linux 从“能用”到“高效现代”的重大变革。
之前在用SeaORM来进行数据持久化,一直没有什么好的解决方案来集成PgVector合SeaORM,这两天在讨论区看到一篇文章:Using pgVector with SeaORM in Rust
这篇文章值得学习一下
2021年写过一篇文章解决自己服务器CentOS7 yum源中软件版本过低的问题。到2025年,选择 Debian 还是 CentOS 已经不需要再多说了。
2020年,红帽公司宣布,将在2021年12月31日和2024年6月30日分别终止对CentOS 8和CentOS 7的服务支持,把CentOS项目的工作和投资集中在CentOS Stream上,以进一步推动Linux创新。