Web Data Extraction Based on Partial Tree Alignment ———— 论文翻译
多态反序列化
JSON序列化/反序列化的工具非常多,Google的Gson、Alibaba号称世界最快的FastJson、实现了Java官方的JSON Binding API(JSR 367)的Eclipse Yasson和Apache Johnzon。
这些库始终都不如Jackson好用。不仅仅因为Jackson具有极致的可扩展性,可以无痛对接文本格式XML、csv, properties, yaml和二进制格式的avro, cbor, ion, protobuf, smile,还因为他有简单易用的多态反序列化功能。Gson等库实现多态反序列化做法非常的不优雅。
在nginx中安装并调试OpenResty
安装OpenResty相关模块
OpenResty是基于Lua即时编译器(LuaJIT)对Nginx进行扩展的模块——最核心的就是lua-nginx-module
这个模块。其他的都是OpenResty基于lua开发的相关模块,当然也可以基于lua开发自己的第三方模块。
在vscode中调试nginx源码
vscode调试nginx源码
ElasticSearch中_source、store_fields、doc_values性能比较
在这篇文章中,我想从性能的角度探讨ElasticSearch 为我们存储了哪些字段,以及在查询检索时这些字段如何工作。实际上,ElasticSearch和Solr的底层库Lucene提供了两种存储和检索字段的方式:store_fields
和doc_values
。此外,ElasticSearch默认提供了 _source
字段,这是在索引时由文档的所有字段构造的一个大json。
为什么 ElasticSearch使用 _source
字段作为默认值,所有这些可用的字段从性能的角度来看有什么区别?让我们一探究竟!
菜鸟教程引发的流量与产品的思考
对菜鸟教程网站的思考。菜鸟教程一个看上去很平常的网站,只是提供HTML、CSS、JS等Web相关的基础教程,但是据站长之家统计,这个网站的日流量达到接近300万的PV。
grpc在k8s中的负载均衡问题
线上skywalking架构: