NoRipple

Java Serializable

Sun, 18 May 2025 00:00:00 GMT

序列化：将数据结构或对象转换成可以存储或传输的形式，通常是二进制字节流，也可以是 json、xml 等文本格式。

反序列化：将在序列化过程中所生成的数据转化为原始数据结构或者对象的过程。

序列化（serialization）在计算机科学的数据处理中，是指将数据结构或对象状态转换成可取用格式（例如存成文件，存于缓冲，或经由网络中发送），以留待后续在相同或另一台计算机环境中，能恢复原先状态的过程。依照序列化格式重新获取字节的结果时，可以利用它来产生与原始对象相同语义的副本。对于许多对象，像是使用大量引用的复杂对象，这种序列化重建的过程并不容易。面向对象中的对象序列化，并不概括之前原始对象所关系的函数。这种过程也称为对象编组（marshalling）。从一系列字节提取数据结构的反向操作，是反序列化（也称为解编组、deserialization、unmarshalling）。

常见序列化协议：

1. JDK

实现 JDK 自带的序列化，只需要实现 java.io.Serializable 接口即可。

Serializable 是标记接口，实现标记接口类仅仅是标记类为可序列化，并没有增加任何方法，该接口告诉 JVM 该类的对象已经准备好写入持久性存储或者通过网络读取。

静态变量不会被序列化，因为其不是对象本身的一部分。

默认情况，JVM 负责编写和读取可序列化对象的过程。序列化或者反序列化的功能通过对象流类的以下两种方法公开：

ObjectOutputStream writeObject(Object): 将可序列化的对象写入输出流。

ObjectInputStream readObject(): 从输入流读取（寻找到序列化类之后）构造并返回一个对象。

对于可序列化类需要注意两个成员变量：

serialVersionUID：常数，用于唯一标识可序列化类的版本。从输入流构造对象时，JVM 检查此常数。serialVersionUID是可选的，这意味着即使不显示声明，编译器会基于类的元素自动生成（如果元素变化，serialVersionUID 也会随之变化），这也是显示指明的优点，即类的修改不会导致序列化失败。

A serializable class can declare its own serialVersionUID explicitly by declaring a field named "serialVersionUID" that must be static, final, and of type long;

transient：标记瞬时变量，JVM 不会序列化并存储此变量值，在反序列化后变量值被设置为类型默认值。

不推荐使用

CDN

Sun, 18 May 2025 00:00:00 GMT

Control Delivery Network，即内容分发网络。

所谓内容指的是静态资源，比如图片、视频、文档、js、css、html。

所谓分发网络指的是讲这些静态资源分发到位于多个不同地理位置的机房中的服务器上，以实现静态资源的就近访问。

CDN 就是将静态资源分发到不同的地方以实现对应地区的就近访问，进而加快静态资源的访问速度，减轻服务器以及带宽的负担。

也可以将其视作服务上一层特殊缓存，主要用来处理静态资源。

ECDN / DCDN

同时加速动态资源和静态资源。动态加速是指对于那些不能缓存在边缘节点的资源，动态资源基于智能选路技术，从多条回源线路中择优选择一条线路进行传输。
支持边缘计算。

CDN

加速静态资源。
支持边缘计算。

其实实现资源的就近访问还可以直接将服务部署在不同地区，但这样做会出现两个问题。一是成本太高，这不言自明；二是性能影响，静态资源的访问对系统资源的大到足以影响到系统中的其他服务。这种行为主要是实现系统的高可用而非高性能。

静态资源缓存 CDN 节点。

回源当 CDN 节点上没有用户请求的资源或该资源的缓存已经过期时，CDN 节点需要从原始服务器获取最新的资源内容，这个过程就是回源。当用户请求发生回源的话，会导致该请求的响应速度比未使用 CDN 还慢，因为相比于未使用 CDN 还多了一层 CDN 的调用流程。

预热指在 CDN 上提前将内容缓存到 CDN 节点上。这样当用户在请求这些资源时，能够快速地从最近的 CDN 节点获取到而不需要回源，进而减少了对源站的访问压力，提高了访问速度。

刷新如果资源有更新的话，你也可以对其刷新，删除 CDN 节点上缓存的旧资源，并强制 CDN 节点回源站获取最新资源。

命中率和回源率是衡量 CDN 服务质量的重要指标。

服务定位 CDN 节点。

Global Server Load Balance，全局负载均衡。

负责多个 CDN 节点之间相互协作，最常用的是基于 DNS 的 GSLB。

CDN 会通过 GSLB 找到最合适的 CDN 节点

防止静态资源盗用。
Referer 防盗链，具体来说就是根据 HTTP 请求的头信息里面的 Referer 字段对请求进行限制。我们可以通过 Referer 字段获取到当前请求页面的来源页面的网站地址，这样我们就能确定请求是否来自合法的网站。
时间戳防盗链的 URL 通常会有两个参数一个是签名字符串，一个是过期时间。签名字符串一般是通过对用户设定的加密字符串、请求路径、过期时间通过 MD5 哈希算法取哈希的方式获得。

JVM

Sun, 18 May 2025 00:00:00 GMT

基础知识

JVM 本质上是一个运行在计算机上的程序，主要职责是解释运行、内存管理和即时编译。

JVM 遵循 JVM 虚拟机规范，各大厂家研发不同版本。本文章讨论的是 hotspot(oracle jdk

字节码文件

基本信息

Nginx

Sun, 18 May 2025 00:00:00 GMT

Nginx 功能与配置

2.1 master-worker

正式提供服务的产品环境下，部署 Nginx 使用一个 master 进程管理若干 worker 进程，一般情况下，worker 进程数量等同于服务器的 CPU 核心数。

worker 进程真正提供互联网服务。

master 负责监控 worker 进程。

当然 Nginx 支持单进程提供服务（master），采用 master-workers 的好处：

master 可以专注于管理，并且为程序员提供命令行服务。

worker 可以充分利用常见 SMP 多核架构，从而实现围观上真正的并发处理。

为什么要把worker进程数量设置得与CPU核心数量一致呢？

Tomcat

Sun, 18 May 2025 00:00:00 GMT

参考 java - Tomcat 架构原理解析到架构设计借鉴 - 个人文章 - SegmentFault 思否。

Tomcat 可以视作 HTTP解析器 + Servlet容器。

主要作用是屏蔽应用层协议和网络通信细节，将网络数据流转换为 Servlet Request 和 Servlet Response 对象。

简单描述 Tomcat 的结构。

Tomcat Server 对应 Service，Service 中包含 Connector 和 Container。

对于不同类型的网络连接，Tomcat 使用不同的 Connector 处理并输出到唯一的 Container。

Connector：HTTP 解析器

主要职责是网络通信、应用层协议解析、对象转换。

ProtocolHandler

Endpoint

Kakfa

Sun, 18 May 2025 00:00:00 GMT

Intro

distributed event streaming platform

as meaaage queue or as stream processing system

Kafka 擅长提供高性能、可扩展性和耐用性。他旨在实时处理大量数据，不会丢失任何信息，并且尽可能快速地处理每条数据。

Basic Terminology and Architecture

Broker

A Kafka cluster is made up of multiple brokers.These are just individual servers (physical or virtual)

Partition

Each Broker has a number of partitions.

Each partition is an ordered, immutable sequence of messages that is continually appended to.

Partitions are the way Kafka scales as they allow for sth. for meaagaed to be consumed in parallel.

Each partition in Kafka functions essentially as an append-only log file. Messages are sequentially added to the end of this log, which is why Kafka is commonly described as a distributed commit log. This append-only design is central to Kafka’s architecture, providing several important benefits:

Immutability: Once written, messages in a partition cannot be altered or deleted. This immutability is crucial for Kafka’s performance and reliability. It simplifies replication, speeds up recovery processes, and avoids consistency issues common in systems where data can be changed.

Efficiency: By restricting operations to appending data at the end of the log, Kafka minimizes disk seek times, which are a major bottleneck in many storage systems.

Scalability: The simplicity of the append-only log mechanism facilitates horizontal scaling. More partitions can be added and distributed across a cluster of brokers to handle increasing loads, and each partition can be replicated across multiple brokers to enhance fault tolerance.

Each message in a Kafka partition is assigned a unique offset, which is a sequential identifier indicating the message’s position in the partition.

This offset is used by consumers to track their progress in reading messages from the topic. As consumers read messages, they maintain their current offset and periodically commit this offset back to Kafka. This way, they can resume reading from where they left off in case of failure or restart.

Topic

A logical grouping of partitions.

Topics are the way you publish and subscrible to data in Kafka.

Topics are always multi-producer; that is, a topic can have zero, one, or many producers that write data to it.

The difference between a topic and a partition