Eczn's Home

<|im_start|>

2026

请输入文本？谈谈 TTS 的生成效果

这几天配合 GPT-SoVITS 微调了 TTS 模型，效果超出预期，可能不久的将来 AI 语音就能达到人类水平(?)，特别是经过深度调教的。本文将给出步骤参考学习，并着重介绍綾地寧々的 TTS 语音效果【建议使用耳机/宅向内容警告⚠️】

2026.08.01·eczn·278.8 KB

ECZN 给 SICP 作序

计算机程序的构造和解释，全称《Structure and Interpretation of Computer Programs》，简称 SICP，以 Scheme 语言为基础讲解了计算机程序的构造和解释，在很大程度上影响了我对编程语言的理解和认知，本文是我在看完 SICP 并工作了数年之后，出于喜好专门为其作的一篇序，如果能看下来并感到有意思，那么你很可能是这本书最适合阅读的人群；反之如果你认为没意思，此书可能不适合你，作序的目标就在于此：15 分钟看完序来判断这本书适不适合你，值不值得花费几十甚至数百个小时的投入

2026.07.16·eczn·73.3 KB

2026.05.27未分类标题

得分与注意力

eczn·23.5 KB

大模型与交叉熵

今天补充一篇关于训练的，介绍大模型损失函数内最重要的一个数学对象：交叉熵，来源于信息论，在大模型中应用广泛，可以说是除了注意力机制之外最核心的数学建模了。然而市面上关于交叉熵的文章多数在堆砌概念，看了只会让我感到不安，靠比喻是没有形成自洽且体系化理解的。

2026.05.10·eczn·127.5 KB

实现 GPT-2 的推理

以 GPT-2 为对象，用纯 TypeScript 从零手写完整推理过程，从 tokenizer 到 embedding，从 attention 到 softmax，不依赖任何推理框架，在 V8 + Float32Array 内跑通 38.6M 参数的模型前向传播以及相关的张量操作

2026.05.05·eczn·373.0 KB

2026.04.17未分类标题

Tool Use 具体是如何实现的 ?

eczn·92.6 KB

2025

「大模型」的推理是什么?

八年前我还在读本科的时候，修过一门关于神经网络与模式识别的课程，虽然这门课不用怎么写代码，但是其内在的思想我到今天还是记忆深刻；近 2 年来，ChatGPT 后大模型是越来越火热了，其内在的核心仍然是神经网络，如果需要搞明白大模型的推理，其实就是在问神经网络如何解决问题？本文将介绍神经网络的基本构造并解释大模型的推理是什么，从 $y = kx + b$ 出发自底向上构建对大模型的数学认知，最后会从技术的角度上点评下现在流行的一些 AI 术语

2025.12.22·eczn·500.8 KB

2025.06.29未分类标题

公式编辑器 ?

eczn·2.6 KB

2025.03.19EcznScript

EcznScript ?

eczn·46.9 KB

2025.01.01艺术

AI 绘画管线实践 250101

eczn·4.4 KB

2024

2024.12.31未分类标题

24 年底的简单记录

eczn·4.8 KB

2024.12.02未分类标题

柏林噪声的原理和实现

eczn·111.0 KB

2024.09.01未分类标题

TypeScript 52000+ 行的 checker.ts

eczn·31.1 KB

2024.07.03注意力训练

注意力训练代数视角里的类型

eczn·4.7 KB

V8 Inline Caches 优化及其汇编细节

前段时间工作重心在性能优化，着重看了 V8 相关的优化细节，尤其是 Inline Caches (ICs) 技术，后面依据这项技术将核心指标性能优化到原来的十倍，这里记录一下 ICs 相关细节，仅供参考: 解释器手写的 line-by-line 虚拟机执行流水线完全比不上 CPU 内部的指令流水线以及更为夸张的分支预测手段，因此我个人过去认为 C 至少比 JS 快 10 倍+，直到最近看了不少的 v8 benchmark 之后才对这块有所改观，目前的观点是：只要构造合适，V8 JIT 可以有媲美原生 AOT 的性能，当然也容易出现非常夸张的性能劣化。

2024.06.30·eczn·92.9 KB

2024.05.08注意力训练