文章小改

This commit is contained in:
2025-09-29 00:23:53 +08:00
parent 644608c8d8
commit 0cd284d32d
2 changed files with 20 additions and 47 deletions

View File

@@ -83,13 +83,22 @@ publish: true
</div> </div>
我第一次接触到这类虚拟货币不是搞投资也不是炒币。因为有很多国外的服务要充值比如ChatGPTClaude。有些服务虽然是白嫖的但是还是需要卡里有钱来验证。但是实体卡是开不了的只能找虚拟卡。常见的虚拟卡都是和虚拟币挂钩的不过现在想想确实虚拟币解决了跨境支付的问题。 &emsp;&emsp;我第一次接触到这类虚拟货币不是搞投资也不是炒币。因为有很多国外的服务要充值比如ChatGPTClaude。有些服务虽然是白嫖的但是还是需要卡里有钱来验证。但是实体卡是开不了的只能找虚拟卡。常见的虚拟卡都是和虚拟币挂钩的不过现在想想确实虚拟币解决了跨境支付的问题。
我唯一受益的点在于能避开各类政策和法律的围堵,然后把钱给到中介,中介又帮我把钱给到商家。但是对于炒作虚拟币,似乎不太行,因为虚拟货币的价值似乎一直是个迷。 &emsp;&emsp;我唯一受益的点在于能避开各类政策和法律的围堵,然后把钱给到中介,中介又帮我把钱给到商家。但是对于炒作虚拟币,似乎不太行,因为虚拟货币的价值似乎一直是个迷。
基于我浅陋的认知,我来举个小小的例子:如果我来发行一个虚拟货币,就叫辛木币,如果做成和比特币一样的机制,那么就可以通过挖矿来计算出区块,然后基于辛木币的规则给这个人发币。但是最为重点的价格何来呢?这来自于**价值共识**。技术上的共识机制如PoW保证了辛木币无法被伪造和双花但它的市场价格则需要大家都认可它的价值才有用。比如此时我和我开的便利店店挂钩你可以用一辛木币来换一瓶水早期挖矿效率极高工作量证明也越多。后面慢慢的很多大老板都有了我的辛木币他们也支持辛木币交易那么辛木币的价值在这个圈子里面就慢慢升值了。只要这个圈子够大辛木币的价值够大就和今天的比特币一样。说到虚拟货币几乎都知道比特币。 &emsp;&emsp;基于我浅陋的认知,我来举个小小的例子:如果我来发行一个虚拟货币,就叫**辛木币**,如果做成和比特币一样的机制,那么就可以通过挖矿来计算出区块,然后基于**辛木币**的规则给这个人发币。但是最为重点的价格何来呢?这来自于**价值共识**。技术上的共识机制如PoW保证了**辛木币**无法被伪造和双花,但它的市场价格,则需要大家都认可它的价值才有用。比如此时我和我开的便利店店挂钩,你可以用一**辛木币**来换一瓶水(早期挖矿效率极高,工作量证明也越多)。后面慢慢的很多大老板都有了我的**辛木币**,他们也支持**辛木币**交易,那么**辛木币**的价值在这个圈子里面就慢慢升值了。只要这个圈子够大,**辛木币**的价值够大,就和今天的比特币一样。说到虚拟货币,几乎都知道比特币。
那么在价值挂钩这一步是不是可以是黄金期权股权石油……现在的稳定币就是和美元挂钩挖矿机制也和比特币的挖矿不一样了。比特币纯靠GPU计算哈希值稳定币的挖矿就靠质押靠股权如USDT的PoS股权证明也靠兑换GUSD的美元兑换 &emsp;&emsp;那么在价值挂钩这一步是不是可以是黄金期权股权石油……现在的稳定币就是和美元挂钩挖矿机制也和比特币的挖矿不一样了。比特币纯靠GPU计算哈希值稳定币的挖矿就靠质押靠股权如USDT的PoS股权证明也靠兑换GUSD的美元兑换
(没写完,后面慢慢写)……………………………… <div align="center">
## 贰
</div>
&emsp;&emsp;反正都是随便讲讲再来说说交易所和web3钱包。其实我损失过一个web3钱包因为我忘记助记词了。还好那个卡可以直接扣费所以就挂支付宝刷了。交易所顾名思义和股票、证券的交易所一样不过这个炒的是虚拟货币。一般用到的就是C2C交易给人发法币获得虚拟币或者给人发虚拟币换法币。或者是闪兑用一种虚拟币换另外一种虚拟币。
&emsp;&emsp;然后就是这个神奇的Web3钱包他居然只需要用助记词就可以绑定一个钱包了但是失去助记词等于失去了这个钱包连官方都无法恢复。所以助记词不能泄露也不能忘记他是加密钱包的私钥。

View File

@@ -32,7 +32,7 @@ recommend: true
--- ---
## 2. vLLM 的总体架构(抓主线) ## 2. vLLM 的总体架构
* **LLMEngine**一次迭代做三件事`schedule()` `execute_model()` `process_outputs()` * **LLMEngine**一次迭代做三件事`schedule()` `execute_model()` `process_outputs()`
@@ -42,11 +42,11 @@ recommend: true
--- ---
## 3. 调度器原理continuous batching ## 3. 调度器原理
### 3.1 核心策略 ### 3.1 核心策略
* **Iteration-levelcontinuous batching**每生成一个 token **重新调度**因此 batch 大小可变 * **Iteration-level**每生成一个 token **重新调度**因此 batch 大小可变
* **阶段区分**vLLM 将请求分为 **Prefill填充** **Decode生成** 两类批次**同一轮只处理同一阶段**。 * **阶段区分**vLLM 将请求分为 **Prefill填充** **Decode生成** 两类批次**同一轮只处理同一阶段**。
### 3.2 三个队列 ### 3.2 三个队列
@@ -69,7 +69,7 @@ recommend: true
--- ---
## 4. Worker 原理(模型执行链路) ## 4. Worker 原理
### 4.1 角色与初始化 ### 4.1 角色与初始化
@@ -95,7 +95,7 @@ recommend: true
--- ---
## 5. Prefill vs Decode(执行特点与调优,展开版) ## 5. Prefill & Decode
### Prefill填充阶段 ### Prefill填充阶段
@@ -125,47 +125,11 @@ recommend: true
--- ---
## 6. TP PP:概念、区别与 vLLM 现状 ## 6. TP & PP
* **TPTensor Parallelism**层内张量切分通信频繁适合实时推理 * **TPTensor Parallelism**层内张量切分通信频繁适合实时推理
* **PPPipeline Parallelism**层间切分通信少但需流水线调度更多见于训练 * **PPPipeline Parallelism**层间切分通信少但需流水线调度更多见于训练
* **vLLM 支持**TP 是主力PP 支持有限
---
## 7. 关键流程串讲
### Prefill 批
1. waiting 进入 runningBlockSpaceManager 分配块
2. Worker `_prepare_prompt` FlashAttn 写入 KV
3. Sampler 采样首 token
### Decode 批
1. Scheduler 选择 running 序列
2. `_append_slot` KV
3. Worker PagedAttention 输出
4. 采样 EOS/长度 释放序列
---
## 8. 参数与调优清单
* **`block_size`**16权衡碎片与索引开销
* **`gpu_memory_utilization`**估算可分配 KV预留峰值空间
* **`max_num_seqs`**提升解码并发
* **`max_num_batched_tokens`**限制长 prompt
* **`swap_space_bytes`**CPU 交换空间优先考虑 Recompute
* **采样参数**top-k/top-p/温度/惩罚影响解码步数
* **CUDA Graph**捕获稳定批降低开销
---
## 9. 可讲的亮点/考点总结
1. **PagedAttention**block + 块表管理解决碎片问题
2. **continuous batching** token 重调度提升吞吐
3. **Recompute vs Swap**计算 vs 带宽权衡
4. **TP 优先PP 备选**
5. **Prefill vs Decode**不同执行路径与瓶颈决定不同调优抓手