Blog

amdgpu driver for AMD BC-250 Cyan Skillfish APU

好的，我们来详细解释一下这个 C 语言程序 cyan_skillfish_ppt.c(located at drivers/gpu/drm/amd/pm/swsmu/mu11)。程序总体概述这是一个为 AMD GPU 编写的 Linux 内核驱动程序的一部分。具体来说，它负责 AMD “Cyan Skillfish” 这款特定型号 GPU 的电源管理功能。 “Cyan Skillfish” 是 AMD 的一个 APU (加速处理单元) 的代号，这个文件是 amdgpu 开源驱动中的一部分，主要功能是让操作系统 (Linux) 能够与 GPU 内部一个叫做 SMU (System Management Unit, 系统管理单元) 的微控制器进行通信和交互。SMU 负责实时监控和控制 GPU 的电压、频率、温度和功耗等。简单来说，这个程序就是驱动和 GPU 硬件之间的“翻译官”，专门处理与性能和功耗相关的所有事务。主要功能和代码结构解析我们可以把这个文件的功能分为几个核心部分： 1. 定义硬件参数和常量程序首先定义了 Read more…

By Chris, 2 monthsSeptember 26, 2025 ago

Blog

access to amd gpu

AMD GPU：amdgpu（开源驱动）描述：AMD 的 amdgpu 内核模块（Radeon 系列的现代驱动）提供对 GPU 寄存器的直接访问，类似于 msr。它通过 debugfs 接口暴露寄存器读写，支持 MMIO（Memory-Mapped I/O）操作，用于调试硬件寄存器（如性能计数器、电源状态）。加载模块：textsudo modprobe amdgpu（通常内核默认加载，如果未加载，可在 /etc/modprobe.d/ 配置。）设备文件/接口：无专用 /dev 文件，但通过 debugfs 挂载点 /sys/kernel/debug/dri/0/（0 为 GPU 索引）访问。启用 debugfs：mount -t debugfs none /sys/kernel/debug。工具支持： rocm-smi（ROCm 平台）：AMD 的 System Management Interface，类似于 nvidia-smi。示例：读取 GPU 寄存器值（假设寄存器偏移为 0x1234）：textrocm-smi –showhw umr（AMD Micro-Register）：专用工具，用于读写 GPU 寄存器。安装：sudo apt install Read more…

By Chris, 2 monthsSeptember 21, 2025 ago

Blog

Linux’s MSR Module

在Linux中，MSR模块（Model-Specific Register module）是指与处理器特定的寄存器（Model-Specific Registers, MSRs）相关的内核模块或功能。MSRs是x86架构处理器中的一组特殊寄存器，用于控制和监控处理器的特定功能，例如性能计数、电源管理、调试、虚拟化支持等。这些寄存器因处理器型号而异，因此被称为“模型特定”。 MSR模块的主要作用 Linux内核中的msr模块（通常是msr.ko）提供了一种机制，允许用户空间程序通过特定的接口访问和操作处理器的MSRs。它通常用于以下场景：工作原理使用方式这会加载msr内核模块，并创建/dev/cpu/*/msr设备文件。注意事项典型应用总结 Linux中的msr模块是一个桥梁，允许用户空间程序与处理器的模型特定寄存器交互，主要用于性能监控、电源管理和低级调试。使用时需要root权限，并结合工具如msr-tools或直接操作设备文件。由于MSRs的复杂性和处理器依赖性，操作前需仔细查阅相关文档。

By Chris, 2 monthsSeptember 21, 2025 ago

Blog

BC-250 P-state problem

分析 /proc/cpuinfo 输出你提供的 /proc/cpuinfo 输出显示了系统中的一个 CPU 核心（处理器 0）的详细信息。结合之前的 ACPI 日志（疑似 Steam Deck，AMD 平台），可以确认这是一个基于 AMD 定制处理器的系统，具体型号为 AMD BC-250，可能是 Steam Deck 的 APU（Van Gogh 架构，Zen 2 核心 + RDNA 2 图形）。以下是对输出的详细分析，以及与 ACPI 日志的关联，尤其是关于电源管理和性能问题。 1. 基本信息 2. CPU 特性（Flags） flags 字段列出了 CPU 支持的指令集和特性，表明这是一个功能丰富的现代 AMD 处理器。以下是关键特性的说明： 3. 已知硬件漏洞（Bugs） 4. 电源管理（Power Management） 5. 与 Read more…

By Chris, 2 monthsSeptember 18, 2025 ago

Blog

AMD BC-250 SBC

AMD BC-250 also known as AMD 4700s. Features an AMD BC250 APU, codenamed ‘Ariel’, a cut-down variant of the APU in the PS5. It integrates 6x Zen 2 cores, at up to 3.49GHz (ish), as well as a 24CU RDNA2 iGPU (Codename ‘cyan-skillfish’), as opposed to the 36 available in Read more…

By Chris, 2 monthsSeptember 10, 2025 ago

Blog

AI的大模型训练和应用开发的几个主要领域

AI的大模型训练和应用开发分为几个主要领域： 1. 预训练 (Pre-training) ▪ 作用：这是AI模型的基石，通过“压缩”整个互联网数据，让模型学习并记住海量信息，从而决定模型的智能上限和基础能力。它定义了模型的架构（如Transformer、Attention、Encoder-Decoder），并在此阶段完成绝大部分算法层面的创新。 ▪ 人才需求：这一层主要由最顶级的AI研究员负责，他们通常需要博士学位和十年以上的深度学习、自然语言处理经验。这是一个“赢家通吃”的领域，全球只有少数大型实验室（如Google、Meta、Microsoft）和顶尖初创公司（如OpenAI、Anthropic、XAI）有能力进行基础大模型的预训练，投入巨大。 ▪ 市场价值：对应着最高的薪酬，可达数千万美元年薪。 ▪ 转型建议：对普通程序员而言，直接进入这一层难度极大，不建议作为主要转型方向。 2. 后训练 (Post-training) ▪ 作用：在预训练模型的基础上，进行与人类偏好对齐的训练，使其适应特定的应用场景（如法律、数学、编程）。这包括强化学习与人类反馈对齐 (RLHF)、自学习（如教师模型教学生模型）等新方法，以使模型输出更符合人类预期和情感需求。 ▪ 人才需求：这一层有大量的工程性问题。对于具备分布式系统经验或数据管道 (data pipeline) 经验的程序员，可以在训练框架开发等方向找到机会。 ▪ 市场价值：薪酬潜力与模型服务层相似，可达百万美元年薪。 ▪ 转型建议：这是一个有明确机会的转型方向，尤其是对于有强大分布式系统经验的程序员。 3. 模型服务 (Model Serving) ▪ 作用：将训练好的大模型高效地部署和运行，以支持互联网级别的用户请求和推理。这涉及到如何优化模型推理效率，降低成本，例如利用Flash Attention、推测解码 (speculative decoding)、参数并行化、以及多专家模型 (Mix of Experts) 的调度等。 ▪ Read more…

By Chris, 3 monthsAugust 25, 2025 ago

Blog

Install Ubuntu 25.04 and llama.cpp on Dell G5 SE 5505

the Dell G5 SE 5505 laptop has AMD Ryzen 5 4600H CPU with 6 cores, 8GB RAM and a AMD RX 5600m GPU.

By Chris, 3 monthsAugust 25, 2025 ago

Blog

Proxmox VE 服务器集群

将多个单独的 Proxmox VE 服务器集成到一个集群中，以实现资源共享、集中管理和高可用性等功能。以下是一个简要的指南，说明如何将两台独立的 Proxmox 服务器整合成一个集群：前提条件如有需要，更新到最新版本：集成步骤注意事项合并现有集群的情况如果两台服务器各自运行独立的 Proxmox 集群（而非单机），直接合并两个集群较为复杂，通常需要：具体步骤可参考 Proxmox 官方论坛的讨论。总结通过以上步骤，你可以将两台独立的 Proxmox 服务器整合成一个集群，实现资源共享和管理集中化。如果需要高可用性，建议配置共享存储并至少使用 3 个节点以提高稳定性。更多详细信息可参考 Proxmox 官方文档或相关教程。

By Chris, 3 monthsAugust 16, 2025 ago

Blog

BLAS and BLIS

BLAS 和 BLIS 都是用于科学计算中的线性代数库，专注于加速矩阵和向量运算。以下是它们的含义和区别： BLAS (Basic Linear Algebra Subprograms) BLIS (BLAS-like Library Instantiation Software) BLAS vs. BLIS 总结 BLAS 是经典的线性代数标准库，历史悠久但接口较老旧；BLIS 是其现代替代品，提供更高灵活性和性能，特别适合需要扩展功能或跨平台开发的场景。两者在科学计算中都至关重要，BLIS 被认为是未来趋势。

By Chris, 3 monthsAugust 15, 2025 ago

Blog

什么是GEMM

在人工智能中，GEMM 是 General Matrix Multiply（通用矩阵乘法）的缩写，指的是一种高效的矩阵乘法运算，通常表示为 C = αAB + βC，其中： GEMM 在人工智能中的重要性 GEMM 是深度学习和人工智能计算的核心操作之一，尤其在以下场景中广泛使用： GEMM 的优化由于 GEMM 是 AI 计算的瓶颈之一，优化其性能对加速深度学习模型至关重要。常见的优化方式包括： GEMM 的数学表示 GEMM 的通用形式为：[ C = \alpha \cdot (A \cdot B) + \beta \cdot C ]其中：例如，若 ( \alpha = 1, \beta = 0 )，则退化为标准矩阵乘法 ( C = A Read more…

By Chris, 3 monthsAugust 15, 2025 ago