
[Android稳定性] 第039篇 [问题篇] 记几次判断为DDR不稳定导致的死机问题
一、问题背景 在我司工厂老化测试中,发现了多台机器死机的情况,经过一些分析判断被我评估为是DDR的问题,本篇文章就记录一下这几个案例,以及我判定为DDR问题的依据,供稳定性人员提供参考。 2025/04/24:更新案例:2.1章节 ~ 2.6章节 2025/05/13:更新新案例:2.7章节 ~ 2

[Android稳定性] 第036篇 [原理篇] 理解中断上下文、进程上下文以及进程调度之间的关系
一、三者概念的梳理 1.1 进程上下文(Process Context) 当内核代码是在为一个具体进程执行某项任务(比如响应系统调用)时,就是在“进程上下文”。 是普通用户或内核线程运行的上下文。 可以被调度、休眠、阻塞。 拥有完整的进程信息(task_struct)。 可以执行阻塞操作,比如 sl

【深入内核】Linux 内核栈详解:你所需要知道的一切
内核调试经常遇到栈溢出、Oops、watchdog 死锁等问题?内核栈搞不清楚会非常致命。这篇文章将用清晰的结构,带你彻底搞懂 Linux 的 内核栈 —— 什么是内核栈、为什么重要、常见误区、如何避免踩坑。 🧠 一、什么是内核栈? 内核栈(Kernel Stack)是 Linux 为每个线程在

[Android稳定性] 第035篇 [问题篇] 中断风暴触发watchdog bite
一、问题背景 出现的问题几乎必现 可以定位问题在屏幕,插上屏幕就不出现死机了 二、问题分析 2.1 查看dmesg_TZ.txt Line 2749: [ 1.572743][ T187] gh-watchdog hypervisor:qcom,gh-watchdog: wdog bark_

[Android稳定性] 第032篇 [原理篇] 高通平台 OCP & 组合键 Warm Reset 机制详解
一、引言 在基于 Qualcomm 平台的 Android 系统开发与调试过程中,常见的系统重启场景包括 Watchdog 重启、用户触发 reboot、按键长按重启等。而其中较为底层且难以捕捉的两种重启方式是: OCP(Over Current Protection)触发的 Warm Reset

[Android稳定性] 第031篇 [原理篇] Linux内核内存检测工具KASAN
copyright_author: 蜗窝科技 copyright_author_href: https://www.wowotech.net/ copyright_info: 此文章版权归 蜗窝科技 所有,如有转载,请注明来自原作者 copyright_url: https://www.wowote

[Android稳定性] 第029篇 [问题篇] 数组越界导致Unexpected kernel BRK exception at EL1
一、问题现象 高低温测试中出现两例死机问题,问题的指向于charger模块 二、问题分析 2.1 dmesg_TZ.txt 125008.185224: Unexpected kernel BRK exception at EL1 125008.185232: Internal error:

[Android稳定性] 第027篇 [问题篇] 数组越界导致Unexpected kernel BRK exception at EL1
一、问题背景 【复现概率】10/10 【前提条件】正常测试过程中 【复现步骤】电池温度达到35度 【预期结果】手机正常使用 【实际结果】手机进入dump 二、问题分析 2.1 dmesg_TZ.txt [ 492.250281][ T1879] [usbpd-pm]: usbpd_pm_

[linux内存管理] 第023篇 watermark详解
0. 前言 简单来说,在使用zoned page frame allocator分配页面时,会将可用的free pages与zone的watermark进行比较,以便确定是否分配内存。 同时watermark也用来决定kswapd内核线程的睡眠与唤醒,以便对内存进行检索和压缩处理。 回忆一下之前提到

[Android稳定性] 第026篇 [方法篇] 在windows平台安装Linux ramdump parser工具
一、安装python工具 前往网站(https://www.python.org/downloads/)下载python安装包,python >= 3.6.8即可 安装python工具到一个目录,比如:C:\Python36 进入到C:\Python36\Scripts目录中,使用pip指令安装库