
[Android稳定性] 第000篇 Android稳定性系列开篇
0. 前言 还是习惯性的以前言开篇,“深入骨髓”的程序猿思想,干啥事都想从main 开始~~ 1. 方法篇 [Android稳定性] 第001篇 [方法篇] 高通Android平台稳定性分析介绍 [Android稳定性] 第017篇 [方法篇] 高通watchdog分析流程 [Android稳定性]

高通平台xbl启动流程补充
这篇文章介绍了高通Android设备在启动过程中的XBL(eXtensible Boot Loader)阶段的详细启动流程。通过流程图和日志分析的方式,对XBL阶段的执行步骤进行了逐一解读,帮助理解从SBL到ABL之后的关键启动环节。

[Android稳定性] 第046篇 [方法篇] 如何使用trace32恢复AOP现场?
这篇文章介绍了使用hansei工具解析AOP/RPM以及使用trace32恢复AOP现场的过程,包括工具的获取、安装依赖库、执行工具、恢复前的准备工作以及恢复操作。

[Android稳定性] 第045篇 [问题篇] Kernel panic - not syncing: Attempted to kill init! exitcode=0x00007f00
一、问题背景 测试DDR TT和Reboot测试专项过程中出现机器进dump,dump根因都相同 二、问题分析 2.1 panic现场 [ 8.619016][ T138] ufshcd-qcom 4804000.ufshc: ufshcd_complete_dev_init fDevice

linux-dead-lock-detect-lockdep
一、死锁概念 死锁是指多个进程(线程)因为长久等待已被其他进程占有的的资源而陷入阻塞的一种状态。当等待的资源一直得不到释放,死锁会一直持续下去。死锁一旦发生,程序本身是解决不了的,只能依靠外部力量使得程序恢复运行,例如重启,开门狗复位等。 Linux 提供了检测死锁的机制,主要分为 D 状态死锁和

[Android稳定性] 第044篇 [问题篇] Unable to handle kernel write to read-only memory at virtual address
一、问题现象 老化测试时出现黑屏现象, 9/12: 今天已经确认的现象 使用9-11的版本 72台机器出现27 个黑屏,其中25个为USB问题引起的dump(2个是电量低关机),通过LOG分析是在老化45次重启测试的时候出问题(45次重启1个半小时),9-11版本带了高通的等待probe完成 wai

[Android稳定性] 第042篇 [问题篇] 数组越界导致的Unexpected kernel BRK exception at EL1
一、问题现象 在reboot压力测试中出现一台死机 二、问题分析 2.1 kernel calltrace [ 71.688270][ T120] Unexpected kernel BRK exception at EL1 [ 71.688280][ T120] Internal er

[Android稳定性] 第041篇 [问题篇] Unable to handle kernel paging request at virtual address 00046ffca9037bf9
问题现象 死机 分析步骤 [ 189.052980][ T5068] Unable to handle kernel paging request at virtual address 00046ffca9037bf9 [ 189.052991][ T5068] Mem abort info:

[Android稳定性] 第039篇 [问题篇] 记几次判断为DDR不稳定导致的死机问题
一、问题背景 在我司工厂老化测试中,发现了多台机器死机的情况,经过一些分析判断被我评估为是DDR的问题,本篇文章就记录一下这几个案例,以及我判定为DDR问题的依据,供稳定性人员提供参考。 2025/04/24:更新案例:2.1章节 ~ 2.6章节 2025/05/13:更新新案例:2.7章节 ~ 2

[Android稳定性] 第036篇 [原理篇] 理解中断上下文、进程上下文以及进程调度之间的关系
一、三者概念的梳理 1.1 进程上下文(Process Context) 当内核代码是在为一个具体进程执行某项任务(比如响应系统调用)时,就是在“进程上下文”。 是普通用户或内核线程运行的上下文。 可以被调度、休眠、阻塞。 拥有完整的进程信息(task_struct)。 可以执行阻塞操作,比如 sl