百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

鸿蒙内核源码分析:调度机制篇

lipiwang 2024-12-01 00:42 5 浏览 0 评论

作者 | 深入研究鸿蒙,鸿蒙内核发烧友

出品 | CSDN(ID:CSDNnews)

头图 | CSDN 下载自东方 IC

阅读之前建议先读本系列其他文章,以便对本文任务调度机制的理解。

为什么要学这么多的相关概念?

鸿蒙的内核中 Task 和 线程 在广义上可以理解为是一个东西,但狭义上肯定会有区别,区别在于管理体系的不同,Task是调度层面的概念,线程是进程层面概念。比如 main 函数中首个函数 OsSetMainTask; 就是设置启动任务,但此时啥都还没开始呢,Kprocess 进程都没创建,怎么会有大家一般意义上所理解的线程呢。狭义上的后续有 鸿蒙内核源码分析(启动过程篇) 来说明。不知道大家有没有这种体会,学一个东西的过程中要接触很多新概念,尤其像 Java/android 的生态,概念贼多,很多同学都被绕在概念中出不来,痛苦不堪。那问题是为什么需要这么多的概念呢?

举个例子就明白了:

假如您去深圳参加一个面试老板问你哪里人?你会说是江西人,湖南人... 而不会说是张家村二组的张全蛋,这样还谁敢要你。但如果你参加同乡会别人问你同样问题,你不会说是来自东北那旮沓的,却反而要说张家村二组的张全蛋。明白了吗?张全蛋还是那个张全蛋,但因为场景变了,您的说法就得必须跟着变,否则没法愉快的聊天。程序设计就是源于生活,归于生活,大家对程序的理解就是要用生活中的场景去打比方,更好的理解概念。

那在内核的调度层面,咱们就说 task, task 是内核调度的单元,调度就是围着它转。

进程和线程的状态迁移图

先看看 task 从哪些渠道产生:

渠道很多,可能是 shell 的一个命令,也可能由内核创建,更多的是大家编写应用程序 new 出来的一个线程。

调度的内容 task 已经有了,那他们是如何有序的被调度?答案:是32个进程和线程就绪队列,各32个哈,为什么是32个,鸿蒙系统源码分析其他文章里有详细说明,自己去翻。这张进程状态迁移示意图一定要看明白,线程的状态迁移大家去官方文档看,不一一列出来,太多了占地方。

注意:进程和线程的队列内的内容只针对就绪状态,其他状态内核并没有用队列去描述它,(线程的阻塞状态用的是 pendlist 链表),因为就绪就意味着工作都准备好了就等着被调度到 CPU 来执行了。所以理解就绪队列很关键,有三种情况会加入就绪队列。

  • Init → Ready:

    进程创建或 fork 时,拿到该进程控制块后进入 Init 状态,处于进程初始化阶段,当进程初始化完成将进程插入调度队列,此时进程进入就绪状态。

  • Pend → Ready / Pend → Running:

    阻塞进程内的任意线程恢复就绪态时,进程被加入到就绪队列,同步转为就绪态,若此时发生进程切换,则进程状态由就绪态转为运行态。

  • Running → Ready:

    进程由运行态转为就绪态的情况有以下两种:

  • 有更高优先级的进程创建或者恢复后,会发生进程调度,此刻就绪列表中最高优先级进程变为运行态,那么原先运行的进程由运行态变为就绪态。

  • 若进程的调度策略为 SCHED_RR,且存在同一优先级的另一个进程处于就绪态,则该进程的时间片消耗光之后,该进程由运行态转为就绪态,另一个同优先级的进程由就绪态转为运行态。

谁来触发调度工作?

就绪队列让 task 各就各位,在其生命周期内不停的进行状态流转,调度是让 task 交给 CPU 处理,那又是什么让调度去工作的呢?它是如何被触发的?

笔者能想到的触发方式是以下四个:

  • Tick (时钟管理),类似于 JAVA 的定时任务,时间到了就触发。系统定时器是内核时间机制中最重要的一部分,它提供了一种周期性触发中断机制,即系统定时器以 HZ(时钟节拍率)为频率自行触发时钟中断。当时钟中断发生时,内核就通过时钟中断处理程序 OsTickHandler 对其进行处理。鸿蒙内核默认是10ms触发一次,执行以下中断函数:

/* * Description : Tick interruption handler */LITE_OS_SEC_TEXT VOID OsTickHandler(VOID){ UINT32 intSave; TICK_LOCK(intSave); g_tickCount[ArchCurrCpuid()]++; TICK_UNLOCK(intSave);#ifdef LOSCFG_KERNEL_VDSO OsUpdateVdsoTimeval;#endif#ifdef LOSCFG_KERNEL_TICKLESS OsTickIrqFlagSet(OsTicklessFlagGet);#endif#if (LOSCFG_BASE_CORE_TICK_HW_TIME == YES) HalClockIrqClear; /* diff from every platform */#endif OsTimesliceCheck; OsTaskScan; /* task timeout scan *///*kyf 任务扫描,发起调度#if (LOSCFG_BASE_CORE_SWTMR == YES) OsSwtmrScan;#endif}

里面对任务进行了扫描,时间片到了或就绪队列有高或同级task, 会执行调度。

  • 第二个是各种软硬中断,如何USB插拔,键盘,鼠标这些外设引起的中断,需要去执行中断处理函数。

  • 第三个是程序主动中断,比如运行过程中需要申请其他资源,而主动让出控制权,重新调度。

  • 最后一个是创建一个新进程或新任务后主动发起的抢占式调度,新进程会默认创建一个main task, task的首条指令(入口函数)就是我们上层程序的main函数,它被放在代码段的第一的位置。

  • 哪些地方会申请调度?看一张图。

这里提下图中的 OsCopyProcess, 这是fork进程的主体函数,可以看出fork之后立即申请了一次调度。

LITE_OS_SEC_TEXT INT32 LOS_Fork(UINT32 flags, const CHAR *name, const TSK_ENTRY_FUNC entry, UINT32 stackSize){ UINT32 cloneFlag = CLONE_PARENT | CLONE_THREAD | CLONE_VFORK | CLONE_FILES; if (flags & (~cloneFlag)) { PRINT_WARN("Clone dont support some flags!\n"); } flags |= CLONE_FILES; return OsCopyProcess(cloneFlag & flags, name, (UINTPTR)entry, stackSize);}STATIC INT32 OsCopyProcess(UINT32 flags, const CHAR *name, UINTPTR sp, UINT32 size){ UINT32 intSave, ret, processID; LosProcessCB *run = OsCurrProcessGet; LosProcessCB *child = OsGetFreePCB; if (child == ) { return -LOS_EAGAIN; } processID = child->processID; ret = OsForkInitPCB(flags, child, name, sp, size); if (ret != LOS_OK) { goto ERROR_INIT; } ret = OsCopyProcessResources(flags, child, run); if (ret != LOS_OK) { goto ERROR_TASK; } ret = OsChildSetProcessGroupAndSched(child, run); if (ret != LOS_OK) { goto ERROR_TASK; } LOS_MpSchedule(OS_MP_CPU_ALL); if (OS_SCHEDULER_ACTIVE) { LOS_Schedule;//*kyf 申请调度 } return processID;ERROR_TASK: SCHEDULER_LOCK(intSave); (VOID)OsTaskDeleteUnsafe(OS_TCB_FROM_TID(child->threadGroupID), OS_PRO_EXIT_OK, intSave);ERROR_INIT: OsDeInitPCB(child); return -ret;}

原来创建一个进程这么简单,真的就是在 COPY ! 这里抛个问题请大家思考,为何 创建进程用 copy ,创建线程用 new ?

源码告诉你调度过程是怎样的

以上是需要提前了解的信息,接下来直接上源码看调度过程吧,文件就三个函数,主要就是这个了:

VOID OsSchedResched(VOID){ LOS_ASSERT(LOS_SpinHeld(&g_taskSpin));//*kyf 调度过程要上锁 newTask = OsGetTopTask; //*kyf 获取最高优先级任务 OsSchedSwitchProcess(runProcess, newProcess);//*kyf 切换运行的进程 (VOID)OsTaskSwitchCheck(runTask, newTask); OsCurrTaskSet((VOID*)newTask);//*kyf 设置当前任务 if (OsProcessIsUserMode(newProcess)) { OsCurrUserTaskSet(newTask->userArea);//*kyf 运行空间 } /* do the task context switch */ OsTaskSchedule(newTask, runTask); //*kyf 切换任务上下文}

函数有点长,笔者留了最重要的几行,看这几行就够了,流程如下:

  1. 调度过程要自旋锁,不允许任何中断发生,没错,说的是任何事是不能去打断它,否则后果太严重了,这可是内核在切换进程和线程的操作啊。

  2. 在就绪队列里找个最高优先级的 task

  3. 切换进程,就是 task/线程 归属的那个进程为当前进程,这里要注意,老的 task 和老进程只是让出了 CPU 指令执行权,其他都还在内存。

  4. 设置新任务为当前任务

  5. 用户模式下需要设置 task 运行空间,因为每个 task 栈是不一样的

  6. 是最重要的,切换任务上下文,参数是新老两个任务,一个要保存现场,一个要恢复现场。

什么是任务上下文?看鸿蒙系统源码分析其他文章,有专门的介绍。这里要说明的是在 CPU 的层面,它只认任务上下文!这里看不到任何代码了,因为这是跟 CPU 相关的,不同的 CPU 需要去适配不同的汇编代码,所以这些汇编代码不会出现在一个通用工程中。请留意后续鸿蒙内核源码分析(汇编指令篇)。

请读懂内核最美函数 OsGetTopTask

最后留个作业,读懂这个笔者认为的内核最美函数,就明白了就绪队列是怎么回事了。这里提下 goto 语句,几乎所有内核代码都会大量的使用 goto 语句,鸿蒙内核有617个 goto 远大于264个 break ,还有人说要废掉 goto,你知道内核开发者青睐 goto 的真正原因吗?

LITE_OS_SEC_TEXT_MINOR LosTaskCB *OsGetTopTask(VOID){ UINT32 priority, processPriority; UINT32 bitmap; UINT32 processBitmap; LosTaskCB *newTask = ;#if (LOSCFG_KERNEL_SMP == YES) UINT32 cpuid = ArchCurrCpuid;#endif LosProcessCB *processCB = ; processBitmap = g_priQueueBitmap; while (processBitmap) { processPriority = CLZ(processBitmap); LOS_DL_LIST_FOR_EACH_ENTRY(processCB, &g_priQueueList[processPriority], LosProcessCB, pendList) { bitmap = processCB->threadScheduleMap; while (bitmap) { priority = CLZ(bitmap); LOS_DL_LIST_FOR_EACH_ENTRY(newTask, &processCB->threadPriQueueList[priority], LosTaskCB, pendList) {#if (LOSCFG_KERNEL_SMP == YES) if (newTask->cpuAffiMask & (1U << cpuid)) {#endif newTask->taskStatus &= ~OS_TASK_STATUS_READY; OsPriQueueDequeue(processCB->threadPriQueueList, &processCB->threadScheduleMap, &newTask->pendList); OsDequeEmptySchedMap(processCB); goto OUT;#if (LOSCFG_KERNEL_SMP == YES) }#endif } bitmap &= ~(1U << (OS_PRIORITY_QUEUE_NUM - priority - 1)); } } processBitmap &= ~(1U << (OS_PRIORITY_QUEUE_NUM - processPriority - 1)); }OUT: return newTask;}#ifdef __cplusplus#if __cplusplus}

原文地址:https://blog.csdn.net/kuangyufei/article/details/108705968

点分享

相关推荐

Qwen上新AI前端工程师!一句话搞定HTML/CSS/JS,秒变React大神

梦晨发自凹非寺量子位|公众号QbitAIQwen上新“AI前端工程师”WebDev,一句话开发网页应用。三大件HTML,CSS,JavaScript一个工具全包了,定睛一看用的还是Reac...

程序员的 JavaScript 代码该如何让计算机搞懂?

出自程序员之手的JavaScript代码,该如何变成计算机所能理解的机器语言呢?本文将带你走进JavaScript引擎内部,一探究竟。作者|LydiaHallie译者|弯月,责编|...

JavaScript:如何优雅的创建数组?

在JavaScript里,有多种方式可以创建数组,下面为你详细介绍:1.使用数组字面量这是最常用的创建数组的方法,使用方括号[]来创建数组。//创建一个空数组letemptyArray...

Jquery 详细用法

1、jQuery介绍(1)jQuery是什么?是一个js框架,其主要思想是利用jQuery提供的选择器查找要操作的节点,然后将找到的节点封装成一个jQuery对象。封装成jQuery对象的目的有...

HTML页面基本结构和加载过程

大家好,我是皮皮。前言对于前端来说,HTML都是最基础的内容。今天,我们来了解一下HTML和网页有什么关系,以及与DOM有什么不同。通过本讲内容,你将掌握浏览器是怎么处理HTML内容的,...

【HarmonyOS Next之旅】兼容JS的类Web开发(一)

目录1->概述1.1->整体架构2->文件组织2.1->目录结构2.2->文件访问规则2.3->媒体文件格式3->js标签配置3....

JavaScript初学者指南

如果你刚接触JavaScript,想必已经被“modulebundlersvs.moduleloaders”、“Webpackvs.Browserify”和“AMDvs.Common...

前端图片延迟加载详细讲解

原文链接:http://www.gbtags.com/gb/share/6366.htm?原本是打算昨天昨天下午的时候就写一篇关于前端图片延迟加载的详细技术的博客的,没想到下午公司项目出现了一些问题...

selenium:操作滚动条的方法(8)

selenium支持几种操作滚动条的方法,主要介绍如下:使用ActionChains类模拟鼠标滚轮操作使用函数ActionChains.send_keys发送按键Keys.PAGE_DOWN往下滑动...

jQuery 获取和设置HTML元素

jQuery中包含更改和操作HTML元素和属性的强大方法。我们可以通过这些方法来获取HTML元素中的文本内容、元素内容(例如HTML标签)、属性值等。text()方法text()方法可以用...

JavaScript脚本如何断言select下拉框的元素内容?

使用JavaScript脚本断言select下拉框的元素内容,需要考虑页面元素是否加载成功,出错时打印等,主要实现功能功能需包括如下几点:1.等待下拉框元素加载完成(支持超时设置)2.获取下...

JavaScript图片或者div拖动拖动函数的实现

/**拖动图片封装html格式:<imglay-src="${item.Resourcesurl}"alt="${item.ResourcesName}"...

JavaScript代码怎样引入到HTML中?

JavaScript程序不能独立运行,它需要被嵌入HTML中,然后浏览器才能执行JavaScript代码。通过<script>标签将JavaScript代码引入到HTM...

当你在Vue.js中想要隐藏 `` 标签时,可以这样做:

在Vue.js里,要是你想要搞掉`<br>`(换行)标签的效果,通常有几种路子:1.使用CSS嗯,最简单的办法就是用CSS搞定,控制元素的样式,让<br>标签彻底不显示...

php手把手教你做网站(三十)上传图片生成缩略图

三种方法:按比例缩小、图片裁切、预览图片裁切不管使用哪一个都是建立在图片已经上传的基础上;预览裁切上传,如果预览的图片就是原始大小,可以预览裁切以后上传(这里是个假象,下边会说明);1、上传以后按比例...

取消回复欢迎 发表评论: