当面试官问到,请你说说看“从输入 URL 到页面展示,这中间发生了什么?”

以前的我是这样回答的:

用户输入URL后,向服务器端发起请求、如果顺利,得到网络响应之后,浏览器对资源进行解析、最后将其渲染到页面上。

具体步骤为:

  1. 首先构建请求

  2. 查找缓存,如果命中缓存,直接使用缓存资源

  3. 否则进行DNS解析,将域名转换成对应的IP地址

  4. 建立TCP连接

  5. 发送HTTP请求

  6. 如果顺利得到网络响应,浏览器开始解析和渲染

  7. HTML解释器 解析HTML 为 DOM树

  8. 同时CSS解释器 解析CSS文档 为 styleSheets

  9. 创建布局树,进行布局计算

  10. 整合图层,展示页面

乍一看,好像没什么毛病,但问题就在于,如果面试官针对某个点进行提问,我可能自动切换为一副黑人问号脸,或者是一种【只可意会不可言传】的沉默表现。

不过没有关系,学习了李兵老师的《浏览器的工作原理与实践》课程和其他一些参考资料之后,如果再遇到面试官的追问,相信我就可以保持优雅的微笑了。

# 补充知识

# 进程与线程

  • 进程是CPU资源分配的最小单位(是能拥有资源和独立运行的最小单位);
  • 线程是CPU调度的最小单位(线程是建立在进程的基础上的一次程序运行单位)。

# Chrome 浏览器的多进程架构

最新的 Chrome 浏览器包括:

  • 1 个浏览器(Browser)主进程
  • 1 个网络(NetWork)进程
  • 1 个 GPU 进程
  • 多个渲染进程
  • 多个插件进程

这几个进程的功能:

浏览器进程:

  • 主要负责界面显示、用户交互、子进程管理,同时提供存储等功能。

网络进程:

  • 主要负责页面的网络资源加载,之前是作为一个模块运行在浏览器进程里面的,直至最近才独立出来,成为一个单独的进程。

渲染进程:

  • 核心任务是将 HTML、CSS 和 JavaScript 转换为用户可以与之交互的网页,排版引擎 Blink 和 JavaScript 引擎 V8 都是运行在该进程中,默认情况下,Chrome 会为每个 Tab 标签创建一个渲染进程。出于安全考虑,渲染进程都是运行在沙箱模式下。

GPU 进程:

  • Chrome 刚开始发布的时候是没有 GPU 进程的。而 GPU 的使用初衷是为了实现 3D CSS 的效果,只是随后网页、Chrome 的 UI 界面都选择采用 GPU 来绘制,这使得 GPU 成为浏览器普遍的需求。最后,Chrome 在其多进程架构上也引入了GPU 进程。

插件进程:

  • 主要是负责插件的运行,因插件易崩溃,所以需要通过插件进程来隔离,以保证插件进程崩溃不会对浏览器和页面造成影响。

# 从输入 URL 到页面展示,这中间发生了什么?

李兵URL

有了一些补充知识,我们就可以来看这个问题,从用户输入 URL 到页面展示,这中间的过程可谓是非常地复杂,我将从导航流程和渲染流程来说明,话不多说,直接上流程图。

# 导航阶段

导航

一个完整的导航流程大致可总结为如下:

  1. 用户输入url并回车;
  2. 浏览器进程检查url,组装协议,构成完整的url;
  3. 浏览器进程通过进程间通信(IPC)把url请求发送给网络进程;
  4. 网络进程接收到url请求后检查本地缓存是否缓存了该请求资源,如果有则将该资源返回给浏览器进程;
  5. 否则查找是否存在DNS缓存,如果没有,先进行DNS解析,获取到请求域名对应的服务器IP地址;
  6. 判断请求协议是否为HTTPS,如果是,则还需要建立TLS连接;
  7. 否则,直接建立TCP连接,客户端通过三次握手与服务端建立连接;
  8. 浏览器向服务器发送HTTP请求;
  9. 服务器接收到请求信息后,根据请求信息生成响应数据,发给网络进程;
  10. 网络进程解析响应数据;
  11. 如果响应行的状态码包含了 301、302 一类的跳转信息,浏览器会根据响应头的 Location 字段的地址,进行拼接和跳转,继续导航;如果响应行是 200,表示浏览器可以继续处理该请求;
  12. 如果 Content-Type 字段的值被浏览器判断为下载类型,那么该请求会被提交给浏览器的下载管理器,同时该 URL 请求的导航流程就此结束。但如果是HTML,那么浏览器则会继续进行导航流程。
  13. 浏览器为页面分配渲染进程。打开一个新页面采用的渲染进程策略就是:通常情况下,打开新的页面都会使用单独的渲染进程;如果从 A 页面打开 B 页面,且 A 和 B 都属于同一站点的话,那么 B 页面复用 A 页面的渲染进程;如果是其他情况,浏览器进程则会为 B 创建一个新的渲染进程。
  14. 浏览器进程向渲染进程发出“提交文档”的消息,渲染进程接收后,和网络进程建立传输数据的“管道”。 文档数据传输完成之后,渲染进程会返回“确认提交”的消息给浏览器进程。浏览器进程在收到“确认提交”的消息后,会更新浏览器界面状态,包括了安全状态、地址栏的 URL、前进后退的历史状态,并更新 Web 页面。

# 渲染阶段

渲染阶段

一个完整的渲染流程大致可总结为如下:

  1. 渲染进程将 HTML 内容转换为能够读懂的DOM 树结构。
  2. 渲染引擎将 CSS 样式表转化为浏览器可以理解的styleSheets,计算出 DOM 节点的样式。
  3. 创建布局树,并计算元素的布局信息。
  4. 对布局树进行分层,并生成分层树。
  5. 为每个图层生成绘制列表,并将其提交到合成线程。
  6. 合成线程将图层分成图块,并在光栅化线程池中将图块转换成位图。
  7. 合成线程发送绘制图块命令DrawQuad给浏览器进程。
  8. 浏览器进程根据 DrawQuad 消息生成页面,并显示到显示器上。
渲染阶段LB

到这里,大功并没有告成。面试官可能会继续追问N多个问题,只有好好准备,面试过程才不会显得那么卑微。

再者,将一个问题能够理解透彻,也能帮助我们更好地开展今后的工作,毕竟,我们面对的不仅仅是面试。

# 面试官继续追问

面试官接着说:可以,对这个过程宏观上还是把握住了,那我再考察你几个具体的知识点吧!

浏览器相关

  • 为什么很多站点第二次打开速度会很快?
  • 登录状态是如何保持的?
  • 浏览器中的JavaScript执行机制相关问题
  • 。。。

参考:《浏览器的工作原理与实践》 (opens new window)

TCP协议

  • 能不能说一说三次握手和四次挥手
  • 。。。

参考:神三元--TCP协议灵魂之问 (opens new window)

面试官,不要再问我三次握手和四次挥手 (opens new window)

HTTP协议

  • 请说说 HTTP 有哪些状态码
  • 了解 HTTP/2吗?相比以前的协议有哪些改进?
  • 。。。

参考:HTTP灵魂之问 (opens new window)

前端性能优化

  • 请你说说浏览器缓存
  • 什么是浏览器的本地存储呀?
  • 你是怎么理解重绘与回流的?
  • 针对这一整个过程,你有想过我们可以在哪些方面进行性能优化吗?
  • 。。。

# 推荐阅读

浏览器的回流与重绘 (Reflow & Repaint) (opens new window)

参考:《前端性能优化原理与实践》 (opens new window)

其中涉及到的知识真的太多了,我们确实也需要系统深入的学习,不过在这个金三银四的求职季,大家如果准备得比较晚,可以挑一些知识点,比如 HTTP 相关、前端性能优化进行深入研究,还有TCP协议中的三次握手和四次挥手,我们肯定也逃不掉,其他的可以先把学习安排往后放一放,如果被问到不会的,可以说不会或者只是简单了解,记得要保持微笑。

上次更新: 2021年10月30日星期六晚上8点03分