小菜学网络之DNS服务器工作原理 - DNS服务器
通过上节学习,我们初步掌握了域名系统的基本原理。通过域名访问网络服务时,需要先向 DNS 服务器查询域名对应的 IP 地址。那么,是不是所有域名都保存在一台服务器上呢?
答案肯定是否定的。全球现有的域名数量是一个天文数字,不是一两台服务器就能保存的。实际上,DNS 服务器分为很多角色,形成了一个等级深严的分布式体系。
本节,我们一起来扒一扒这背后的故事。
管理机构
全球域名的最高管理机构是 ICANN ( Internet Corporation for Assigned Names and Numbers ),它是一个总部位于美国加州的组织。ICANN 负责管理整个域名系统的运作,主要工作是规划 顶级域名 ( top level domain ,简写为 TLD )。
顶级域名是域名的第一级,可分为两种:
通用顶级域 ,例如 、 、 .edu 、 .org 等等;国家地区顶级域 ,例如 、 .hk 、.jp 、 .us 等等;ICANN 不会直接管理这些顶级域,因为顶级域名太多,根本管不过来。目前,全球顶级域名超过 1000 个,每个顶级域名下还有很多批发商和零售注册商,管起来太麻烦了。
因此,ICANN 为每个顶级域名都找一个托管商,来负责该域名下的所有事项。这样一来,ICANN 只需与托管商打交道,日子也就舒服多了。
举个例子, 域名托管给 中国互联网络信息中心 ( CNNIC ),由它制定 域名的各种政策;而 域名则托管给 VeriSign 公司。
这样看来,ICANN 控制着 根域名 ( root domain )的控制权:
一方面,它决定着根域下有多少子节点,即顶级域名;另一方面,它决定每个顶级域名的托管商;根服务器
理论上,查询任何域名都需要先查询 ICANN 的根域。因为只有根域才能知道:某个域由谁托管,服务器是哪些。事实上也确实如此,ICANN 维护着一张映射表,记录了每个顶级域名和对应的托管商。
举个例子,查询 fasionchan 这个域名时,我们需要先查询 ICANN 的映射表。它会告诉我 域名由 VeriSign 托管,所以我必须去找 VeriSign ,而 VeriSign 会告诉我查询 fasionchan 又该找谁。
ICANN 维护的这个根域名列表,叫做 DNS根区 ( DNS root zone )。ICANN 官网提供了根区相关信息,包括根区文件。根区文件保存着所有顶级域名的托管信息,所以非常大,超过 2MB 。
以 这个顶级域为例,从根区可以查询到 13 个域名服务器:
- com. 172800 IN NS b.gtld-servers. com. 172800 IN NS g.gtld-servers. com. 172800 IN NS f.gtld-servers. com. 172800 IN NS e.gtld-servers. com. 172800 IN NS c.gtld-servers. com. 172800 IN NS j.gtld-servers. com. 172800 IN NS k.gtld-servers. com. 172800 IN NS a.gtld-servers. com. 172800 IN NS i.gtld-servers. com. 172800 IN NS m.gtld-servers. com. 172800 IN NS d.gtld-servers. com. 172800 IN NS h.gtld-servers. com. 172800 IN NS l.gtld-servers.
也就是说, 结尾的域名可以到这 13 台服务器中的任一台去查询,比如 a.gtld-servers 。
我们注意到,这 13 台服务器还是以域名的形式提供的。换句话讲,我们必须先通过域名,找到 服务器的 IP 地址。但是,这样不就造成循环查询了吗?
为此,DNS 根区还会同时提供这些服务器的 IP 地址,包括 IPv4 和 IPv6 两个版本:
- a.gtld-servers. 172800 IN A 192.5.6.30 b.gtld-servers. 172800 IN A 192.33.14.30 ... m.gtld-servers. 172800 IN A 192.55.83.30 a.gtld-servers. 172800 IN AAAA 2001:503:a83e::2:30 b.gtld-servers. 172800 IN AAAA 2001:503:231d::2:30 ... m.gtld-servers. 172800 IN AAAA 2001:501:b1f9::30
那 DNS 根区列表保存在哪里呢?答案是 根域名服务器 ( root name server )。
早年间,全世界只有 13 台根域名服务器,编号从 a.root-servers 到 m.root-servers 。因为早期的 DNS 查询结果是通过一个 512 字节的 UDP 数据报来传输的,它最多只能容纳 13 个服务器地址。
根域名服务器列表可在 root-servers.org 上查询。
这 13 台根域名服务器,由 12 个独立的组织独立运营。其中,A 和 J 这两台是由 VeriSign 公司管理的。每个运营组织为了保证可用性,会部署很多个节点。单单根服务器 A 就部署了 16 个节点,分布在世界各地。
虽然每个根服务器都部署了多个节点,但他们的 IP 地址都是一样的。拿根服务器 A 来说,它的 16 个节点,IP 地址都是 198.41.0.4 。这也太神奇了吧!这么多节点共用一个 IP 地址,难道不会冲突吗?
得益于 Anycast 路由技术,分散在不同地理位置的多台服务器,可以使用相同的 IP 地址。当发送方向这个 IP 地址发送数据时,路由协议会自动选择一个最近的节点。Anycast 路由技术先按下不表,后续有机会再展开介绍。
这意味着全球只有 13 台根域名服务器,对应的 IP 地址也只有 13 个,执行 dig 命令即可获得:
- root@netbox [ ~ ] ➜ dig . NS ; <<>> DiG 9.16.1-Ubuntu <<>> @10.2.66.66 . NS ; (1 server found) ;; global options: +cmd ;; Got answer: ;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 42791 ;; flags: qr rd ra; QUERY: 1, ANSWER: 13, AUTHORITY: 0, ADDITIONAL: 8 ;; OPT PSEUDOSECTION: ; EDNS: version: 0, flags:; udp: 4000 ;; QUESTION SECTION: ;. IN NS ;; ANSWER SECTION: . 1700 IN NS k.root-servers. . 1700 IN NS m.root-servers. . 1700 IN NS l.root-servers. . 1700 IN NS b.root-servers. . 1700 IN NS g.root-servers. . 1700 IN NS f.root-servers. . 1700 IN NS d.root-servers. . 1700 IN NS e.root-servers. . 1700 IN NS i.root-servers. . 1700 IN NS a.root-servers. . 1700 IN NS h.root-servers. . 1700 IN NS j.root-servers. . 1700 IN NS c.root-servers. ;; ADDITIONAL SECTION: k.root-servers. 3282 IN A 193.0.14.129 g.root-servers. 2845 IN A 192.112.36.4 d.root-servers. 118 IN A 199.7.91.13 e.root-servers. 494 IN A 192.203.230.10 a.root-servers. 1771 IN A 198.41.0.4 j.root-servers. 3197 IN A 192.58.128.30 c.root-servers. 1830 IN A 192.33.4.12 ;; Query time: 14 msec ;; SERVER: 10.2.66.66#53(10.2.66.66) ;; WHEN: Thu Apr 08 09:01:17 CST 2021 ;; MSG SIZE rcvd: 364
迭代查询
当我们查询一个域名时,必须从根服务器开始,逐层查询,这就是所谓的 迭代查询 ( iterative query )。
如上图,当我们查询一个域名,例如 fasionchan 时:
先查询 根域名服务器 ;
根域名服务器就 13 台,IP 大家都知道,极少改动;根域名服务器保存根区列表,列表包含顶级域名的托管商,以及相关服务器信息;根域名服务器根据根区列表,告诉我们 顶级域应该找谁查询;根据根服务器返回结果,继续查询负责 解析的服务器,一般叫做 顶级域名服务器 ;
主域名 fasionchan 注册后,需要将负责该域名解析的服务器,登记在 顶级域名服务器上; 顶级域名服务器根据这个信息,告诉我们 fasionchan 这个域名应该找谁查询;根据顶级域名服务器返回结果,继续查询负责 fasionchan 解析的服务器,一般叫做 权威域名服务器 ;
fasionchan 子域信息一般都登记在权威服务器上;权威服务器取出 fasionchan 对应记录,并返回给我们,查询结束;如果某个子域由其他权威服务器负责,我们还需要继续迭代,直到查询完毕;无论查询什么域名,都需要先查根域名服务器。这样的话,根服务器不会压力太大了吗?
其实完全不用担心。因为保存在根服务器上的根区列表一般很少改变,因此客户端可以将它缓存起来,以此降低根服务器的查询压力。
缓存服务器
实际上,客户端一般不自己进行迭代解析,而是通过本地的 递归解析器 。以访问网站 fasionchan 为例:
- 客户端向本地的递归解析器查询域名 fasionchan ;递归解析器向根域名服务器查询域名 fasionchan ;根域名服务器告诉递归解析器,应该去找 的顶级域名服务器;递归解析器向顶级域名服务器查询域名 fasionchan ;顶级域名服务器告诉递归解析器,应该去找 fasionchan 的权威域名服务器;递归解析器向权威域名服务器查询域名 fasionchan ;权威服务器向递归解析器返回结果;递归解析器向客户端返回结果;客户端拿到域名对应的 IP 地址后,即可向该 Web 服务器发起请求;Web 服务器处理请求后,向客户端返回结果;
注意到,递归解析器需要从根服务器开始,逐层查询,这个过程是 迭代解析 。迭代解析最显著的特征在于,如果服务器没有关于待查域名的结果,它会告诉客户端应该去哪里查询,根服务器就是典型的例子。
递归解析器就不一样了。当它收到未知域名的查询请求后,它会替客户端向其他 DNS 服务器发起请求,然后再把结果返回给客户端,这个过程就叫 递归解析 ( recursive query )。
递归解析对客户端来说是完全透明的,客户端完全不用关心递归解析器背后的其他 DNS 服务器。
此外,递归解析器还会将查询结果在本地缓存起来。当域名再次被查询时,它可直接返回缓存结果,无须重新查询其他 DNS 服务器。正因如此,递归解析器通常被称为 DNS缓存服务器 。
那么,客户端主机如何配置 DNS 缓存服务器呢?以 Linux 系统为例,只需编辑 /etc/resolv.conf 配置文件:
- root@netbox [ ~ ] ➜ cat /etc/resolv.conf # This file is included on the metadata iso nameserver 192.168.65.1
关键字 nameserver 后面跟 DNS 缓存服务器地址,可以写多行配置多个 DNS 缓存服务器,以达到冗余效果。
原文地址:mp.weixin.qq/s/jXo36_jPiXSS7B3KGQZkcA
免责声明:本文内容来自用户上传并发布,站点仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。请核实广告和内容真实性,谨慎使用。