We use cookies to improve your experience with our site.

ISP 拓扑结构测量中IP地址定位技术研究

Techniques for Determining the Geographic Location ofIP Addresses in ISP Topology Measurement

  • 摘要: IP 地址定位技术在 Internet 拓扑测量、 Internet 路由性质刻画、与地理位置相关的应用服务(例如定向广告) 、 Web 个性化搜索、以及 Web 地理空间导航 (geo-spatial navigating) 等方面具有重要作用。 IP 地址可以用于主机或服务器,也可以用于路由器。 如果能够确定路由器的地理位置,就有可能: 1)为选路 (routing) 拓扑的显示和进一步分析绘制直观的地理分布图; 2) 研究选路的动态性质 ( 例如,发现迂回路由、中间的连通性发生变化的路由、摆动路由等病态路由) ; 3) 生成隐含地理模型的综合 (synthesized) 拓扑;或者 4) 研究蠕虫病毒的扩散范围和行为,等等。映射 IP 地址到其地理位置本身是一项具有挑战性的任务,这是因为 IP 地址本身并不包含位置信息。 传统的 IP 地址定位技术主要是采用域名信息或者与 IP 地址块对应的 whois 信息来确定一个 IP 地址所在的地理位置 ( 以地理城市为定位粒度) 。其它的定位方法还有:采用 DNS LOC 记录定位 IP 地址;从 Web-hosting 站点的 HTTP cookies 、或者从免费 email 服务器或在线 TV 节目指南 Web 服务器的用户登记记录中获得一部分 IP 地址到地理位置的映射信息;通过测量网络延迟来估计位置,等等,它们都存在局限性。采用域名或 whois 信息的方法比现有的其它几种方法应用更广泛,特别是在定位主机时比较有效。 然而,确定路由器地理位置时,采用域名或 whois 信息的方法也存在局限性。一方面,对应于骨干路由器 IP 地址的 whois 信息一般是粗粒度的,对每个路由器接口地址来说,通常没有详细的地理位置信息,甚至可能包含不准确的信息。另一方面,对某些 ISP 来说,可能只有少量的路由器 IP 地址有域名。 针对现有定位方法不足的问题,本文提出了 9 条用于辅助推断路由器地理位置的经验推断原则: (1) 相互推断原则, (2) 本地原则, (3) “乒乓”归属原则, (4) 双向逼近原则, (5) 优先外出否定原则, (6) “不可达 / 超时”原则, (7) 中继跳归属原则, (8) 从众原则, (9) 基于接口发现的正确性检验原则。当 whois 信息或域名信息不足,或者域名信息不准确或缺少位置信息,导致无法确定路由器位置时,可以利用这些辅助规则。通常,可以认为 Internet 选路原理、网络部署实施的层次结构以及经济约束有助于辅助推断路由器的地理位置,因此,这里所提出的 9 条辅助推断规则就是基于这些因素来推断路由器的地理位置。 在测量一个国家级 ISP 网络拓扑时所发现的 2563 个路由器接口中,只有 6.4% 的接口有相应的域名,并通过域名确定其地理位置。在应用这 9 条辅助推断规则之后, 38% 的接口的地理位置得到确定。采用两种主要方法来评估辅助推断原则的有效性,一种方法是将测量的拓扑图与相应 ISP 所发布的拓扑图相比较,另一种方法是选取所推断的一些主干路由器接口的地理位置向相应 ISP 的管理人员寻求验证。此外,还分别检查了由辅助推断原则所确定的地理位置与由域名以及由 whoi s 信息所确定的地理位置之间的符合度。实验结果表明,在 ISP 拓扑测量中,上述辅助推断原则在确定路由器地理位置方面能够起到很重要的作用。

     

    Abstract: A brief survey on the state-of-the-art research ofdetermining geographic location of IP addresses is presented. Theproblem of determining the geographic location of routers in InternetService Provider (ISP) topology measurement is discussed when there isinadequate information such as domain names that could be used. Nineempirical inference rules are provided, and they are respectively (1)rule of mutual inference, (2) rule of locality, (3) rule of ping-pongassignment, (4) rule of bounding from both sides, (5) rule ofpreferential exit deny, (6) rule of unreachable/timeout, (7) rule ofrelay hop assignment, (8) rule of following majority, and (9) rule ofvalidity checking based on interface-finding. In totally 2,563discovered router interfaces of a national ISP topology, only 6.4% ofthem can be located by their corresponding domain names. In contrast,after exercising these nine empirical inference rules, 38% of themhave been located. Two methods have mainly been employed to evaluate theeffectiveness of these inference rules. One is to compare the measuredtopology graph with the graph published by the corresponding ISP. Theother is to contact the administrator of the corresponding ISP for theverification of IP address locations of some key routers. Theconformity between the locations inferred by the rules and thosedetermined by domain names as well as those determined by whoisinformation is also examined. Experimental results show that theseempirical inference rules play an important role in determining thegeographic location of routers in ISP topology measurement.

     

/

返回文章
返回