Google如何令人惊叹的打造地图服务?
作者: 时间:2020-06-07
Google如何令人惊叹的打造地图服务?

(

原文编译自:theatlantic

在每张 Google 地图的背后,都有一张肉眼不可见的地图,正是这张隐藏地图隐含着真实地理位置的逻辑:哪些地方不能左转,哪些是高速公路匝道,限速要求和即时路况等等。正是这些数据让 Google 为你提供导航成为可能。上週,Google 请我去参观这张隐藏地图背后的构建机制,这是 Google 首次向外界披露这项名为 Ground Truth 或者 GT的计划到底是怎幺回事。

Google如何令人惊叹的打造地图服务?

Google 是以搜寻引擎起家的,但是随着行动网路时代的来临,你在那儿搜寻的重要性,开始与你搜寻什幺不相上下。如果 Google 的使命是组织全世界的资讯,那幺最大的挑战不是为网路设立目录,而是将这个世界的物理讯息整合成可用的资讯系统。

「看看我们真实生活所处的离线世界,你就会发现很多讯息其实都是在线下的,网络无法涵盖一切,」Manik,Google 地图的高级产品经理如是说,「我们希望能填补真实世界和网路世界的鸿沟,地图就是其中的重要一环。」

Google 用于构建完美展示真实世界的地图的办公室其实很普通,像其他办公室一样,也有免费美食和健身娱乐,但是真说起来也只是山景城郊区的一栋挺矮的办公楼而已。我在那儿见到了 Manik 和他的得力干将 Michael,前 NASA 工程师,他会把 20% 的工作时间花在 Google 火星项目上,此外还有一名叫 Nick 负责处理地图数据的操作员。

Michael 给我详细介绍了製作一个地图的具体过程:首先你得从合作伙伴那儿获得原始数据,然后通过工程处理将这些数据整理成合适的格式并同其他源头获得的数据进行整合,之后还需要一些列人工处理,最后才能生成一张高品质的地图——远胜过简单拼凑所得的效果。

Google如何令人惊叹的打造地图服务?
具体来讲,首先是从美国审计局拿到最初的 TIGER 数据,如下图:

乍看之下这些数据非常完美,但是如果你仔细看的话,会发现有些地方是与真实世界有差别的,我用红圈标出了几个地方:

Google如何令人惊叹的打造地图服务?

撇开与卫星图片比较之外,Google 还有其他的处理方法,比如同其他数据库如美国地质调查局获得的数据做比较。另外一个重要数据源则是 Google 的街景车,据称街景车每两週发布的图片数据要比 2006 年 Google 处理的数据总和还多。

让搭载着订制相机的街景车走遍全世界,这个主意值得大家致以敬意。目前 Google 的街景车已经行驶了 500 多万英里,这些里程为地图製作提供了两类有价值的资讯:其中之一是街景车实地走过的路径,这意味着到底那些路是走得通的;其二是拍摄的照片,透过它们,Google 可以利用算法分离出其中的交通信号,并将这些信息嵌入到 Google 地图的底层中去。如此处理后,旧金山的某个闹市区就成了这个样子:

Google如何令人惊叹的打造地图服务?

Google 街景的初衷并不是为了製作地图,但是 Google 的地理团队很快就意识到可以利用街景的数据来充实地图。你可以把街景车想像成在网页上搜寻字符的网路爬虫,它们可以发现街道上的各种标誌和地址,帮助 Google 地图更好的理解人类的交通系统。随着电脑视觉和光学字符识别技术的发展,路上的每一个字符都会成为 Google 为现实世界製作的索引的一部分。

也许将来有一天电脑视觉可以直接将街景图片完美转化成地理上可理解的资讯,但现在依然需要人工进行很多处理,比如要判断某个交叉口是否可以左转,最好的办法还是派人去看一眼,不管是实地驾驶观测或者是通过街景车传来的图像进行判断。

这一点与 Google 另一个伟大的产品 Google Translate 有相似之处,同样看起来是机器的智慧,实则是人类智慧的集合。Google Translate 依赖海量的人类语言翻译素材,之后通过算法将各种词彙片语进行配对,相比起算法,海量的语言库扮演着更关键的角色。

Google 地图有着相似的策略,人类对路况讯息进行编码,之后电脑就可以简单的複製贴上。这也意味着地图的製作需要大量的人工,据 Michael 称,为一个国家编制地图一般都要几百个作业员。实际上你看到的每一张地图都是经过很多人工处理的,每天 Google 地图都得处理上千份用户反馈报告,地图团队都会在数分钟内进行对应的处理。

如果你认真想想为全世界提供如此详实的地图服务,标注出每个交叉口的行车方向,随时对路况进行更正修改,就会发现这真不是随便哪家公司就能做到的,你需要的远不仅仅是几个聪明的工程师,还需要对数据的掌控和处理,以及支持你做这项事业的决心和财力。Google 地图最终展示给用户的其实是人类的智慧,正是这类智慧才能让 Google 的电脑告诉你从旧金山到波士顿最好走的路到底是哪条。

谈到未来地图时,我们也许会想起博尔赫斯式的同真实世界完美一致的地图。既然我们已经有了真实世界,似乎再做一个一模一样的地图会是一个很奇怪的念头。但是如果考虑下 Nathan 关于扩增实境的定义,你就会发现如他所言,每一寸真实的物理空间,都是被讯息渗透的。物理空间实质上也是讯息空间。我们每个人在脑中都有一个完美地图,指导我们在现实中前行。Google 的策略就是将每个人的脑中地图集合到一块,处理成每人都可使用的形式。

MapMaker 这款产品清晰的解释了 Google 的野心。通过 MapMaker,每个用户都可以将自己世界里的讯息添加到 Google 地图中去。这也是一种将人类大脑中的讯息抓取到网路的方式,类似的竞争者还有 Open Street Map,也是通过群众外包的方式来製作地图。

随着这个世界在线上线下都变得越来越后现代,Google 的地理数据正在成为它最宝贵的资产。不单单是因为这些地理数据本身,还在于这些数据能让 Google 正在做的和已经做的事情更有价值。也许就像我一个朋友 Robin 所说:「我坚信地图才是 Google 的核心资产。50 年内,Google 就会成为一家自动驾驶汽车公司,哦对了,它应该还会留着搜索引擎吧。」