院士论坛|王家耀:时空大数据时代的地图学(论文版)

《测绘学报》 构建与学术的桥梁 拉近与权威的距离 时空大数据时代的地图学 王家耀 信息工程大学地理空间信息学院, 河南 郑州 450001 收稿日期:2017-06-14;修回日期:2017-07-24 第一作者简介:

《测绘学报》

构建与学术的桥梁 拉近与权威的距离

院士论坛|王家耀:时空大数据时代的地图学(论文版)

时空大数据时代的地图学

王家耀

信息工程大学地理空间信息学院, 河南 郑州 450001

收稿日期:2017-06-14;修回日期:2017-07-24

第一作者简介:王家耀(1936-), 男, 教授, 中国工程院院士, 研究方向为地图学与地理信息系统

摘要:地图学研究的主战场是“地图”,但不同历史时期的地图其信息源、主题、内容、载体、形式、制作方法和应用方式是不同的,当然它的全方位价值也就不同了。从科学史上的科学范式的变化来看,随着大数据时代的到来,如今已经步入“数据密集型”科学范式时代,地图学亦如此,具有明显的大数据科学的特征。所有大数据都是由包括人类活动在内的地理世界的任何事物和任何现象运动变化产生的,都具有空间和时间特性,当然也就离不开空间参照和时间参照。因此,大数据本质上就是时空大数据。自20世纪50年代末60年代初以来的现代地图学,即信息化时代的地图学,是以时空数据为对象的,其核心是时空数据处理与表达,但并没有像今天面对天空地海一体的大规模多源(元)异构和多维动态的数据流(或流数据),地图的实时动态性、主题针对性、内容复合性、载体多样化、表现形式个性化、制作方法现代化、应用泛在化等特征,是以往任何时期都无法比拟的,这就产生了地图学理论、技术和应用体系的巨大变化。而所有这些变化都正好发生在20世纪50年代末和60年代初以来的约60年间,故以本文纪念《测绘学报》创刊60周年。

Cartography in the Age of Spatio-temporal Big Data

WANG Jiayao

Abstract: Cartography is an ancient science with almost the same long history as the world’s oldest culture.Since ancient times, the movement and change of anything and any phenomena, including human activities, have been carried out in a certain time and space.The development of science and technology and the progress of social civilization have made social management and governance more and more dependent on time and space.The information source, theme, content, carrier, form, production methods and application methods of map are different in different historical periods, so that its all-round value is different. With the arrival of the big data age, the scientific paradigm has now entered the era of “data-intensive” paradigm, so is the cartography, with obvious characteristics of big data science.All big data are caused by movement and change of all things and phenomena in the geographic world, so they have space and time characteristics and thus cannot be separated from the spatial reference and time reference.Therefore, big data is big spatio-temporal data essentially.Since the late 1950s and early 1960s, modern cartography, that is, the cartography in the information age, takes spatio-temporal data as the object, and focuses on the processing and expression of spatio-temporal data, but not in the face of the large scale multi-source heterogeneous and multi-dimensional dynamic data flow(or flow data)from sky to the sea.The real-time dynamic nature, the theme pertinence, the content complexity, the carrier diversification, the expression form personalization, the production method modernization, the application ubiquity of the map, is incomparable in the past period, which leads to the great changes of the theory, technology and application system of cartography.And all these changes happen to occur in the 60 years since the late 1950s and early 1960s, so this article was written to commemorate the 60th anniversary of the “Acta Geodaetica et Cartographica Sinica”.

Key words: cartography big spatio-temporal data data fusion science paradigms spatio-temporal cognitive model

今年恰逢《测绘学报》创刊60周年,也是我国地图学发生革命性变化的60年[1]。

地图学可以称得上是一门古老而又不断注入新活力的科学。如果从已经发现的古巴比伦地图算起,迄今已有4500余年的历史,期间经历了古代地图学的萌芽与发展(约公元14世纪前)、近代地图测绘与传统地图学的形成(约公元15世纪至20世纪中叶)、地图学的技术革命与信息时代的地图学(约20世纪中叶以来)3个时期[2-8]。地图学从一开始就是人类活动在一定空间和时间认知世界和改造世界的产物,地图构建地理世界而非复制地理世界,地图学的使命是研究构建“地理世界”的理论、方法、技术体系和地图表达复杂地理世界的空间结构和空间关系及其时空变化规律,成为“改变世界的十大地理思想”之一[9-10]。这就决定了地图学的科学、技术和工程的基本属性,以及地图的科学价值、社会价值、法理价值、文化价值和军事价值[11]。

人类活动本质上就是一种时空行为,世界上的任何事物和现象(包括自然和社会人文)的发生、发展和演变,都是在一定的时间和空间进行的,地图学作为表达人类活动与地理环境在时间和空间上的复杂关系的一种独特研究视角,越来越凸显出其与空间和时间的不可分割性。任何地图都要标注制作和出版的时间(基于某种时间参考系)及采用的空间参考系(大地坐标系统和高程系统),地图学要关注空间基准和时间基准的理论和方法;任何地图都依赖于其制图资料(数据),都要标注资料的时间、空间参考系统和出处,地图学要关注这些资料的可靠性和可用性并研究多种不同制图资料的处理方法;地图是用来认知、管理和治理世界的,能进行时空分析,地图学要研究时间序列的预测分析和空间分布规律分析的模型和算法。无论何时期的地图学都如此,只不过时空精准度及内容的深度和广度不同而已[12-14]。

在地图学发展的漫长历史中,地图的资料(数据)源始终是需要面对的一个难题,主要难在两个方面:一是数据源少,可能出现“巧妇难为无米之炊”,导致地图品种少、内容贫乏,但数据处理简单;二是数据源多,可能出现数据多源(元)异构问题,导致数据处理难度大,但地图品种多、内容丰富。地图学正是在解决这个“难”的过程中发展的。16世纪以前,地图学主要是描述记载那些耳闻目见的地理现象,甚至包括一些远域异方的神话传说,封建社会时代开始利用简单工具丈量土地封疆;16—19世纪的殖民时代组织大规模地图测绘,编绘和出版了大量统一规格的地形图和航海图,地图的信息量急骤增长,逐渐兼有信息采集与存储检索等功能;随着19世纪科学技术的发展、分化和深化,出现了各种专题地图和地图集,并基于此对各种自然和社会经济现象进行分析;20世纪初飞机的出现和航空摄影测量的发展,地形测绘逐步从外业转向内业,地图学的重点除原有的信息存储和检索功能外,分析功能加强了,地图开始用于反演历史的过程、推断未来的变化;20世纪50年代以后,卫星遥感、全球导航定位系统、计算机地图制图、数字摄影测量、地图数据库、地理信息系统等相继问世,地图学又一次获得了新的飞跃,地图数据已达到海量程度,地图学的原始功能相当大的一部分已经被航空航天遥感、地图数据库、地理信息系统等更高效、大容量的现代化技术所取代。在这种情况下,就正如我国著名地图学家陈述彭先生早在1991年所指出的,地图学家们无论是主动地或被动地,都被卷进了这一急湍的信息时代的洪流,地图学无法回避这样一个客观事实的存在,即地图学的着重点正在逐步地由信息源获取一端向信息源加工一端飘移,地图学完全有必要而且也有可能把着重点放在信息的深加工方面来,加强智能化处理,更直接地面向国民经济建设和国防建设的主战场,为宏观决策和工程规划设计提供更高效的、浓缩的地理信息产品[15]。也正是在这种情况下,越来越多的学者关注地图制图数据处理。空间数据处理成为现代地图学的主要研究对象,这是由地图制图资料的数据化、地图制图生产的计量化和地图制图技术的现代化背景决定的。正是基于这样的背景,有学者在多年研究积累的基础上,提出把“原始数据的特征分析和预处理→数学模型的设计和建立→数据处理→制图模型的设计、建立和解释”作为地图制图数据处理模型方法的基本过程,并着重相关分析用于研究和编制显示要素或现象(地区或部门)相互关系(结构特征)的相关地图,预测分析(回归模型、时间序列分析模型、灰色系统理论)用于研究现象间的制约关系和编制预测地图,主因素(和主成分)分析用于研究复杂地理综合体的形式化(简化变量结构)和编制综合地图,聚类分析用于研究系统的组合分类和编制类型区划地图,图论用于研究某些最优化问题(如最优路径)和编制各种最优化地图,等等[14]。这种把数据处理作为地图学的核心的数据思维方法至今仍是有效的。

当今,随着天空地海一体的传感器网技术、人工智能技术、“互联网+”技术和智能计算技术等的快速发展,全球信息化迈入了“大数据时代”,地球表层(自然、社会经济及人文)的几何特征、物理特征和属性特征,都成为可被感知、记录、存储和分析的数据,大数据带来的信息风暴正在变革人们的生活、工作和思维,必将开启一次重大的时代转型,即思维变革、商业变革和管理变革。大数据之所以能成为一个时代,在很大程度上是因为这是一个由社会各界广泛参与、学科之间交叉融合的社会活动,这场变革必然影响到各行各业和各个学科,机遇也必将蕴含于各行各业和各个学科。在大数据成为地图信息源的“数据密集型”科学范式新时代,地图学又站在了新的历史起点上[16-17]。此时此刻,地图学界理所当然地要思考:大数据时代的到来将给地图学带来什么变化?地图学如何迎接大数据时代的挑战和机遇?这就是本文要探讨的问题。

1 时空大数据时代给地图学带来的新变化1.1 地图学的时空观和方法论

地图学本质上是一门研究重构地理世界、反映地理世界的空间结构和空间关系及其随时间变化而变化的规律的科学,地图学同空间和时间密不可分。在哲学上,空间与时间一起构成运动着的物质存在的两种基本形式。空间指物质存在的广延性;时间指物质运动过程的持续性和顺序性。空间和时间同运动着的物质不可分割,没有脱离物质运动的空间和时间,也没有不在空间和时间中运动的物质。空间和时间是无限和有限的统一。就宇宙而言,空间无边无际,时间无始无终,而对各个具体事物来说,则是有限的[18]。与此相关的是,空间参照与时间对照是自然与社会现象的两个基本参照系统,世界上的任何事物和现象都离不开这两个基本参照。换句话说,空间坐标与时间刻度是标识自然万事与社会现象的两个基本特征[19-20]。包括人类活动在内的任何事物和现象的运动变化都是在确定的空间和时间发生的,而所有大数据都是由包括人类活动在内的任何事物和现象的运动变化所产生的,这就是时空大数据,它是基于统一时空基准,活动于时空中与位置直接或间接相关联的大数据。从这个意义上讲,大数据本就是时空大数据,它是包括人类活动在内的现实地理世界空间结构和空间关系各要素(现象)的数量、质量特征及其在时空中变化的数据集的“总和”[16], 都具有空间、时间、属性、多源(元)异构、多维动态等特征,当然也离不开空间参照与时间参照。

万事万物的空间与时间特征作为地图学的主要研究和表达对象,从时间序列讲,可以科学表达过去(历史)、现有(现状)与未来(规划、预测),即时间序列的延拓;从空间范围讲,可以科学表达地球表层(四大圈层)、海洋(海底地形、海洋资源、海流、海洋热带气旋)、月球表面(月球形貌和月球地形)、网络空间等,即深空、深地、深海、深蓝等都成为了地图学描述和表达的对象,体现了时空一体化,深刻地影响着地图学研究的认识论和方法论。这就是地图学的时空观,即地图学是描述和表达万事万物的空间和时间特征的科学。

时空大数据成为地图学的大规模海量数据源,使得地图学对时空框架下运动变化的事物和现象的描述和表达变得更加科学实用。例如:发病率专题地图的制作,发病率异常区域的确定、该区域和周边地区其他信息的获取已变得容易,地图已经能够建立特定癌症发病率与特定致癌物质接触程度之间的联系[21];城市某区域人群流动呈现的状况和人流量控制信息,可通过先进的感知与记录技术获取,城市交通监控管理中心的屏幕电子地图可以实时动态地表达城市某区域人流状况预测,从而使城市管理者能实时了解某区域的公共安全状况,及时采取预警措施[22]。

地图学的时空观必将推动地图学理论的新发展,地图哲学——哲学视野下的地图学作为最高层次的地图学理论的概括,时空综合认知、时空信息模型、时空信息传输、时空信息本体、时空信息语言学等,都将成为地图学理论新的研究领域;互联网、物联网、云计算技术的发展,地图制图的系统论方法、协同论方法、最优化方法等将成为地图学的方法论;新兴计算技术、人类自然智能与人工智能深度融合技术、数据挖掘与知识发现技术、时空大数据可视化技术、网络/网格/云服务技术,以及语义网、语义网格和语义网络技术等,都将成为时空大数据时代地图学发展的重要支撑技术;地图的实时动态性、主题的针对性和多样化、内容的复合性、表现形式的个性化、应用的泛在化等,必将成为可能。

1.2 地图学的第一位任务是多源(元)异构时空大数据的融合

在传统手工地图制图时代,也存在制图(编图)资料的加工处理问题,如将不同制图资料的图例符号转换成统一的新编地图的符号系统,由资料图的度量单位转换成新编地图的度量单位,不同大地坐标系制图资料转换成新编地图的大地坐标系[7]等,不过一般采用手工处理方法,精度不高、效率较低、劳动强度大。

多源(元)异构时空大数据融合,是时空大数据时代给地图学带来的新问题。地图学再也无须为数据源发愁了,但时空大数据的多源异构特征也给地图学数据源的处理增加了新的复杂性和困难。这主要表现在来自国内外不同部门、不同行业的时空大数据往往具有多类型、多分辨率(影像)、多时态、多尺度、多参考系、多语义等特点,客观上造成集成应用的时空大数据不一致、不连续的问题十分突出,给地图制图增加了难度,无法快速为国家重大工程和信息化条件下的联合作战提供全球一致、陆海一体、无缝连续的时空大数据服务。因此,如何科学描述、表达和揭示不同类型、不同尺度、不同时间、不同语义和不同参考系统的时空大数据的复杂关系及其相互转换规律,从根本上解决多源异构时空大数据的融合,已成为计算机数字地图制图环境下地图学亟待解决的科学技术问题[23-25]。

应该说,近几年来该领域的研究已越来越受到关注和重视,也取得了一些进展,但有待研究解决的问题还很多,发展和提升的空间也还很大。例如:基于不同时空基准的时空大数据的转换一直是各国测绘与地理信息科技界关注的最基本的问题之一,核心是建立不同时空基准之间的转换模型并确定转换参数。在大地坐标系转换方面,我国已建立了1954北京坐标系、1980西安坐标系与2000国家大地坐标系之间的转换模型和转换参数[26],正在进行全国各种比例尺时空数据的坐标转换,工作量很大,而且各城市独立坐标系到2000国家大地坐标系之间的转换还有一些技术性工作要做。不同尺度(比例尺)、不同时间、不同语义时空数据融合的研究刚刚起步,我国“十一五”以来,国家自然科学基金和国家“863”计划已有多个项目支持该领域的研究,主要涉及多尺度空间数据相似性模型及其度量[27-35]、面状和线状目标的自动匹配等[36-47],前者主要研究多尺度空间数据几何相似性理论和度量方法,后者主要研究不同时间、不同尺度道路和面状居民地的自动匹配算法;而不同语义空间数据的转换,由于涉及地理本体领域的一系列理论、方法和技术,难度很大,目前的研究多着重语义表达、基于本体的地理信息查询检索和基于语义匹配的地理信息服务等方面的研究[48-76]。因此,要进一步从整体上研究多源异构时空大数据融合的理论,深入研究多尺度空间数据相似关系理论及相似性度量模型,不同时间和不同尺度点群、道路网和面状居民地目标的自动配算法,特别要重点研究基于地理本体的不同语义空间数据的一致性处理,包括地理本体的形式化表达、地理本体库、语义转换规则与规则库和语义自动转换适配器等的理论、方法与技术。

1.3 地图学科学范式的变化

美国著名科学哲学家T.S.库恩(T.S.Kuhn)在《科学革命的结构》一书中提出范式的概念和理论[77]。计算机图灵奖得主Jim Grey于2007年总结了科学研究的4个范式[78],特别提出了“第四范式”,即以数据密集型计算为特征的科学范式。地图学科学范式的发展演进完全符合一般科学范式发展演进的规律,这只要将地图学的发展演进过程同一般科学范式发展演进加以比较分析便可得知。地图学科学的第四范式,是以时空大数据计算、分析与挖掘为特征的当代地图学,发生在当前。

以时空大数据密集型计算为特征的地图学科学范式,使地图学完全有必要也有可能把着重点放在时空大数据的智能化深加工方面来。这主要表现在时空大数据多尺度自动变换、时空大数据分析挖掘与知识发现及时空大数据可视化的理论、方法与技术等方面。毫无疑问,从技术层面讲,20世纪最具里程碑意义的事件是计算机数字地图制图技术取代了传统手工地图制图技术,其中多尺度时空大数据自动综合是核心,至今仍是国际上该领域最具挑战性和创造性的研究热点[23]。经过60余年的艰难研究和总结,目前在普通地图(特别是国家系列比例尺地形图,有国家标准规范约束)的制图综合基本理论、方法和综合指标的计量化,自动制图综合模型、算法、知识及基于知识的推理,基于自动制图综合链的全要素、全过程的综合控制和综合质量评估,以及多尺度相似性度量关系理论等方面,都取得了一系列跻身国际先进水平的科学技术成果[12, 79-95]。不过目前的智能化水平和自动化程度并不很理想,需要进一步研究大规模时空大数据背景下的深度学习、人类自然智能与计算机人工智能深度融合式的智能综合理论和方法,以及基于云计算的分布、并行、协同式的智能综合技术。时空大数据分析挖掘与知识发现,是时空大数据的核心和本质。其中,时空大数据统计分析难度和复杂度要比通常专题地图制图数据(小样本)处理的大,后者已有较成熟的模型方法[14], 而时空大数据的统计分析涉及大数据的取舍(清洗)、统计学与大数据的结合,以及在大数据分布式存储驱动下进行统计计算等一系列科学技术问题[94-97]。用时空大数据思维去发现其潜在价值(预测),即通过时空大数据挖掘发现过去的科学方法发现不了的新模式、新知识和新规律,必将开启地图学的重大时代转型。正因为如此,目前关注并从事该领域研究的人越来越多,发表了不少有关学术著作[97-113],各地先后成立了许多大数据研究院、工程中心和实验室等研究机构,取得了一些成效,同时也面临不少问题。例如:研究商业大数据的多(受商业利益驱动),而研究科学大数据的少(科学决策驱动不够);研究一般大数据的多,而研究时空大数据的少,这涉及对大数据与时空大数据本质的认识问题;研究大数据统计分析的多,真正研究时空大数据挖掘与知识发现的少;时空大数据理论研究薄弱,更未形成理论体系;“时空大数据隐含价值→技术发现价值→应用实现价值”的技术体系尚未形成;等等。这些都是需要进一步研究的问题。时空大数据的可视化,要解决的问题是面向不同层次不同用户需要的可视化主题多变性、强交互性和快速性,即根据众多不同需求从大规模海量数据中快速提取与主题相关的时空大数据,对提取的时空大数据进行统计分析与挖掘,对发现的知识设计或选择知识表达方法(其表现形式更加多样化)并快速可视化,因为时空大数据是实时动态的流数据(数据流),强交互性贯串于“提取数据→分析挖掘→发现知识→设计或选择知识表达方式并可视化”的整个过程。可见,时空大数据的可视化超越了一般的地图可视化和空间信息可视化[112],而且可视化本身就是一种数据挖掘与知识发现方法[113]。

1.4 时空认知与时空地理信息传输模式的变化

时空认知作为基础理论来研究有两个出发点:一是,从社会需求和地图学的功能来看,人类必须不间断地研究自身赖以生存和发展的环境,而这是离不开地图学的;二是,当我们用计算机制图方式生产地图时,人类制图学家必须将自己在制作地图时所表现出的自然智能与计算机人工智能进行深度融合,以提高计算机地图制图的智能化水平和自动化程度。这两个问题实际上是一回事,就是探索人脑和电脑是怎样对时空大数据进行加工处理及其在时空地理信息传输过程中是怎样发挥作用的。

自20世纪60年代以来,学界许多专家研究过地图空间认知和地图信息传输问题[2]。捷克人柯拉斯尼(A.Kolacny)于1969年提出了第一个地图信息传输模式[114], 引起了国际制图学术界对这一问题的关注和重视,随后许多学者都先后提出了一些地图信息传输模式。这些模式虽各不相同,但都可以这样来理解:制图者(信息发送者)把对客观世界(制图对象)的认识加以选择、分类、简化等信息加工并符号化(编码),通过地图(信道)传递给用户(信息接收者),用图者经过符号识别(译码),同时通过对地图的分析和解释形成对客观世界(制图对象)的认识。总起来说,地图信息传输是从整体上研究制图者、地图信息、地图、地图使用者、使用地图的效果这5部分之间的相互作用与关系。整个地图信息传输过程中,地图空间认知贯穿始终。

柯拉斯尼的地图信息传输理论反映了地图学作为一个“系统”的一切特征(完整性、目的性、人的认知活动的基本过程、可控性),统帅和贯穿着地图学的全部研究领域,为地图学理论和实践开拓了更加广阔的研究领域,带来了地图科技工作者的观念转变和更新,对推动地图学的发展起到了重大作用。

然而,在当今时空大数据时代,柯拉斯尼的地图信息传输模式暴露出了其局限性。随着全球卫星导航定位(GNSS)、天空地海一体化对地观测(RS)、地理信息系统(GIS)、机器学习与人工智能、“互联网+”等新兴信息技术的发展,人类对自己赖以生存的时空环境的认识正在由地图空间认知向以现实地理世界为对象,由“感知的地理世界”“重构的地理世界”和“认知的地理世界”构成的全过程、多模式时空综合认知转移。如图 1所示,时空大数据时代的时空感知与认知模式是开放的、动态的、多模式的、综合的,整个感知认知全过程中融入了前述各种新兴信息技术,特别是深度学习和深度增强学习、人类自然智能与计算机人工智能深度融合等技术。

院士论坛|王家耀:时空大数据时代的地图学(论文版)

图 1 时空大数据时代的时空感知认知与时空信息传输模式Fig. 1 The information transmission model considering spatio-temporal sensing and cognition in the era of big data

图选项

2 总结

时空大数据时代的到来,给地图学带来了新的挑战和机遇,地图学必将又一次站在新的起点上向更高水平发展。

无论是古代地图学、近代地图学或是现代地图学,地图学的时空观和方法论都是地图学的最根本的问题,只不过是时空大数据时代我们认识到了这个问题的更加重要性。以哲学视野从整体上研究地图学、地图演化论、地图文化及其时空特性等,地图学的时空大数据思维必将推动理论、技术方法和服务模式的变革。

由传统地图制图时代的制图资料整编,到时空计算机数字化地图制图时代的制图数据处理,再到如今时空大数据时代的多源异构时空大数据融合,反映了地图学数据(信息)源由单源到多源、由少到多、由简单到复杂的趋势,相应地也驱动了制图数据源处理的理论、方法和技术的不断发展。

时空大数据时代的到来,使地图学的科学范式由计算和模拟范式(第三范式)中分离出来而进入当前的数据密集型计算范式(第四范式),这是一种以时空大数据计算为特征的地图学科学范式。这里的“时空大数据计算”,除前述多源异构时空大数据融合外,主要是时空大数据多尺度自动变换、时空大数据分析挖掘与知识发现,以及时空大数据可视化等的理论、方法和技术,最终实现时空大数据价值的最大化。

地图空间认知与地图信息传输是现代地图学的基础理论,对地图科技工作的观念转变和更新起了重要作用。然而,当时空大数据时代到来的时候,由于天空地海一体的智能传感器网技术、移动互联网技术、新兴计算技术、人工智能技术等的快速发展,在人类认知自己赖以生存的现实地理世界的科学活动“三要素”(主体要素——科学家、客体要素——科学活动的对象、工具要素——科学活动的手段)中,工具要素处于越来越重要的地位,作用越来越大,开放、动态、多模式、综合的时空感知认知和时空信息传输新模式,必将成为时空大数据时代地图学理论的基础研究任务。

【引文格式】王家耀。时空大数据时代的地图学[J]. 测绘学报,2017,46(10):1226-1237. DOI: 10.11947/j.AGCS.2017.20170308

院士论坛|王家耀:时空大数据时代的地图学(论文版)

主题测试文章,只做测试使用。发布者:rekoe,转转请注明出处:https://www.mulub.com/6844.html

(0)
上一篇 2024-04-01
下一篇 2024-04-01

相关推荐

发表回复

登录后才能评论
关注微信
捐助我们