2021年12月,中央网络安全和信息化委员会印发《“十四五”国家信息化规划》指出要立足新发展阶段,着力夯实数字基础设施建设水平,发展新一代信息技术,持续推进数字化转型、网络化协同、智能化变革。计算机科学与技术系老师们聚焦国家重大战略需求,立足新阶段我国实际,致力于云计算、物联网、机器学习、群体智能优化、遥感数据处理及工业生产等国际前沿方向和国家战略性新兴产业领域,取得一系列原创性成果,推动了计算智能及其实际应用一体化发展。
一、机器学习及优化方法在高光谱图像处理中的应用
随着高光谱遥感技术的快速发展,不同领域的高光谱图像数据随之而产生。高光谱遥感技术利用许多连续的狭窄电磁波波段对观测区域成像,获取观测区域的丰富连续光谱信息,同时实现了其地物空间信息和辐射信息的同步获取。与传统的RGB图像相比,高光谱图像在不同的应用领域中具有巨大的应用价值和广泛的发展前景。由于高光谱图像具有高维的连续光谱波段和复杂的地物空间分布的特点,高光谱图像的应用也面临巨大的挑战。针对高光谱图像独特的数据特性,蔡之华教授课题组在国家高新技术研究发展计划(863)项目、国家自然科学基金项目、湖北省自然科学基金创新群体项目等支持下,系统地提出“数据降维—地物识别”的解决思路,通过挖掘光谱波段的内在关联以实现波段选择或特征提取,从而提高高光谱图像的地物识别精度。
针对因时间累计而造成滤波器精度下降的问题,蔡之华教授课题组对演化算法进行研究并将其与Kalman滤波器相结合,以提高Kalman滤波器的鲁棒性,主要开展了以下几个方面的研究:(1)自适应差分演化算法的改进; (2)基于改进差分演化算法的自适应Kalman滤波器;(3)演化自适应Kalman滤波器框架和适应值函数;(4)基于占优的改进多目标差分演化算法及其在Kalman滤波器中的应用研究等。通过研究完善了演化Kalman滤波器的框架,改进了差分演化算法的性能和演化Kalman滤波器的性能,为今后进一步研究演化Kalman滤波器和其他自适应Kalman滤波器提供了参考。
针对高光谱图像的光谱维度高和波段冗余的问题,蔡之华教授课题组提出一系列有效的波段选择和特征提取方法,探索不同波段之间的相互作用,使数据具有更强表达能力,从而有助于提高地物识别的效果。为了挖掘重要波段的重建能力,提出了基于注意力机制的波段选择方法,利用波段注意力机制自适应学习波段对光谱重建的贡献率,形成一种具有灵活架构且可与任意现有网络耦合的波段学习框架。为了探索波段的结构化信息,提出了基于图卷积自表示的波段选择方法,利用波段的成对关系构造波段图,将图卷积引入到自表示模型,在非欧几里得域中建模。为了图像的全局和局部信息,提出空谱超像素主成分分析法的高光谱图像特征提取方法,利用超像素分割技术获取空间信息并使用主成分分析法生成局部特征表示,最后将全局特征表示和局部特征表示进行有效融合降维。
图1基于注意力机制的波段选择
针对高光谱图像的地物分类问题,蔡之华教授课题组提出一系列有效的高光谱图像分类方法,探索波段反射信息与像素类别标记的关联信息,从而提高地物识别的精度。为了解决有监督的分类问题,提出了基于协同光谱-空间注意力密集网络的高光谱图像分类方法,其注意模块由光谱轴和空间轴组成,具有计算量小和分类性能好的特点。为了解决无监督的分类问题,提出了基于图正则化残差子空间网络的高光谱图像聚类方法,通过深度神经网络联合学习深度光谱空间表示和鲁棒非线性亲和。为了利用结构化信息促进无监督分类,提出了基于图卷积子空间聚类的高光谱图像聚类方法,将数据的自表达性重新定义为非欧几里德域,从而产生了一个更健壮的图嵌入字典。
图2图卷积子空间聚类的高光谱图像聚类
图3 科学技术奖励证书
基于相关研究成果申报国家专利14项,其中获授权8项,发表高水平学术期刊论文90余篇,知名国际会议论文80余篇。其中,ESI高被引论文7篇,IEEE及ACM汇刊论文20余篇,CCF推荐会议论文10余篇。出版专著4部、译著1部。成果获湖北省自然科学二等奖、湖北省自然科学三等奖各一项。成功应用于湖北省地质调查院的地球化学图斑赋值系统、基于深度学习和多源高光谱遥感图像的梁子湖区自然资源分布与变化监测系统中,较好地解决了小样本情况下预测模型泛化能力不足的问题,为湖北省地质调查院的地质大数据平台提供了新的智能化模块,节约了大量的人力成本。
二、知识驱动的群体智能优化方法
以新一代人工智能为背景,瞄准智能计算国际学术前沿,聚焦“群体智能优化全局勘探与局部开采增强与权衡”这一关键科学问题,龚文引教授团队系统深入开展知识驱动的群体智能优化研究,取得了一系列具有重要理论意义和应用价值的基础性研究成果。主要发现点如下:
图4排序学习差分算法及参数自适应改进算法
(1)发现了数据驱动的隐含知识对群体智能优化性能影响的规律,挖掘了个体排序、参数特征、多种群协同等算法知识,设计了基于排序、自修复、竞争与合作机制的学习策略,拓展了数据隐含知识提升群体智能优化性能的新途径。
图5知识驱动的群智能算法及调度问题求解
(2)发现了问题解析知识对群体智能优化性能影响的规律,凝练了时序相关性、可分解性等问题特性知识,设计了基于策略迭代、模型分解机制的学习策略,拓展了问题解析知识提升群体智能优化性能的新途径。
图6求解非线性方程组多跟的自适应群智能算法
(3)发现了多域知识协同对群体智能优化性能影响的规律,提出了基于问题多解特性、参数自适应等知识的融合机制,设计了基于自适应、动态排斥机制的学习策略,拓展了多域知识共融提升群体智能优化性能的新途径。
“知识驱动的群体智能优化”获得2021年度湖北省自然科学二等奖。研究相关5篇代表性论文他引516次,其中Web of Science数据库他引464次,三篇论文入选了ESI高被引论文。成果得到了19位IEEE Fellow、9位中外院士、45位SCI国际重要期刊编委等学者的正面评价,并在智能制造、物流、能源、遥感等领域得到推广应用。
图7 科学技术奖励证书
三、不确定环境下动态协同与智能柔性排产方法
龚文引教授作为课题负责人参与的“十四五”国家重点研发计划工业软件重点专项“复杂施工环境下大型工程装备设计/制造/运维一体化平台研发与应用”项目成功立项。该项目由中国铁建重工集团股份有限公司牵头,共分5个课题,分别由浙江理工大学、太阳集团TYC官方入口官网、浙江大学、雪浪数制科技有限公司和中国铁建重工集团股份有限公司承担各课题的研发工作。该课题聚焦多边下工程装备状态多变、扰动频繁的问题,研究基于模型的“机-电-液”多领域工艺集成方法,揭示供应链多维度协同的动态调度耦合机制,实现数据和知识双驱动的柔性排产方法。
图8不确定环境下动态协同与智能柔性排产
四、全栈软件定义框架促进云边端系统一体化发展
随着云边端系统一体化进程的推进,海量的设备需要接入系统以满足不同的业务的需求。然而大规模的设备使得现有的管理方法往往会面临着难度大、成本高、效率低等诸多挑战。软件定义允许使用软件去定义系统的功能,用软件给硬件赋能,进而解耦上层应用软件和底层硬件资源之间的紧密关系,实现对硬件资源的统一管控、按需分配按需配置与分配。因此如图4使用软件定义技术为云边端系统提供软件分发、路由选择、服务升级等全栈式管理有效提升系统运行效能并降低系统维护开销,也因此软件定义被视为云边端系统一体化的重要基础技术。
图9全栈式软件定义
然而,传统利用软件定义技术来实现云边端系统中任务分发的策略通常忽略了计算节点之间的软件共享的特征(譬如共享同一依赖库、镜像层、输入数据等),进而使得整个分发过程与无线通信特征孤立,导致软件定义过程效率低、开销大、时延长的问题。针对这一问题,曾德泽教授课题组率先将网络编码引入至无线软件定义,利用无线通信广播特性,以提升软件共享效率,并在此基础上构建了可最大化无线软件定义过程能效的优化理论模型与方法。此外,传统软件定义过程通常以控制器为源点,由于跨节点多任务软件共享,任何节点均可能为源,而利用网络编码可有效发挥基于多源节点的无线数据分发速度,进而显著提高了无线软件定义效率与传感网络异常修复速度。该项研究成果已经发表在IEEE Transactions onComputers(CCF A类,ESI高被引论文)等国际学术会议和杂志上,并由Springer出版了《Software Defined Systems Sensing, Communication and Computation》学术专著。
五、供需动态敏感的编排调度技术破解了云边端系统资源动态供需矛盾
云边端系统与传统云计算环境的一个显著区别是其服务需求与资源供给两方面高度的时空动态性。首先,服务的请求数、服务的质量需求、服务的种类在不同的时刻都会发生变化。其次,云边端系统中各个边缘节点上的背景负载、各个网络链接上的背景流量也具有时变性,背景负载和背景流量的动态性往往会导致云边端系统的可用资源也呈现高度动态变化的特性。高度动态的背景负载和资源需求会直接影响容器化服务的性能,进而产生资源利用率低下等问题。因此,如何智能挖掘系统数据从而学习和预测系统背景负载的变化规律是云边端系统高效在线编排的关键之一。
尽管系统动态事件和背景负载的变化发生的时间不确定,但长期来看通常呈现出某种规律。因此,曾德泽教授课题组综合考虑服务需求变化、物理网络特征,设计了基于深度确定性策略梯度的强化学习算法来提供智能化的在线编排。针对算法在大规模动态网络中应用时的维度爆炸问题,创新性地引入了数学模型优化方案来辅助强化学习的动作探索,设计了双重经验缓存区和多优先级经验采样策略,实现了23倍的训练速度的提升,并达到了服务的长期效用的最大化的目标。相关项研究成果已发表IEEEJournal of Selected Area in Communication、INFOCOM等顶级国际学术会议及期刊上。并获得获IEEE System Journal、ICA3PP最佳论文奖
图10模型辅助的强化学习架构
六、算力异构敏感的云边端服务系统构建
异构性是云边端系统中另一重要特性。一方面,云边端系统中存在着大量的异构设备,诸如各类云服务器、个人电脑、终端设备等。这类多元异构设备其硬件设计、指令集、及体系结构等均差别巨大,难以使用统一的方法来调度编排这些异构的算力资源。此外,不同服务需要不同数量的异构计算资源以满足其性能需求,特别是采用不同异构硬件运行所需要的资源量差异巨大。由于异构硬件各自独特的特性和服务异构的资源需求,传统调度方案往往会面临效率低、开销高的问题。因此,在云边端系统中,如何根据服务的性能需求自动为其进行高精度的异构资源容量规划,以使用“刚好足够”的异构计算资源执行服务是满足服务质量,降低云边端系统成本的必要手段。
图11多元异构的算力设备
针对这一问题,曾德泽教授课题组设计了“存储-计算-网络”全局联动资源协同调度框架。一方面,针对云边端系统中异构的算力资源制定了面向算力高异构设备的多维资源加权优先级规则,并由此重构Kubernetes实现了云边端一体化微服务系统,降低了23.9%的算力资源开销。另一方面,为进一步提升服务质量与响应时间,并降低资源开销,创新性的提出了容器镜像分层共享的服务部署方案。通过利用不同的容器化服务只读层可以共享这一特性,降低了容器镜像下载和存储两方面的开销,使得云边端系统中的服务冷启动时延降低了56.5%,而存储开销降低55.3%,解决了边端资源受限和服务泛在部署难题。相关成果发表在IEEE Transactions on Parallel and Distributed Systems、INFOCOM、ACM SoCC等国际学术会议及期刊上,并由Springer出版了《Cloud Networking for Big Data》学术专著,获得ICPADS最佳论文奖。
图12容器只读层共享
图13 ICPADS 2020最佳论文奖
后记:
全球已经进入了智能化、数字化新时代,我国数字化建设进入普惠发展期,基于智能计算的应用需求激增,新一代智能信息技术正在助力产业数字化转型。目前云计算、物联网、机器学习、群体智能优化、遥感数据处理及工业生产等国际前沿方向和国家战略性新兴产业领域中仍有许多开放且亟待解决的难题,需要相关的从业人员去探索。我们将顺应国家的发展战略,响应国家号召继续利用自身优势和条件,在该方向上继续探索,为国家在计算智能及其实际应用一体化发展的方向上贡献自己的力量。
通讯员:吴亦奇
审核:李国昌
校对:石剑峰