设为首页 加入收藏
你目前位置: 首页 实验室 研究工作

研究方向

实验室研究方向含自然语言处理、网络安全、图像信息处理和物联网应用:

(1)自然语言处理:主要从事互联网环境下的文本信息处理及应用的基础研究,如语料库的精、深加工、语言模型等;文本信息处理及应用的应用性研究,如互联网搜索引擎等。目前主要研究海量文本分类、词义计算、基于统计的句法分析、基于网络环境的大规模语料库精深加工。以上研究的目的主要以应用于搜索引擎和机器翻译为目的。在自然语言的大方向下,主要从事词义表示和文本分类等。一词多义是任何一种人类语言普遍存在的语言现象。如何在一个具体的上下文中自动标识出多义词的义项,称为词义消歧(Word Sense Disambiguation, WSD)。而进行大规模的词义标注语料库建设,是该研究的基础工作。同形标注语料库建设。同形(Homograph)也是一个普遍的语言现象,作为粗粒度的义项区分,同形标注语料库的建设是必要的,实施基础比较牢靠(有北大的《现代汉语语法信息词典》支撑),大规模实施相对容易,也是细粒度词义标注语料库的前期工程。词语相似度(Word Similarity)计算工作方面,通过已经完成词语切分、词性标注、(粗/细 粒度)词义标注的人民日报语料,采用统计模型和算法,计算任意两个词语之间的词义相似度。该工作作为一项基础研究,将为WSD,语言模型(language model),词典自动构建等研究课题服务,甚至可以直接应用到自动文摘、问答系统等应用系统中。

(2)网络安全:主要从事网络入侵检测、网络安全风险评估、网络行为异常检测、计算机网络新技术、网络信息系统等研究和开发工作。互联网环境下的网络行为模式错综复杂、瞬息万变,对大规模网络行为的监测难度也日渐加大,网络行为监测工作已引起了政府、学术研究机构、网络安全工业界的高度重视。当前的互联网行为主要体现在搜索引擎、社交网站、电商应用、网络视频、网络游戏、移动互联网等六个方面。但是,残酷的互联网安全现状表明,在正常网络行为背后,还隐藏着大量的网络用户误操作、恶意网站浏览、非法窃取数据、网络管理不当、恶意用户入侵、计算机设备异常等异常网络行为,这些大规模异常网络行为带来后果的严重性从权威机构发布的报告中可见端倪。目前尚缺少对大规模网络行为进行有效的异常检测方法,亟需在理论上对网络行为异常检测展开深入的研究,以便为主动的网络安全管理奠定理论基础。目前,网络安全团队正开展互联网环境下海量网络行为异常检测工作,力图解决网络行为的细化分析、对异常网络行为的自适应分析、对大规模网络行为模式的分析等问题。

(3)图像信息处理:包括图像增强、图像去噪、图像融合、计算机视觉、模式识别等。数字图像在获取和传输的过程中通常都会受到不同程度噪声的干扰,这样不仅严重影响图像的视觉效果,并且为后续的分割、识别、理解等高层处理带来很大的困难,因此图像去噪和增强研究是数字图像底层处理的重要内容之一。基于偏微分方程的图像处理模型因为有强大的数学理论为基础,具有其它增强和去噪方法所不具备的诸多优势。针对已有的基于空间分数阶偏微分方程的图像去噪模型存在的问题,引入以分数阶梯度模值为参数的边缘停止函数,并利用改进的非整数步长的分数阶微分滤波器,构建八个方向的分数阶微分掩模来实现空间偏微分方程的数值计算,最后通过将基于空间分数阶偏微分方程的图像去噪模型转换为分数阶微分掩模算子与噪声图像的相关和卷积操作来实现图像去噪模型的数值计算。另外还包括分数阶微积分及分数阶偏微分方程理论在图像增强中的应用研究。图像融合主要是针对多模态图像的融合,如红外图像与可见光图像的融合,多模态医学图像的融合,研究内容涉及到融合图像的预处理;多模态图像的配准;图像融合算法。计算机视觉主要研究场景拼接,其中也包括图像配准算法研究、相机标定算法研究和图像处理算法研究等。

(4)物联网应用:近期在政府和企业的推动下,物联网发展速度很快,它的安全性逐渐成为各相关科研机构研究的热点。尤其是近年来伴随着 RFID 相关技术的发展,物联网的应用领域变得更加广泛,所以研究的物联网的安全性问题变得更加重要。基于 RFID 技术的物联网一般工作原理为:RFID 标签进入读写器读写范围后,读写器读取标签信息,通过可信的信道传到 RFID 中间件处理,经过数据采集、信息过滤、ID 验证等一系列的数据处理工作,然后将数据传到后端信息系统为其他企业的行业应用系统提供服务。RFID 标签中的信息常常存放的是用户的隐私信息或者是物品的重要信息,这样的信息在系统的某个传输环节中都存在被窃听或者篡改的可能。因此,RFID 作为物联网中关键的技术之一,研究 RFID 系统的安全性可以更加具体的为物联网的安全性研究打下基础。