报告人:丁虎,中国科学技术大学
报告地点:新校区信息楼535
报告时间:2024年7月18日(周四)上午10:00-12:00
报告题目:面向人工智能的若干高维计算几何问题研究
个人简介:
丁虎,2009年本科毕业于中山大学数学系,2015年博士毕业于美国纽约州立大学布法罗分校计算机科学与工程系,并获全系最佳博士论文。主要研究方向包括计算几何、大数据优化算法,以及在人工智能、芯片设计、生物医学等领域的应用。曾任美国密歇根州立大学计算机科学与工程系(tenure-track)助理教授,博士生导师。2018年6月到中科大永利集团304am官方入口工作,任特任教授,博士生导师。已在知名国际会议和期刊上发表近50篇文章。其中作为第一/通讯作者的科研成果发表在SODA、SoCG、ICALP等算法理论,以及NeurIPS、ICML等应用领域的国际顶级会议。曾获美国自然科学基金CRII Award, 伯克利Simons Fellowship等。多次受邀担任国际知名会议、期刊的审稿人或程序委员会成员。作为计算机算法方向的专家,曾受邀参加美国科学基金的项目评审工作。主持多项国家/省部级科研项目,现为国家科技部重点研发计划青年科学家项目负责人(2021-2026),中科大创新团队培育项目负责人(2022-2024)。
报告简介:
随着大数据和计算设备的发展,人工智能已经影响到了我们生活的方方面面。然而,如何设计高效的算法仍然是限制人工智能技术应用的主要瓶颈之一。由于很多人工智能模型所需的数据都处于高维几何空间,一部分棘手的人工智能算法问题可以通过高维空间的计算几何技术来解决。在这个报告中,我们将介绍这方面研究的三个具体实例。(1)高维空间的密度聚类算法DBSCAN。聚类是诸多大规模数据处理场景中的基础手段之一。DBSCAN作为最流行的密度聚类算法之一,在低维空间表现出非常优秀的数据处理能力。然而,由于严重依赖近邻计数等操作,DBSCAN很难应用于高维数据。我们新的DBSCAN算法可以有效地突破这一限制,给出在高维空间的线性时间复杂度,并且可以方便地应用于流数据。(2)高维空间的最小球覆盖问题。最小球覆盖问题是一个基础性的高维几何优化问题,尤其与机器学习中的分类问题有着非常重要的联系。然而传统的最小球覆盖算法往往需要反复迭代读取数据,算法效率较低。这里我们将介绍一种新颖的次线性算法,显著地降低了已有算法的复杂度。(3)数据依赖的核心集构造方法。核心集是降低数据规模、提高计算效率的常规方法之一。然而现有核心集构造方法往往依赖于优化目标的VC dimension, 而且构造复杂度通常较高。我们将介绍一种适用于机器学习领域ERM模型的通用核心集构造方法。我们的方法不依赖于优化目标的VC dimension, 同时可以有效处理动态更新、Outliers等问题。