中国力量占领KDD:垄断“,大数据领域的世界杯”;全冠亚军,北航获得最佳学生论文奖-量子位

时间 • 2023-04-14 09:38:31
大学
学习
论文

作为数据挖掘、知识发现领域的最高学术会议KDD2020的所有奖项已经公布。

由KDD、全称Knowledge Discovery and Data Mining、SIGKDD举办,后者是美国计算机学会ACM旗下的数据挖掘和知识发现专业组织。

在此次AI峰会上,中国的力量,依然令人瞠目结舌。

其中,北航学生获得最佳学生论文,滴滴出行6篇论文入选

另一方面,在挑战赛中,美团、第四天堂、蚂蚁金服、深度赋智等行业团队,以及国立台湾大学、东南大学、上海交大、中山大学、清华大学等学术界团队获得了所有赛程的冠军和亚军。

本次挑战赛的主办方大部分来自中国,包括阿里巴巴达摩院、清华大学、BienData、第四天堂、滴滴出行等。

此外,“汤继良”、“盛胜利”、“唐杰”等华人学者也在本届SIGKDD大会上获得多项奖项。

最佳论文奖

今年的最优秀论文奖由出身于谷歌研究院的沃德克里斯汀和斯蒂芬伦德尔获得。

本文对样本指标进行了调查,提出在测量标准计算中应避免抽样。

这是为了加速度量标准的计算,通常使用采样模式进行度量,只对较小的随机项目和相关项目集进行排名。但调查显示,示例度量与精确度量不匹配。因为这些度量不保留对相关项目的描述。

另外,样本越小,指标间的差异也越小,非常小的样本中所有指标都是AUC指标。因此,通过最小化不同的基准(偏差或均方误差),可以提高样本指标的性能。

另外,今年KDD的最佳学生论文奖由杜克大学陈怡然小组和北航的研究人员获得。

最佳学生论文奖

来自北京航空航天大学的段逸骁、杨建磊和杜克大学的陈怡然、Ang Li和Huanrui Yang获得了最佳学生论文奖。

据说论文第1作品的Ang Li现在是阿里巴巴达摩院的实习生。

为了解决深学习数据集侵害用户隐私的问题,本文提出了一种在能够从中间特征中隐藏隐私信息的同时我们提出了一个名为TIPRDC的框架,用于学习能够最大限度地保留嵌入原始数据中的原始信息的特征提取器。

为了实现这一目标,团队设计了一种混合训练方法来学习中间特征,包括对抗训练过程,用于从特征中隐藏隐私信息,并使用基于神经网络的互信息估计器设计了一种混合训练方法来最大限度地保留原始信息。

从评价效果来看,TIPRDC明显优于其他现有方法。

华人获新星奖、时检奖

此外,KDD首个新星奖(旨在表彰KDD社区博士毕业5年内获得卓越科研成果的年轻学者)授予了两位华人学者汤继良。

这位在特征学习领域做出杰出贡献的学者,目前正在密歇根州立大学数据科学与工程实验室进行研究。

KDD的第一届应用科学时间验证奖授予了获得《ArnetMiner:Extraction and Mining of Academic Social Networks》论文的清华大学计算机科学与技术系长聘教授唐杰。

据悉,唐杰教授现任清华大学计算机系副主任,曾入选国家“杰出青年”名单,现发表论文200多篇,被引用10000多次(个人h-指数59)

KDD的时间检查研究奖(表彰10年前杰出的KDD论文)授予美国阿肯色中央大学计算机科学系教授和数据分析实验室主任盛胜利。

不仅是KDD2020,从中国来的学者们的活跃也能看到,被称为“大数据领域的世界杯”的KDD Cup2020,也能感受到来自中国队的力量。

中国独占“大数据领域世界杯”冠军亚军

除了KDD这样的全球AI峰会之外,SIGKDD每年都会举办KDD Cup挑战赛,面向学术界和业界。

今年挑战赛各赛程的组织者,包括阿里巴巴达摩院、清华大学、BienData、第四范式、滴滴出行等,几乎都来自中国。

在今年的机器学习、AutomML机器学习和强化学习三大课程中,中国队包揽了所有冠亚军。

我们来看看这次比赛的获奖结果吧。

一般机械学习课程

在KDD CUP 2020中,通常的机器学习分为两个课程。

机器学习课程一个由阿里巴巴达摩院主办,其中阿里、杜克大学、清华大学和UIUC也赞助,两项任务各有一千多个小组参加。

电路1具有两个任务:多模式召回和去穿孔。

在任务1中,国立台湾大学(WinnieTheBest)和美团评语(MTDP_CVA)的队伍分别获得了第1名和第2名,但是第3名的队伍也同样来自美团(aister)

在任务2中,美团评价(aister)和深度赋智(DeepWisdom)的队伍获得了冠军和亚军,而第三名队伍来自北京航空航天大学。

机器学习课程2有学术图纸上的对抗攻击和防御任务,涉及生成对抗网络(GAN)的知识。

在赛程二,最终的冠军和亚军由上海交通大学(SPEET-卓工)和中山大学、杭州电子科大学(ADVERSARIES)的团队获得,其中第三名球队(DaftStone)来自中国科技大学。

本次机械学习课程2的主办者为BienData,共有544名选手参加。

AutomML计算机学习课程

对于Automl机器学习课程,将重点放在图上以表示学习技术,核心任务是图的拓扑结构、学习节点或全图的向量表示,更常用于下游机器学习任务(商品推荐、知识图补充、交通量预测等)

该课程的主办方是第四款,其中ChaLearn、斯坦福大学和谷歌共同合作。

最终的优胜是美团的评语,中国科学院大学和清华大学(aister)的队伍获得,亚军是南京大学(PASA_NJU)的队伍,第3位队伍是蚂蚁金服(qqerret)的队伍。

值得一提的是,这场比赛的所有代码都在GitHub上发布了公开链接,感兴趣的小伙伴们可以自己学习(文末附上公开链接)

强化学习课程

本次强化学习课程由滴滴举办,设计了订单分配和车辆调度两项任务。参与团队需要设计一种算法来指定分派窗口中的订单和司机匹配,并引导空闲司机前往特定目的地。

此次共有1195名参赛选手、计算机科学系支队伍参赛,比赛结果昨天在KDD大赛上公布。

其中,第一个任务的冠亚军分别由来自第四正规式和“北航”(Polar Bear)、“中山大学”(EM)的球队获得,第三名是来自Lyft的球队。

第二个任务是东南大学、帕杜大学(TLab)的团队以及南京大学(wait a minute)的团队获得第二名,第三名是日本的NTTdocomo实验室。

论文链接:

最佳论文:https://dl.ACM.org/doi/pdf/10.1145/3394486.3403226

最佳学生论文:https://arxiv.org/abs/2005.11480AutoML

项目链接:

https://www.4paradigm.com/competition/kddcup2020

参考链接:

https://www.kdd.org/kdd2020/

https://www.reddit.com/r/MachineLearning/comments/ihg1kw/r_kdd_2020_video_collection_best_papers_keynotes/

https://www.kdd.org/kdd2020/kdd-cup