敖翔:金融数据“挖掘”能手
金融数据“挖掘”能手
本报记者 梁剑箫
金融数据挖掘,是一个融合金融和数据挖掘的交叉学科。当前,在这一领域搞科研的人中,有计算机研究者,也不乏金融工程学者。中国科学院计算技术研究所副研究员敖翔,就是这一领域的一位计算机研究者。
“计算机研究者更加侧重利用数据,特别是文本、行为等以往并未被很好利用的新兴数据。研究设计复杂的智能算法来分析数据;而金融工程学者则更擅长从金融业务出发,研究哪些数据对某个应用有直接影响,显著性如何,等等。”在敖翔看来,这两类研究相辅相成,协同发展。多年来,敖翔一直将精力和感情倾注在金融数据挖掘的学术研究之中,取得了不少成果。
2015年,敖翔博士毕业,留在中科院计算技术研究所,成为一名助理研究员。当年底,他和上海证券交易所合作,研究如何发现违规交易行为证据。“这个项目,开始因为我不是很了解金融业务,进展不太顺利。后来通过学习了一些业务知识,最终设计出非常快速的并行挖掘算法。”敖翔说,他和团队成员将计算时间的级别从“天级”缩短到“秒级”,大幅加速了计算时间。此后,这一算法在很多场合使用。
学术研究过程中,敖翔感觉最快乐的,莫过于设计的计算机算法在实际生产生活中发挥了切实功用。
2017年底,敖翔和某金融机构合作一个金融舆情情感分析项目,研究财经新闻里是否可能蕴含公司债违约风险的算法。这个算法,受到了人工智能国际顶级会议的关注,还于2018年部署在某公司智慧债券的一款产品中。“相当于在原产品的风险评级模型里加入了领先因子,大幅提升了预警准确率和提前预警的时间窗口。”后来,那款债券产品成功拉升了市场占有率,国内一些银行、券商和保险公司都开始使用。
“我们从事应用基础研究,最希望的就是论文里的算法能够落地,有实际贡献。”敖翔说,一个好的算法,不是追求模型的过于复杂,而是在实际场景中能用、好用、易用,这也是他们一直努力的方向。
随着研究日益深入,敖翔也逐渐发现金融数据挖掘领域的纠结之处。在他看来,金融领域是具有悠久历史的传统行业,这一行业积累了非常优秀的行业规则和专家经验等。然而,人工智能和金融数据的结合方法,目前主要集中于通过输入原始数据,让数学模型自动提取特征并判别任务,“这其实在金融行业并不完全适用”。敖翔认为,这种模式缺乏可解释性,难以辅助金融决策,而且不利于行业知识长期累积。如果要解决这一瓶颈,需将金融行业知识和深度学习方法巧妙结合,找到创新点。
如今,敖翔已在数据挖掘、人工智能领域的国际顶级期刊和会议上发表论文20余篇,主持国家自然科学基金、CCF—腾讯犀牛鸟科研基金、蚂蚁金服安全专项科研基金等近10个项目。
未来,敖翔的最大愿望,是围绕金融监管领域,为国家金融发展作出应有的贡献。
下一篇:中国5G芯片与华为完成互通测试
中国观察