如何理解大数据研究的本质

发布时间: 2023年02月25日 文章来源: 人民日报客户端

这是一个很大的话题,我结合这些年在大数据领域从事科研活动所积累的一些经验,来谈谈我对大数据研究的一些看法。

首先,一谈到研究的本质就不能局限在单个学科领域,因为科研的过程是大同小异的,这个过程简单说就是一个“证伪”的过程,在不断提出假说、反驳、再提出新假说的过程中推动学科不断向前发展。

大数据领域亦是如此,很多早期被证实的假说,在特定的场景下也会出现新的问题,比如数据相关性到可解释性就是一个比较典型的例子。随着大数据应用场景不断出现新的变化,一些新的假说也会不断被提出,在开展科研实践的过程中,通过实验可以验证或者反驳这些新假说。

很多同学进入到课题组之后,导师往往会给出一些具体的研究方向,并且会基于现有的研究成果提出一些新的想法(假说),然后学生需要设计相应的实验来验证老师提出的想法,不论是否能够验证老师的想法,这个过程都会获得一定的收获,一些比较幸运的同学可能很快就会收获自己的研究成果。

从应用的角度来说,大数据研究的重点是数据的价值化,数据挖掘、数据分析和数据运维这些操作说到底就是为了实现数据价值化,所以当前产业领域的大数据研究都可以用数据价值化来进行概括。

数据价值化的过程会不断出现新的研究方法和研究平台,而且当前大数据领域的很多研究都会逐渐跟产业场景相结合,这也在很大程度上推动了大数据与传统学科相结合的进度,可以说当前很多传统学科的科研工作者正在借助大数据来拓展自己的研究边界。从这个角度来看,大数据正在成为一个科研工作者的重要工具。

目前实现数据价值化的常见方式是进行数据分析,涉及到机器学习和统计学两大分析方式,所以当前大数据专业的同学都需要重点学习机器学习和统计学知识。

从当前产业领域数据价值化的发展趋势来看,机器人的运用将会为数据价值化打开一个巨大的出口,实际上这已经在大模型的训练当中有了明显的体现,相信随着人工智能产品的逐渐落地应用,大数据也会围绕人工智能开辟出一些新的研究空间。

目前我联合多名国内外知名大学的导师和互联网大厂的企业导师,共同搭建了一个技术论坛,在持续开展关于大数据、人工智能、物联网相关领域的科研实践和成果分享活动,感兴趣的同学可以联系我申请参与,相信一定会有所收获。(刘俊明)


(编辑:户静凝)