销售热线:

15815810717

首页 > 新闻资讯 > 行业新闻

华盛顿大学教授借鉴经验解释为什么大数据如此复杂

2019-3-5
文章导读:

华盛顿大学统计学和生物统计学教授Daniela Witten于3月1日发表了一场关于大数据产生的独特和现代研究问题的演讲。

注:本站文字、图片、视频素材来源于网络,如有侵权,请联系akz@daikin.news删除。不便之处,请多多包涵。
 

华盛顿大学统计学和生物统计学教授Daniela Witten于3月1日发表了一场关于大数据产生的独特和现代研究问题的演讲。 Witten从她自己的工作中抽取了一些例子来说明大数据统计的复杂性。


华盛顿大学教授借鉴经验解释为什么大数据如此复杂

“即使你的数据如此之大,以至于存储成本也很高,等待五分钟,”Witten说道,开始讲课时带着一些笑声。


随着技术进步提高了存储容量和计算能力,数据处理变得越来越容易,也越来越便宜。正如Witten在讲座中所展示的那样,对人类基因组进行解码,这一成就在2001年耗资1亿美元,现在只需1000美元即可完成。


对研究人员来说,这意味着随着总体成本的快速下降,以及可以使用的更多数据,他们可以提出更新、更挑战性的科学问题。


例如,神经科学从这些技术改进中获益匪浅。一个值得注意的例子是Allen Brain Observatory的钙成像技术的进步,这是一种利用钙水平跟踪活动的脑成像。 Witten与研究人员合作,以比以前更高的细节水平分析小鼠大脑中各个神经元的镜头。


Witten向观众展示了鼠标大脑的视频,因为单个神经元在黑色背景下实时闪烁和闪烁。这项研究提供了大量可能对神经科学家有用的数据。


但是这个数据量存在一个潜在的问题:需要对其进行适当的分析。


与某些在大尺度上或多或少保持真实的物理定律不同,例如重力,经典的统计分析在遇到这些大量数据时不再适用。


“所有你学习如何做的事情,比如统计数据101,不再适用了。” Witten说。


根据Witten的观点,经典统计假设观测数据的数量超过了数据集中的特征或测量值。


“如果你要预测一个孩子的父母身高有多高,那么你父亲的身高有多高。”Witten解释道。


然而,对于大量数据,测量的变量数量远远大于观测值。 Witten将这种数据状态称为高维设置,并且在此高维设置中,旧规则不适用。


“大数据有其独特的挑战,”Belinda Li,一位活动参与者和计算机科学高级专业学生说。她对这些挑战的兴趣和朋友的邀请使她进入拥挤的房间。


Kane Hall的210室对于Witten的讲座来说是完整的,该讲座由华盛顿大学的数学系组织。一旦讲座开始,几乎所有房间的240个座位都被拿走了,而且有几个后来者希望坐下来或站在房间的两侧。


Witten表示,计算和存储不是涉及大数据的最重要问题。真正的挑战是统计分析。使用大数据的统计学家,如Witten,面临着一个新的、快速发展的领域、需要新的统计技术。


“你可以花费数百万美元来收集数据,然后你就拥有了这些数据,但你并没有为数据收集数据,”Witten说。“你收集它来实际收集它的科学见解,并且......获得这些见解并不是一件小事,你可以通过点击式软件来做事。这需要大量深刻的科学思想和统计思想。”


< 返回上一页
上一篇:什么是大数据架构?
下一篇:人工智能解决网络劳动力的问题?
猜您喜欢的: