|
|||||||||||
|
|||||||||||
人民网>>教育>>滚动新闻 |
|
【字号 大 中 小】 | 打印 | 留言 | 论坛 | 网摘 | 手机点评 | 纠错 |
大数据科学或成科学研究的最新范式,但国内部署几近空白
尤其值得注意的是大数据科学研究,“不光是搞统计的,搞代数的,乃至做拓扑的科学家都关注大数据。”李国杰如是说。报告也专门将这一分领域的变化拎到总论中作如下表述:与实验科学、理论分析和计算机模拟这三种经典科研范式相比,大数据科学将成为一种全新的科研范式。
数据无处不在,麦肯锡全球研究院预测,到2020年,全球数据使用量预计相对于2011年将暴增44倍,达到35ZB。具体而言,数字信息从各种各样的传感器、测试仪器、模拟实验室、文化娱乐企业和个人使用的数字终端中源源不断地涌出。报告称,超过传统数据库系统处理能力的海量数据即大数据隐含巨大价值,以网络数据为例,报告称,网络数据之间的相互关系其实是人与人的相互关系。
然而,这其中许多数据缺失、重复或是没有价值。对科学家而言,未来的主要任务不是获取越来越多的数据,而是进行数据的去冗分类,去粗取精,从数据中挖掘知识。报告称,几百年来,科学研究一直在做“从薄到厚”的事情,把“小数据”变成“大数据”,而现在要做的事情是“从厚到薄”,要把“大数据”变成“小数据”。
尽管学术界已经注意到大数据带来的机遇和挑战,但对大数据提出的科学挑战问题还没有形成共识。2007年,已故的图灵奖获得者吉姆·格雷在他的最后一次演讲中描绘了科研“第四范式”的愿景,将大数据科学从第三范式即计算机模拟中分离出来。谷歌公司研究部主任皮特的一句名言可以概括两者的区别:“所有的模型都是错误的,没有这些模型反而增加你成功的机会。”报告认为,谷歌的广告优化配置、战胜人类的“IBM沃森问答系统”都是这样实现的,而这就是“第四范式”的魅力。
与此相应的是,世界各国就大数据开始部署相关政策。2012年3月,美国政府就已经启动了“大数据研究和发展创新计划”,随后,6个部门拨款两亿美元,争取增加100倍的分析能力从各种语言的文本中抽取信息。报告称这是一个标志性的事件,说明继集成电路和互联网之后,大数据已成为信息科技关注的重点。
遗憾的是,目前中国在此方面的布局几近空白,报告也因此建议“急需尽快部署”。具体来说,报告称中国需要建设一个符合这一新型科研活动范式的国家公共创新平台,尤其是一个国家级基础数据资源库,即一个包括生物数据库、人群和临床样本库及电子健康档案库等跨学科跨领域的国家科技资源体系。
新闻排行 | 重点推荐 |
视频新闻 | 更多>>> |
|
重点推荐 |
高考资讯 备考辅导 院校报考 互动交流 |
高考最新动态高考视点高考政策各地动态新闻人物家长必读 高考大纲语文数学外语物化生历地政文综理综作文作文素材库满分优秀作文 高校招办访谈招生动态高校信息库院校信息专业动态模拟填报系统志愿填报技巧 在线做题估分高考论坛高考博客圈讨论区考试经验交流试卷上传试卷下载许愿送祝福 |
欢迎教育机构、媒体、高校、出版单位联系合作! 电话:65367973 信箱:jypd@people.cn |
呼叫热线 4008-100-300 服务邮箱 kf@people.cn
人民日报社概况 | 关于人民网 | 考生服务 | 招聘英才 | 广告服务 | 合作加盟 | 供稿服务 | 网站声明 | 网站律师 | 呼叫中心 | ENGLISH
京ICP证000006号 | 京公网安备110000000008号 | 网上传播视听节目许可证(0104065) | 中国互联网视听节目服务自律公约
人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用
Copyright © 1997-2013 by www.people.com.cn. all rights reserved