JSON

树状大数据系统Steed与JSON数据处理

字号+ 作者:H5之家 来源:H5之家 2017-12-09 14:09 我要评论( )

报告人:陈世敏 研究员(中国科学院计算技术研究所 ) 时间: 2017 年 11 月 10 日(星期五)下午 14:00-15:30 地点:复旦大学张江校区软件楼 102 第二会议室 联系人:王晓阳, xywangcs@fudan.edu.cn 摘要: 以 JSON 、 Protocol Buffers 等为代表的树状结构

报告人:陈世敏 研究员(中国科学院计算技术研究所)

时间:20171110日(星期五)下午14:00-15:30

地点:复旦大学张江校区软件楼102第二会议室

联系人:王晓阳,xywangcs@fudan.edu.cn

摘要:

JSONProtocol Buffers等为代表的树状结构数据,能够简洁地表达嵌套、多值和缺值,可用于表述高级程序设计语言中class, struct等丰富的结构,已经逐步替代了XML成为事实上的标准,并广泛应用于社交网络数据服务、Web服务、数据交换格式、分布式系统协议、物联网等,成为一种重要的大数据类型。我们研发了一个通用的树状结构数据库系统Steed,支持树状数据的行式和列式存储,和类似SQL的查询分析功能。我们对实际中存在的树状结构数据进行了分析,发现虽然树状类型本身可以表达丰富复杂的结构,但是实际中出现的结构大部分是简单的,从树根到树叶的路径中,有90%以上的路径是简单路径。利用这一发现,针对简单路径,优化了外存存储、内存数据结构、列组装算法。与现有系统PostgreSQL/JSON, MongoDB, Hive+Parquet相对比,Steed对于数据分析操作普遍有101000倍的性能提升。本报告基于SIGMOD'17VLDB'17工作。

报告人简介:

陈世敏,中科院计算所研究员,分别于1997年和1999年获得清华大学计算机系学士和硕士学位,于2005年在美国Carnegie Mellon University获得计算机科学博士学位。博士毕业后,先后在美国Intel LabsCMUHP LabsResearcherSenior ResearcherResearch Manager,于2013年加入中科院计算所,并入选中科院“百人计划”。 陈世敏的研究兴趣主要集中在数据管理系统、大数据系统和计算机体系结构。曾获得ICDE04 Best PaperSIGMOD01 Runner-up Best Paper,体系结构2008年度顶级论文Top Picks08SIGMOD09是数据库领域最早研究闪存的论文之一,CIDR11是数据库领域第一篇研究新兴非易失存储的论文。担任ICDE18 PC area chair, VLDB17 PC Associate Editor, ICDCS16CIKM14PC area chair,多次担任SIGMOD,VLDB,ICDE,CIDR , ASPLOS, EUROSYS等的PC

  • 讲座信息

     

    1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

    相关文章
    • JavaScript 开发的45个经典技巧

      JavaScript 开发的45个经典技巧

      2017-12-06 10:06

    • jsonlint:python的json数据验证库

      jsonlint:python的json数据验证库

      2017-12-06 09:00

    • 【转载】json数据的中文显示问题 python

      【转载】json数据的中文显示问题 python

      2017-12-03 16:23

    • Android里JSON数据解析的容错性怎么处理

      Android里JSON数据解析的容错性怎么处理

      2017-12-03 09:00

    网友点评
    "