需要多少论文才能得到图灵奖——数据库界的四位图灵奖得主(1)

发布于: 修改于: 雪球转发:0回复:0喜欢:0

2015-4-13  唐常杰/文

     今年3月25日,美国计算机协会(ACM)宣布,来自麻省理工学院的教授Michael Stonebraker获得2014年度“图灵奖”(第N年宣布N-1年得主),投石冲破水中天,一些与数据处理相关的微信群中喷发一股图灵奖议论热,有位教授在微信中赞叹“说数据库界一共四位传奇大师,太伟大了“,接着有几位教授提议在今年的教学PPT中,加上相关科普,激励年轻的数据库人。朋友们鼓励我来一篇非传记的、活泼一点的人物故事。

  没有诺贝尔, 我们有图灵   诺贝尔没有机会登上时间机器向前穿越,未能预见到计算机科学对人类之重,于是计算机界没有诺奖。

  没有诺奖,计算机科学也要发展,计算机人也要过日子,计算机界的Top贡献也需要Top奖,在需要一个能与诺贝尔相比较的人物作图腾的时候,天公抖擞,不拘一格,降下了图灵。

  图灵多才多艺、也多故事、多传说:小时的神童,青年时的马拉松健将(有过名次);善于长跑的图灵,在科学上一趟冲刺,跑在了计算机之前,全世界还没人见过计算机的时候 ,他构筑了“理想计算机”,阐明了通用计算机的可行性,其前瞻性和深刻性,至今影响着计算复杂性理论;有人赞他是计算机科学之父、人工智能之父….,

  在二战胜利70周年之时,人们更怀念和他的团队在破译情报方面贡献。

  看多了穿越小说的图灵迷问:他为什么有那么多超乎常人的见识?莫非他是从先进的平行宇宙中穿越而来?

        由图灵冠名的概念有 “图灵机”和“图灵测试”,最有名的是“图灵奖”。

  从1966年到2014年,49届,共62名得主,按国籍分,美国学者最多,欧洲学者偶见之,华人学者目仅有2000年图灵奖得主姚期智(现在清华大学)。

  62名得主分布在几十个小领域,排在前六的领域有:编译原理、程序设计语言,计算复杂性理论,人工智能,密码学,以及数据库(4名)。在某种意义上,可大致认为,前三个领域与计算机科学本身更密切一些,后三个领域与军民应用更密切一些。

     一看就知是聪明人  下图是数据库界的四位得主。本来,以貌取人是根据不足的,但这四位得主,都有一股学者范(“范儿”是一种感觉,很难严格定义),几位学者,虽近髦耋,眉宇中有一股英气,目光坚定自信,相信在年轻时,叫人一看,就知是聪明人。

        按获奖时间排序 ,本文先介绍最早的一位。续篇再介绍后面的三位,争取在篇末都议论一下得主们给我们的启迪。

        实践出真知—网状数据库,时势造英雄-巴赫曼

        今年90岁的查理士·巴赫曼 (Charles William Bachman),在49岁时候(1973年)获得了的图灵奖,是数据库界的第一枚图灵奖。

  生逢其时,有文无库 上世纪60年代,计算机系统还是有文(文件系统)无库(数据库)。数据处理比较艰难,那是一个正需要英雄,就出了英雄的时代;当世界正呼唤数据处理新技术时,年富力强(30多岁)的巴赫曼来了。

  他从基层干起,曾在穿孔卡片机上开发程序,在第一线获得了丰富经验,后到通用电气公司,作程序设计部门经理,体验过文件系统处理数据的蹉跎、繁琐和低效,催生了他的数据库梦。

        曾经是很爽的数据库  他主持设计与开发了最早的网状数据库管理系统IDS ( Integrated Data Store),在不惑之年(1964年)正式推出IDS。以今天的目光看,IDS是建立在虚拟内存系统上(实际在磁盘上),如果当时有如今的闪存盘SSD,不用改代码,就会爽的发飙 ;不过那时的人要求低,认为IDS已经很爽了。

  所以,他被称为网状数据库之父。

        网状数据库型与值,基本思想 网状数据库概念不太容易科普,当年。笔者讲网状数据库课程时,在黑板上画若干记录方块,若干指针链接,两三个学时才能讲完;

        记忆大师们说,要想记忆好,检索快,就要设法把知识点连成网状,建立联想,这就是网状数据库的思想。想法简单,但实现和使用起来,却不简单。

        上图左边是数据的模型, 右边是库值 ,箭头描述了 系主和系成员联系(网状)。用户需理解和记住这些箭头连线,这就是网状数据库很快被后继模型取代的原因。

        上图的模型中, 订单有两个父节点, 如果一个网状数据库中,所有节点至多只有一个父节点,就称为层次数据库,是网状数据库的特例。     

  格式化 VS 非格式化 , 磁盘 VS 磁带  数据库带来的观念是革命性的。此前,计算机以文件为最小处理单位,处理非结构化的、粒度较大的数据;而数据库中是格式化的、粒度较小的数据(记录或字段)。

  有格式和无格式数据的在查、插、删、改的速度方面有天渊之别,作为科普,拟用两种比喻:

(1)在网状数据库的特例——层次数据库中,数据是按层次组织的,就像有了师-旅-团-营-连-排的建制军队,而原来以文件形式保存的数据就像奴隶社会中揭竿而起的农奴义军,层次数据库中,数据有组织,检索有索引,层次序列码每下进一层,就把搜索空间缩小几倍几十倍,比文件中线性搜索快多了

(2)磁盘与磁带的比喻:非格式化数据中,查询某一数据项,有如在磁带上搜寻某首歌曲,从头搜索到尾,平均每次搜索磁带长度的一半;而在磁盘或光盘上,从目录(索引)找到那首歌曲的开始扇区,磁头在三维空间中跨界运动,磁带是线性带子固定的磁头,磁盘是极坐标的平面,三维的臂,直达目标,快多了。

         对插、删、改操作,由于数据库缩小了处理粒度,提高处理效率,更是令文件系统望尘莫及。

  报告也能占高地 IDS的成功,使巴赫曼有资格成为DBTG的核心人物之一,DBTG即数据库任务组,隶属于CODASYL(美国数据系统语言委员)。

  为了数据库之梦,巴赫曼试图占领美国国家标准这一学术和技术高地,积极推动了DBTG报告。

  由于各种原因,这个报告,最后没有成为美国国家标准,DBTG任务组坚忍不拔,相继推出一系列版本,如1971,1973、1978、1981年和1984年的修改版本。

        尽管DBTG不是国家标准,也不是具体的数据库产品,而只是一个方案,但它提出的观念深入人心,所提出的三级模式,以及把数据库语言分成数据定义语言DDL和数据操纵语言DML的思路, 影响了几代数据库人和数据库产品,如IDMS、PRIME DBMS、DMSl70、DMSⅡ和DMS 1100,甚至,如今的关系数据库中,也能隐约见到它的影子。

        这些成果确立了数据库的观念,在IT发展历程中,人们常常见到,被新技术“宠坏“了的用户,再也不愿回到旧技术的怀抱,在这个意义上,有人笼统地说,巴赫曼是(没有定语)数据库之父。

        一点思考:需要多少论文才能得到图灵奖? 下面有个清单,列出了巴赫曼的重要论文16篇,因为他是1973年的的图灵奖,只列出了1962-1983中的一部分,平均每年不到1篇。

  也许多年前 ,计算机界对论文级别,杂志级别的观念与现在不同;单从从数量上看,好像我们现在的杰青、优青、千人、百人快赶上或已经超过了巴赫曼,但是,能做出像IDS这样的货真价实、人用人爱的系统吗?能提出像《DBTG报告》这样改变观念、深入人心,能在数据库发展的几十年历程中留下影子的的“报告“吗?

       也许,这种观念的不同,是图灵奖得主心中的那份灵犀。

参考文献(巴赫曼1962-1983的部分论文):

"Precedence Diagrams: The Key to Production Planning, Scheduling and Control." In: ProCo Features. Supplement No 24, August 24. 1962..

"Integrated Data Store." in: DPMA Quarterly, January 1965.

"Software for Random Access Processing." in: Datamation April 1965.

"Data Structure Diagrams." in: DataBase: A Quarterly Newsletter of SIGBDP. vol. 1, no. 2, Summer 1969.

"Architecture Definition Technique: Its Objectives, Theory, Process, Facilities, and Practice." coauthored with J. Bouvard. in: Data Description, Access and Control: Proceedings of the 1972 ACM-SIGFIDET Workshop, November 29-December 1, 1972.

"The Evolution of Storage Structures." In: Communications of the ACM vol. 15, no. 7, July 1972.

"Set Concept for Data Structure." In: Encyclopedia of Computer Science, 1972-1973.

"The Programmer as Navigator." In: Communications of the ACM vol. 16, no. 11, November 1973.

1974."Implementation Techniques for Data Structure Sets." In: Data Base Management Systems

"Why Restrict the Modeling Capability of Codasyl Data Structure Sets?" In: National Computer Conference vol. 46, 1977.

"Commentary on the CODASYL Systems Committee's Interim Report on Distributed Database Technology." National Computer Conference vol. 47, 1978.

"DDP Will Be Infinitely Affected, So Managers Beware!" in: DM, March 1978.

"The Impact of Structured Data Throughout Computer-Based Information Systems." In: Information Processing 80, 1980.

"The Role Data Model Approach to Data Structures." In; International Conference on Data Bases, March 24, 1980.

"Toward a More Complete Reference Model of Computer-Based Information Systems." Co-authored with Ronald G. Ross. In: Computers and Standards 1, 1982.

"The Structuring Capabilities of the Molecular Data Model." In; Entity-Relationship Approach to Software Engineering. C. G. Davis, S. Jajodia, and R. T. Yeh. eds. June 1983.

$上证指数(SH000001)$           $创业板指(SZ399006)$           $中小板指(SZ399005)$

聚圣源蛇孩子起名宜用字绿茶tv取名起名大全成语男孩名有什么名字听起来比较霸气p2p下载软件inspire起名沉睡的猎犬起英文名网免费名字大全循循善诱的意思双减政策的利与弊于罗姓宝宝起名海起名字要霸气的中国梦的内容禾字旁的起名千博满朝文武只有朕是o学校的起名余家头黑色灯塔冬天的古诗下载公司起名字大全免费电视直播app哪个好游乐园起名win7图标苏若雪沈浪全文免费阅读完整版工程公司起名价格九把刀作品读书使人明智免费麻辣烫起名武昌地图淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男孩疑遭霸凌 家长讨说法被踢出群国产伟哥去年销售近13亿网友建议重庆地铁不准乘客携带菜筐雅江山火三名扑火人员牺牲系谣言代拍被何赛飞拿着魔杖追着打月嫂回应掌掴婴儿是在赶虫子山西高速一大巴发生事故 已致13死高中生被打伤下体休学 邯郸通报李梦为奥运任务婉拒WNBA邀请19岁小伙救下5人后溺亡 多方发声王树国3次鞠躬告别西交大师生单亲妈妈陷入热恋 14岁儿子报警315晚会后胖东来又人满为患了倪萍分享减重40斤方法王楚钦登顶三项第一今日春分两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?周杰伦一审败诉网易房客欠租失踪 房东直发愁男子持台球杆殴打2名女店员被抓男子被猫抓伤后确诊“猫抓病”“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火男孩8年未见母亲被告知被遗忘恒大被罚41.75亿到底怎么缴网友洛杉矶偶遇贾玲杨倩无缘巴黎奥运张立群任西安交通大学校长黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发妈妈回应孩子在校撞护栏坠楼考生莫言也上北大硕士复试名单了韩国首次吊销离岗医生执照奥巴马现身唐宁街 黑色着装引猜测沈阳一轿车冲入人行道致3死2伤阿根廷将发行1万与2万面值的纸币外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万手机成瘾是影响睡眠质量重要因素春分“立蛋”成功率更高?胖东来员工每周单休无小长假“开封王婆”爆火:促成四五十对专家建议不必谈骨泥色变浙江一高校内汽车冲撞行人 多人受伤许家印被限制高消费

聚圣源 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化