两篇语义网入门文章
Monday, March 24th, 2008 | 1 views如果刚接触语义网,有许多疑惑,可以先看看这两篇文章。
1 Where are the semantics in the semantic web? (pdf, download)
2 XML+RDF, 实现web数据基于语义的描述(via)
尽管语义与语法在概念上有着巨大的区别,但其实是很容易让人感到困惑的。这两篇文章有助于理想这两概念之间的区别。
PR不重要,RP才重要…
如果刚接触语义网,有许多疑惑,可以先看看这两篇文章。
1 Where are the semantics in the semantic web? (pdf, download)
2 XML+RDF, 实现web数据基于语义的描述(via)
尽管语义与语法在概念上有着巨大的区别,但其实是很容易让人感到困惑的。这两篇文章有助于理想这两概念之间的区别。
今天晚上大部分时间都在写一个程序,其中涉及到一些状态的记录。想了一些时间,该如何去表示这个状态,以下是总结。
我认为,我们用自然数而不是枚举类型来表示不同的状态是很好的,这样一个整型变量就可以许多不同的意义。不仅空间占用量小,且可以通过算术运算来达到状态的变更——如果状态的转换是依赖于算术运算的,那用自然数表达系统状态简直是个绝佳的方法。
自然数是按照加法进行定义的,1,加上1就是2,再加上1就是3…,其实我认为还可以用乘法来定义自然数,1(算特殊的质数),2,3,5, 7…..等等质数通过乘法运算构成全部的自然数系统。用乘法来定义是否有意义呢?我觉得是有的。这种定义方式反映了质数的本质,且,据此,我们可以对整个自然数系统作为分类:{1},{2(^+)*3(^*)*5(^*)*…}.{2(^*)*3(^+)*5(^*)*…}…,通俗的讲,自然数可以分成被2整除,被3整数,被5整数等等的许多子集合。很明显,这样的集合对于性质整除某个质数而言内部是等价(很显然,自反,传递,交换)的,换而言之,可以通过质数就自然数划分成许多的等价类。
我觉得自然数可以根据质数划分成许多等价类的事实,是很有意义的。这样,我们可以用自然数来描述或者模拟某系统(比如,一个系统进程,正在飞行的飞机)拥有的性质。
举个例子吧,比如 2,表示某人饿了,3表示某人渴了,那么6即是2的等价类成员,也是3的等价类成员,显然6的意思计算机可以自动推理得到,某人饿了渴了。质数的这种能力对于描述简单系统而言是非常棒的。
国内关于语义网的书籍仅有三本,两本是大致的介绍,一本是侧重于本体论的。
第一本出版的比较早,好像是华裔写的,英国的一个学校的,书名叫语义网简明教程,大致的描述了语义网及相关技术,连OWL-S也提到了。
第二本是我导师出的,主要关于本体论方面的:本体论工程及其应用。比较的抽象,比较的难以看懂。
第三本是今年刚出的,叫语义网原理与技术。今天去实验室的时候看到的,书其实只是相关知识的堆积,没有很系统的组织内容——大家都清楚这些书的格式的吧,不过做为难得一见的中文参考书,也是不错的。该介绍的知识基本都提到了。
国外有本A Semantic Web Primer很久前就出了,可惜一直都没有中文译本。
lab是流行的一个东西,Google lab的大名声和大成就让许多公司都lab了,最近联想也是。
联想的lab也有许多有趣的东西,比如这个时间管理。所谓时间管理,就是一个计划表,什么时候做什么事情等等,时间到了会有msn或者email提醒你——Google的时间管理可以用手机短信提醒。
联想以前有个FM365,我记得刚连上互联网那时候常常跟表弟去上面下小游戏,现在想来真是回味无穷。联想其实还是蛮有意思的一个公司。
an ontology browser, or a sementic web browser, java-based, using pellet as its reasoner.
lunch it from here.
Great Work! Thinks Michael Grove a lot.
推荐一个刚刚出来的RSS阅读器(这样称呼似乎不大准确),鲜果在线。有了Google Reader,有了Zhuaxia,在可以毫无留恋的抛弃掉bloglines后,推荐尝尝这个新出的鲜果。
简单而清晰,从一个普通用户的角度看来,它令我喜欢。抓虾最近有点乱糟糟,用着老有被人打搅的感觉,鲜果好不少,当然,这方面Google Reader最纯粹了,它能纯粹是因为它财大气粗。
用鲜果订阅我的feed试试看 ![]()
(Feedsky feed)
(Feedburner feed)
其他相关文章:
有种恐惧称为OWL-performance-fear,OWL性能恐惧。研究者们正致力于将这种恐惧变成历史(……)。
今天在Think clearly上看到相关的消息,比较振奋。
On the TBox side of things: Boris Motik and Rob Shearer (with Ian Horrocks) have developed a new reasoning calculus that is very effective with the notorious Galen ontology, and, indeed, with all the OBO ontologies. They tackle both non-determinism and tableau size with stunning results. It should also have positive implications for DL Safe rules. They have a prototype reasoner using the technique, HermiT, available for download.
On the ABox side of things: IBM Research (Watson Research Center, NY) have recently posted information about their summarization technique for scaling ABoxes. They have a reasoner, SHER, which will be available in one form or another at some point. Their case study is quite inspiring.
最近在修改毕业论文,对于社会关系网络服务有了一些新鲜的思考,待答辩完后,写上来探讨一下。
其实说来,SNS是一个很有趣的东西,SNS要注意的是最后一个是Services,缺了这个S就成了SN,对于社会关系进行模拟,就算模拟的再好,可是没有最后一个S,还是不成的。
因此有些名头响亮的技术,其实根本走不通。
作为一个初学的菜鸟——如我这般,或者是作为一个爱看热闹的人,关于语义网,你最想知道什么?
我从Dan Zambonini 的这篇文章上看到这个有趣的话题。您可以认为这篇post是Dan Zambonini那篇的扩展,或者也可以认为是某种形式的上的翻译。
如果是我的话,当然我会先问一下:什么是语义网?这个问题比较好,证明问的人有好奇心,对生活,对世界充满热爱。
对这个问题,我先要说明一下语义网是Semantic Web的翻译,而不是Semantic Network的翻译,对于后者,可以称之为语义网络。语义网是有语义的WEB,而不是其他什么乱七八糟的东西。我对于Web的理解很狭隘,从外面看来就是许多张网页连成的网。语义网是一种愿景,目标是把分散在整个internet的数据整合在一起。类似于目前的Web把网页做为基本单位,通过超链接整合在一起,以后的(如果有以后的话)语义Web是以数据作为基本单位,通过URL将他们关联在一起。语义网可以说是数据的网。好吧,再形象一点,就是把整个internet当成一个巨大的关系型数据库就可以了。目前也有一些基于语义网相关理论的应用,都是较小范的。
第二个问题:好吧,说几个关于语义网的名词以及工具吧。老实说,这确实是我刚接触语义网就想问的问题,马上就问这个问题证明这个人不适合搞科研,因为第一个问题明明还有许多漏洞,许多疑问啊没解决啊。关于名词和工具,我就开始列举了:XML, RDF/RDFS, Ontology, OWL, SPARQL, Jena, Protege, RacePro,TopBraid Composer(Eclipse插件,没用过),另外W3C的人说正在搞本体跟关系数据库的自动映射工具…
第三个问题:对于一个开发者而言,语义网技术太令人迷惑和痛苦了,怎么办?其实如果你能忽悠的话没有什么好痛苦的。确实,文档不全,又方便又能用的代码库几乎不存在(Jena真不是那么好用)。还有那么多听起来玄乎的名词概念需要理解。其实,对于一个单纯的开发者而言,Dan Zambonini认为懂得RDF模型,RDF/XML语法,以及RDFS就够用了。而这三种概念是那么的容易学。
第四个问题:语义网的愿景有可能实现么?真是不知道,真是不大可能啊。但是,语义网大的愿景难以实现,可是相关技术已经越来越成熟了,甚至越来越多的应用到实践中去,这并不是一种空中楼阁的技术,虽然它的大目标看起来是那么夸张。就像马克思的共产主义目标看起来遥遥不可及,但是他这种理论的存在促使了西方发达国家工人地位的极大提高,他们有代表他们利益的工会,有休假,一周5天8小时工作制,高福利,有那么多的反歧视条款保护,这就是马克思主义带来的善果。
如果还有想知道的,可以写在留言里。