提取Web Service的语义

Written on August 30, 2008 – 9:58 am | by 陈炬 | 54 views

本文所谓的语义是对机器而言。

关于对Web Service进行语义标注,已经有太多的论文了(访问)。一般都是利用本体描述语言根据WSDL对Web Service重新描述,比如,把WSDL转换到OWL-S。其实这样做法是比较简单的,比较有挑战性的是如何将WSDL中一些名字(关键字)转换成具有语义的概念。比如,WSDL中某个方法的参数是(温度,湿度,降水概率,风速风向)这样一个复杂类型,在将其转化成比如OWL-S时候,如何用一个识别并将其匹配到比如<weather>本体,进一步如何产生这个<weather>本体。都是很困难的事情,这件事情在很多论文中都被回避掉了。当然,这只是一个细节。

其实一件比较有趣的事情是还可以从WSDL中获得关于operation的描述(description),operation的名字(比如BookSalesRank),参数的名字等文本性信息中获得关于这个Web Service所具有功能的内容,分类信息。如果让我们人去看一个WSDL文件,即使不去看operation,message等等定义,就看自然语言描述的解释性,注释性的内容,也能大概的了解到这个Web Service是干什么的。显然,信息是存在的,既然存在,问题机器就成了如何从自然语言中去提取关于Web Service功能,分类信息。

关键字提取的方法其实有很多,首先就是解析出单个的词,比如BookSalesRank,可以解析成Book Sales Rank,解析出之后,去掉许多常用词,比如”the”, “a”, “accepts”, “returns”….因此要维护一个大概有700个词左右的这样一个StopWords的词典。然后根据关键词的词频,关键词出现的位置(这也很重要)对不同的关键字打分,取出一定数量分值较高的词汇。如何系统已经有一个分类标准,或者本体词典,就可以计算出各个关键词跟现有分类标准出语义上的相似度(通过WordNet),从而可以给对Web Service的语义标注提供提示。

Rating: 2.8/5 (18 votes cast)

推荐购买的书籍--都是牛书

相关文章

Most Commented Posts

我来说下

关于

我叫陈炬,正在天津大学计算机学院->知识工程与科学研究所攻读硕士研究生。今年应届。您可以在我的自我介绍获得更多关于我的信息

订阅我的Blog


本站RSS地址| [这是什么?]
订阅到Google Reader | 订阅到 抓虾 阅读器 | 订阅到 鲜果 阅读器

其他blog

我还有一个英文blog,非常的无聊,琐碎,许多的语法错误。请谨慎访问。
Find entries :