把问号给了未来的语义网
前不久,在一次参加中国制造网交互设计师的面试时,面试老师Lancy曾提到过语义的概念,虽然之前也看到过相关的文章,但读来读去总有种腾云驾雾丈二和尚的感觉,看不到也摸不着,遥不可及胜不可测。先看看这个抽象的解释吧。数据的含义就是语义。简单的说,数据就是符号。数据本身没有任何意义,只有被赋予含义的数据才能够被使用,这时候数据就转化为了信息,而数据的含义就是语义。语义可以简单地看作是数据所对应的现实世界中的事物所代表的概念的含义,以及这些含义之间的关系,是数据在某个领域上的解释和逻辑表示。那么,如此推断下来,所谓的520、1314、886之类已被赋予特定含义的数据就是语义的表现了?我不确定。万维网办事处总管Ivan Herman是这样定义“语义网”的,它是以metadata为基础去辨解网的设施,以现时的网再伸延(而并非取代它)。把图的意思以文字来表达 (于可读性来说十分重要),加入metadata来解释图像的内容,让工具利用metadata来自行识别这个图像的含义。Web2.0的出现使原始的Web技术摆脱了主要供人进行阅读的局限,真正实现了网民翻身作主人的梦想,更深层次的应用也开始涌现,电子商务智能化服务的发展就充分证明了这一点。但是,就在我们这些凡人开始感叹Web2.0的无穷魅力,痴迷于RSS、Tags等等Web2.0的代表性产物时,却被当头“泼了一盆冷水”,但这盆冷水并没起到清醒头脑的作用,因为他们都像石灰似的,被冷水一浇,就更是升温起来了。这盆冷水就是万维网之父Tim Berners Lee等人所倡导的语义Web定义了。他们认为:语义Web不是产生一种新的Web,而是针对现有Web的扩展,Web中的信息语义被良好定义,使人与人、人与计算机之间能够更好地协同共工作。我们现在能够用搜索引擎搜索到的海量网页数据中,绝大多数的内容都是来源于网站数据库中的数据,因此在现在的万维网中共享的不是网页内容,而是数据库内容。语义Web又是怎么改善这些问题的呢?在语义Web中,处理的对象不再是以超级链接连接的页面文本,而是具有一定语义超链接的数据内容;进而,万维网成为一个语义关联的数据网络,人们能够像使用数据库那样在万维网上获取到所需的知识。语义Web(semantic Web)中有太多的不明白何太多的问号。RDF(Resource Description Framework) 、OWL(Web Ontology Languages)、SPARQL Protocol and RDF Query Language,光是这些抽象的名词,就够我们慢慢琢磨研读了。而且现在的语义Web好像也仅仅是理论占上风吧,因为我们至今还没看到语义Web大大方方的实际应用(也可能是我孤陋寡闻也不一定)。看看这些伟大的设想,或许能让我们对语义Web的信心更足一点吧!在今后的十年中,Web技术将得到改善,可以实现在文档中嵌入语义结构,帮助人们更方便用结构化的受控词表和本体建立Web中的词汇、概念和关系。同时,语义Web的研究与应用是一个逐步演化的过程。预计到2012年,基于语义的超文本技术将成为普遍使用的Web技术,在特定领域中,大型领域本体将建立起来,形势化地描述领域内的概念和及其之间的复杂关系,在此基础上,实现基于语义的各类服务。预计到 2017年,期望Tim所给出的语义Web的远景能够初步实现。这时,Web上80%的内容都已采用语义超文本技术,将信息资源转换为语义内容的技术也已经成熟。相信,随着Web上支持语义的各类标识语言和支持工具不断成熟,语义Web技术逐渐被广泛应用并产生社会和经济效益,一个能够为人们更好地提供知识共享、更加自动化和智能化地为人提供服务的Web平台终将实现。读了写了这么多,对于语义Web,我还是觉得跟它没有任何的沾亲带故的关系?为何?我也想知道。一段语义Web的入门级视频介绍,可能会对你有用。