当前位置:首页 » 网页前端 » semanticweb
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

semanticweb

发布时间: 2023-02-24 09:51:43

1. web2.0是什么,现在好象很热的样子,他和web1.0有什么区别

要理解WEB2.0,先得看WEB的历史。 World Wide Web,简称WWW,是英国人TimBerners-Lee 1989年在欧洲共同体的一个大型科研机构任职时发明的。通过WEB,互联网上的资源,可以在一个网页里比较直观的表示出来;而且资源之间,在网页上可以链来链去。在WEB1.0上做出巨大贡献的公司有Netscape,Yahoo和Google。 Netscape研发出第一个大规模商用的浏览器,Yahoo的杨致远提出了互联网黄页, 而Google后来居上,推出了大受欢迎的搜索服务。

搜索最大的贡献是,把互联网上海量的信息,用机器初步分了个线索。但是,光知道网页里有哪些关键字,只解决了人浏览网页的需求。所以,Tim-Berners-Lee在提出WWW不久,即开始推崇语义网(Semantic Web)的概念。为什么呢?因为互联网上的内容,机器不能理解。他的理想是,网页制作时和架构数据库时,大家都用一种语义的方式,将网页里的内容表述成机器可以理解的格式。这样,整个互联网就成了一个结构严谨的知识库。从理想的角度,这是很诱人的,因为科学家和机器都喜欢有次序的东西。Berners-Lee关心的是,互联网上数据,及能否被其它的互联网应用所重复引用。举一个例子说明标准数据库的魅力。有个产品叫LiberyLink。装了它后,到Amazon上去浏览时,会自动告诉你某一本书在用户当地的图书馆能否找到,书号是多少等。因为一本书有统一的书号和书名,两个不同的互联网服务(Amazon 和当地图书馆数据库检索)可以公享数据,给用户提供全新服务。

但是,语义网提出之后,曲高和寡,响应的人不多。为什么?因为指望要网页的制作者提供这么多额外的信息去让机器理解一个网页,太难;简直就是人给机器打工。这违反了人们能偷懒就偷懒的本性。看看Google的成功就知道。 Google有个Page Rank技术,将网页之间互相链接的关系,用来做结果排序的一个依据,变相利用了网页制作人的判断力。想一想网页的制作者们,从数量来说,比纯浏览者的数量小得多。但Google就这一个革新,用上了网页的制作者的一部份力量,已将其推上了互联网的顶峰。

所以互联网下一步,是要让所有的人都忙起来,全民织网,然后用软件,机器的力量使这些信息更容易被需要的人找到和浏览。如果说WEB1.0是以数据为核心的网,那我觉得WEB2.0是以人为出发点的互联网。 我们看一看最近的一些WEB2.0产品,就可以理解以上观点。

Blog: 用户织网,发表新知识,和其他用户内容链接,进而非常自然的组织这些内容。

RSS: 用户产生内容自动分发,定阅

Podcasting: 个人视频/声频的发布/定阅

SNS: blog+人和人之间的链接

WIKI: 用户共同建设一个大网络全书

从知识生产的角度看,WEB1.0的任务,是将以前没有放在网上的人类知识,通过商业的力量,放到网上去。WEB2.0的任务是,将这些知识,通过每个用户的浏览求知的力量,协作工作,把知识有机的组织起来,在这个过程中继续将知识深化,并产生新的思想火花;

从内容产生者角度看,WEB1.0是商业公司为主体把内容往网上搬,而WEB2.0则是以用户为主,以简便随意方式,通过blog/podcasting 方式把新内容往网上搬;

从交互性看,WEB1.0是网站对用户为主;WEB2.0是以P2P为主。

从技术上看,WEB客户端化,工作效率越来越高。比如像Ajax技术, GoogleMAP/Gmail里面用得出神入化。

我们看到,用户在互联网上的作用越来越大;他们贡献内容,传播内容,而且提供了这些内容之间的链接关系和浏览路径。在SNS里面,内容是以用户为核心来组织的。WEB2.0是以用户为核心的互联网。

那么,这种意义上的WEB2.0,和Tim Berners-Lee的语义网,有什么不同呢?语义网的出发点是数据的规整及可重复换�鞯饔茫�岢鍪褂糜镆寤�哪谌莘⒉脊ぞ撸?nbsp;试图从规则和技术标准上使互联网更加有序。 Google等搜索引擎,在没有语义网的情况下,尽可能的给互联网提供了线索。 WEB2.0则是鼓励用户用最方便的办法发布内容(blog/podcasting),但是通过用户自发的(blog)或者系统自动以人为核心(SNS)的互相链接给这些看似凌乱的内容提供索引。 因为这些线索是用户自己提供,更加符合用户使用感受。互联网逐渐从以关键字为核心的组织方式和阅读方式,到以互联网用户的个人portal(SNS)为线索,或者以个人的思想脉络(blog/rss)为线索的阅读方式。WEB2.0强调用户之间的协作。WIKI是个典型例子。从这个角度看,互联网是在变得更有序,每个用户都在贡献:要么贡献内容,要么贡献内容的次序.

对下一代互联网的看法,还会有很多的讨论。有一点可以肯定,WEB2.0是以人为核心线索的网。提供更方便用户织网的工具,鼓励提供内容。根据用户在互联网上留下的痕迹,组织浏览的线索,提供相关的服务,给用户创造新的价值,给整个互联网产生新的价值,才是WEB2.0商业之道。(作者为MOP网董事长兼CEO)

WEB2.0将成就新一轮网站创业、变革的狂潮

很感谢web2.0这个概念的诞生,它让互联网又焕发了新的活力,并吸引着资本流向web2.0,无数具有创新意义的web2.0网站应运而生,短短的几个月时间,圈内圈外关于web2.0的争议、讨论已经引起了创业者和投资者的广泛关注。如果你在IT圈混,而且你想获得风险投资,你想立即创业致富,那你最好了解web2.0,吃透web2.0,创立web2.0,因为国外投资商已经认定web2.0前途无限。不知道是否新一轮网络泡沫的诞生还是新一轮网络变革的机遇,web2.0反正给我们带来了激情。

what’s web 2.0?Wikipedia中有相应的描述,不过仍然含糊不清,不能作为web2.0的准确定义。有的说web2.0可定义为“可写的互联网”,这也不完全准确。关于web1.0和2.0的区别,我很赞同吕欣欣的一番比较,"web1.0天天谈门户,web2.0谈个人化;web1.0谈内容,web2.0谈应用;web1.0商业模式,web2.0谈服务;web1.0谈密闭、大而全,web2.0大家谈开放、谈联合;web1.0网站中心化,web2.0谈个人中心化;web1.0一对一,web2.0谈社会性网络;web1.0不知道你是狗,web2.0你去年夏天干了什么我一清二楚甚至想要干什么呢。。。"

我认为的web2.0的典型特征和表现形式:个人出版和聚合(如blog,rss,atom)、社会协作(wiki,软件工程协作)、更好的用户体验(如简短的url、ajax技术)、开放APIs(Flickr、del.icio.us、Bloglines),用户参与占主导(sns,blog,社会化书签,网摘)。除此之外我还认为网络游戏也具有web2.0的性质,因为它讲究社会协作、讲究用户参与占主导,讲究给用户带来更好的体验。

新事物新概念的诞生,总是会存在反对意见的,国外的就不说了,国内老冒的"朝web 2.0泼点冷水"、周天舒的"给“所谓的”Web 2.0泼点热水",都从技术角度分析认为web2.0是早就已经使用的技术,这有些让我失望,因为他们的观点走向了狭隘,没有看到后面的本质。也许web2.0的几种表现形式早就有了,例如rss,blog,ajax等等都已经有年头了,但是真正大规模应用却是在近期,个体现象的发展与汇合逐渐被提炼成一种模式、理论和概念,这就脱离了其表现形式这一技术外壳所赋予的基本内涵,通俗点说这就是"量变到质变"的一个革命性的过程,这是对表面现象的更深层次的发掘和提炼,带有更具变革更具创意更具激情的深刻含义。

在如今传统的互联网模式越来越单一,并逐渐走向了死胡同,仅靠服务商自身的鼠标+水泥来造就庞大的内容平台和用户数量,这样的模式如今已经受到严峻挑战。而web2.0的浪潮已经席卷了全球最知名的网络巨头:yaohoo、msn、google等,国内的门户网站首当其冲需要进行web2.0变革,而其他网络应用,如求职招聘、同学录、分类信息、b2b、b2c等各类网站都需要经过web2.0的改造,来面对新的挑战和冲击。

普通用户也许不需要知道sns,web2.0等概念,但作为互联网的创业者、参与者、投资者,你不能只做旁观,你需要行动起来,机会就在眼前。

web2.0让我感受到了互联网新一轮发展的巨大机遇,也让我感受到了互联网寻求突破创新的迫切。当然除了国内国外的常用web2.0模式以外,我也一直在探寻着整合性质的web2.0,传统应用的web2.0化以及更合适的web2.0的创业模式,欢迎大家有空交流。

全民上网到全民织网 Web 2.0掀起人民战争

作者: CNET科技资讯网
CNETNews.com.cn 2005-07-05 09:0 AM

Web 2.0 正在让互联网逐渐找回Internet的真正含义:平等、交互,去中心化。你不应该只是互联网的读者,你也应该是互联网的作者;你不该只是在互联网上冲浪,你本身就是波浪制造者。Web 2.0 之于Web 1.0 ,如同分布式计算之于集中式计算,网格之于大型主机。

CNET科技资讯网7月5日北京报道(文/高飞)当Internet的创立者利克·李德在1963年提出“超银河网络”(Internet的前身)时,他想的是如何让计算机和网络帮助人们沟通和思考,如何让网络“去中心化(Decentralization)”。但在上世纪90年代初雅虎等超级门户网站出现之后,互联网的发展却一度远离利克。李德的初衷。

雅虎、亚马逊,和中国网络、搜狐等超级网站凭借强势的内容,常年驻扎在网民的收藏夹中。网民们美其名曰的“网上冲浪”其实就是围绕这些网络“恒星”所作的圆周运动,网民仅仅充当互联网的读者,而不是作者,这时的互联网是“只读”的。但Web 2.0 的出现,结束了了网民周期性赶集运动。

Blog作者Keso说:“在Web 1.0 时代,我们所能做的,就是各处瞎逛,并美其名曰——冲浪(即Web 浏览)。Web 2.0 带给我们的,是一个可以读写的互联网,Blog、Wiki等是其中的代表。”

借助Web 2.0 ,一个不仅“可读”,而且“可写”和“可交互”的互联网正逐渐浮出水面。利克·李德30多年前的梦想正逐渐被实现。

Blog:个人媒体崛起

在Web 2.0 的世界中,Blog(中文翻译作“网志”、“博客”)绝对是个“招牌菜”,它已获得了广泛的知名度。

“911 事件”是Blog发展史上的里程碑阶段。人们发现,恐怖事件现场当事人建立的Blog才是最可能给出第一手和最真实信息的人。一个重要的博客类战争Blog(WarBlog )因此繁荣起来。“对911 事件最真实最生动的描述不在《纽约时报》,而在那些幸存者的Blog中”一位Blog作者写道。

在中文世界,让“博客”一举成名的人当属“木子美”,她对个人隐私毫不避讳的曝光,完全颠覆了中国人的伦理传统。网民们蜂拥而至 “木子美”的Blog,“木子美”私生活曝光的同时,Blog也走进大众传播领域。

Blog并不是一个充满技术含量的概念,为了便于理解,你甚至可以把它看作以时间为顺序更新的个人主页。Blog的可贵之处在于,它让世人认识到,写作并不是媒体的专利,新闻也不是记者的特权。再眼疾手快的记者也不如在现场的人更了解事实。目击者的Blog比新闻记者拥有更高的权威和更接近事实的判断。

在亚洲,韩国人Oh Yeon Ho创立的Blog网站已经成为韩国重要的媒体力量,通过发动全社会的力量,无论是韩国总统卢武铉遭弹劾事件,还是韩国人金善逸在伊拉克遭到绑架并被杀害事件,都走在了韩国各大媒体的前列。这个网站的一条新闻上竟然有85000 条评论,远超过其他媒体互动水平。

着名硅谷IT专栏作家丹·吉尔默总结说,Blog本身代表着“新闻媒体3.0 ”。1. 0 是指传统媒体或说旧媒体(O l d Media ,如“晚报、CCTV”),2.0 就是人们通常所说的新媒体(New Media ,如网络、雅虎)或者叫跨媒体,3.0 就是以Blog为代表的(We Media)的个人媒体或者叫自媒体。

Blog发展到现在,内容已并不仅局限于文字。图片、音频和视频都是可选项,而音频B l o g 就有一个自己的名字——Podcast (国内有翻译为“播客”)。Blog搭起从互联网阅读时代到写录时代的桥梁。

模糊编辑和读者的角色

在Blog完成了对Web2.0的启蒙教育之后,一系列在其框架下的理念纷至沓来,其中较有代表性的是:Wiki(网络大网络全书)、Social Bookmark(社会化书签)等等。

Wiki是Web 2.0 体系下的又一个概念。Wiki可以简单地解释为由网友自发维护的网络大网络全书,这个大网络全书由网友自发编辑并修改内容,每个人既可以是某个词条的读者,又可以是这个词条的编撰者,读者和编辑的界限在Wiki中被模糊了。首个Wiki网站的创建者Ward Cunningham说:“我创建第一个Wiki的初衷就是要建立一种环境,我们能够交流彼此的经验。”社会化书签则是与Wiki很相似的概念,它可以让网民互相共享自己的收藏夹,交换资源。

独立的Blog并不具备商业网站的推广能力,这一个个以自我为中心的网络节点如何完成互通与共享?在Web 2.0 体系下,Tag (标签), RSS (聚合服务)和六度分隔理论起到了黏合剂的作用。

Tag 直译为标签,它可以让你为自己所创造的内容(Blog文字、图片、音频等)创建多个用作解释的关键字。比如一副雪景的图片就可以定义“雪花”、“冬天”、“北极”“风景照片”这几个Tag.雅虎刚刚收购的图片共享网站Flickr就对此提供支持。Tag 类似于传统媒体的“栏目”,它的相对优势则在于创作者不会因媒体栏目的有限性而无法给作品归类。

RSS 则是一种更为直接的互动方式,一般翻译为聚合服务,它仿佛就是为Blog而生的技术,借助RSS ,网民可以自由订阅指定Blog(绝大多数的Blog都支持RSS),也就是说读者可以自定义自己喜欢的内容,而不是象Web 1.0 那样由网络编辑选出读者阅读的内容。

颠覆媒体中心理念

雅虎首席运营官丹尼尔·罗森格告诉记者,“(对传统媒体的)颠覆倒不敢说,但RSS 重新定义了信息分享的方法,颠覆了未来信息社会必须有一个核心的理念,虽然RSS 眼下并不会为网络广告带来什么帮助,但是却能让所有人更好地分享信息。”

传统媒体也希望借此把自己的内容互动起来。数字音频出版商Audible 正计划发行纽约时报、华尔街日报和其他一些期刊的Podcast ,通过RSS 网络标准进行发行,用户可以下载到MP3 播放器中收听。

曾经有人提出疑问,Web 2.0 的互动与传统BBS 有何不同?一名叫罗皓菱的Blog作者解释了Blog与BBS 的区别:Blog是集原创文章、链接评价、链接、网友跟进于一体的,比起BBS 那种口无遮拦、随心所欲、良莠不齐的情绪化发言,博客制作的日志更加审慎、仔细和周详,其单个文本的丰富性、讨论脉络的清晰度、论题的拓展空间都超过了BBS 的网友发言帖子。

Ward Cunningham 也谈到过Wiki与BBS 的差别,他认为BBS 没有上下文的概念,讨论经常无法持久地进行。讨论组反复围绕着同一个话题,但是人们经常忘了以前说过什么。

全民上网到全民织网 Web 2.0掀起人民战争(下)
(2005.07.05) 来自:ZDNET

Web 2.0 探索盈利模式

一个新的互动模式,必然伴随着新的商业模式,或者带来新的商业机会。

但是因为与Web 1.0 巨大的差异,Web 2.0 在商业模式上现在还处于探索阶段。2003年2 月,Google并购了全球最大的博客托管服务网站 Blogger.com 母公司Pyra实验室。Pyra当时成立仅3 年半,博客注册用户已达数百万、人气极旺,但由于缺乏收入,三个创始人中的两个被迫离开公司,如果不是Trellix 公司的CTO Bricklin(也是一个着名博客)出手相助,Pyra早已破产。

不过外界普遍认为,找到Web 2.0 的商业模式应该只是迟早的事情。雅虎、微软这些传统互联网巨头则并不太在意Web 2.0 当前的商业价值,他们更希望赶快抢占这一阵地。雅虎刚刚推出的Yahoo 360 服务,就是一个包含了图片上传、Blog、IM(即时通讯)所有功能在内的个人Web 2.0 平台。微软也发布了与之类似的MSN Space.微软非常看好Blog,它甚至雇佣一个Blog团队来为其MSN 门户网站制作原创内容。

在中国市场,规模最大的Web 2.0 商业公司是Blog服务托管商(BSP ),其中总部位于杭州的中国博客网目前注册用户超过200 万,并以每月8 到10万的速度增长。该公司董事长胡之光认为,当用户数足够多的时候,博客就能够通过广告和无线增值来实现盈利。另外一家BSP 博客中国负责人方兴东透露,未来的盈利将来自三个方面:广告收入、无线增值服务和向博客用户提供增值服务和应用程序收取的服务费。但是到目前为止,上述两家都还没有实现盈利。

不过对一般的企业而言,Web 2.0 的好处则是立竿见影。在企业内部实施Blog和Wiki,可以让知识轻松共享,一个新员工可以通过内部Wiki 熟悉工作技能,了解企业文化。

Blog作者Keso这样说:“Web 1.0 提下的HTML、JavaScript等本身是一种语言,它按照某种约定的协议(比如TCP/ IP )进行对话,但这只是机器与机器的对话,人顶多是让这场对话存在而已,并未直接参与进来。而Web 2.0 让人参与到对话中,互联网一下子就变得生动了起来。

Web 2.0 无疑是一场革命。“

不管Web 2.0 是不是革命,一场以“交互”为核心的互联网创网络潮已确定无疑的到来。每个人都要在这次互联网“人民运动”中寻找自己在其中的位置。

Web 2.0 重要名词解释

Blog:Blog是个人或群体以时间顺序所作的一种记录,且不断更新。Blog之间的交流主要是通过反向引用(TrackBack )和留言/ 评论(Comment )的方式来进行的。Blog的作者(Blogger ),既是这个Blog的创作人,也是其档案管理人。

TrackBack :是一种Blog应用工具,它可以让Blogger 知道有哪些人看到自己的文章后撰写了与之有关的内容。这种功能实现了网站之间的互相通告;因此它也可以看作一种提醒功能。

RSS:是一种用于共享新闻和其他Web 内容的数据交换规范。读者可以通过RSS 订阅一个Blog,确知该Blog最近的更新。

Wiki:1995年,沃德。坎宁安(Ward Cunningham )为了方便模式社群的交流创建了全世界第一个w i k i 系统——WikiWikiWeb (http://c2.com/cgi/wiki),并用它建立了波特兰模式知识库,在建立过程中,沃德。坎宁安创造了Wiki的概念和名称,并且实现了支持这些概念的服务系统。

Social Bookmark :社会化书签,它可以让你把喜爱的网站随时加入自己的网络书签中;你可以用多个关键词(Tag )而不是分类来标示和整理你的书签,并与其他人共享。

六度分隔理论:(Six Degrees of Separation )。1967年,哈佛大学的心理学教授Stanley Milgram (1933~1984)创立。简单地说:“你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。”六度分隔理论的数学解释是:如果每个人平均认识260 人,其六度就是2606=1188137600000.消除一些节点重复,那也几乎覆盖了整个地球人口若干多倍。

(名词解释的主要内容来自Wiki网络大网络全书)

小资料

SNS 以及六度分隔理论

Social Networking Service (简称SNS ,社会化网络软件)是Web 2.0 体系下的一个技术应用架构。SNS 基于六度分隔理论运作,这个理论的通俗解释是:“在人脉网络中,要结识任何一位陌生的朋友,中间最多只要通过六个朋友就可以达到目的。”

我们举个例子更好地介绍六度分隔理论。一位叫做“FLYPI ”的网友用歌手孙燕姿做起了实验,如何才能与这个“亚洲小天后”建立联系呢?他认为以下的链条可能行之有效:“我→初中同学Eric→ Eric 在南洋理工大学念书的表哥Michael → Michael的教授,也就是孙燕姿的父亲→孙燕姿。”

放在Web 2.0 的背景下,每个用户都拥有自己的Blog、自己维护的Wiki、社会化书签或者Podcast.用户通过Tag 、RSS 或者IM、邮件等方式连接到一起,“按照六度分隔理论,每个个体的社交圈都不断放大,最后成为一个大型网络,这就是社会化网络(SNS )。”

Google推出1GB 免费信箱也是一个SNS 应用,通过网友之间的互相邀请,Gmail 在很短的时间内就获得了巨大的用户群。

SNS 还处于起步阶段,对于它的商业价值和未来的发展方向,现在也没有一个统一的认识。

|

2. 基于本体的语义web服务组合,这里面的本体是什么意思

本体是对相关领域中的概念及概念之间的关系的一种形式化描述,它是从哲学领域中借鉴过来的概念,在语义网中,本体是核心和基础的东西,当我们把一个领域中的概念用本体来描述后,实际上就形成了一个规范或标准,这样,不同平台的应用系统就能共同遵从这一规范化的描述,形成对同一概念的语义共识,从而最终达到“机器理解”的目的。
可以看看一些关于语义Web的书籍,里面一般都有非常详细的介绍。

3. 如何理解 web 语义化

语义化的HTML结构怎么理解
关于html结构的面试题,语义化的html占据了很大一部分。那么为什么要使用语义化的HTML?语义化的HTML到底有什么好处呢?

HTML是提供网页文档内容的上下文结构和含义;html本身是没有表现的,我们看到例如<h1>是粗体,字体大小2em,加粗;<strong>是加粗的,不要认为这是html的表现,这些其实html默认的css样式在起作用,所以首先我们要知道html和页面的表现是没有关系的,这些是css的事情。HTML在页面中的作用就是结构和含义,通俗点说就是划分内容,这里放什么,我们放的是什么。
语义化的HTML结构首先要强调HTML结构
HTML结构是页面的骨架,一个页面就好像一幢房子,HTML结构就是钢精钢筋混泥土的墙,一幢房子如果没有钢精钢筋混泥土的墙那就是一堆费砖头,不能住人,不能办公。css是装饰材料,是原木地板,是大理石,是油漆,是用来装饰房子的,CSS的强大就不用多说了,css如果没有html结构那就是一堆木板,一同油漆,没有了实际使用价值。CSS完全依靠引用它的(X)HTML文档。如果你想使CSS的能力充分发挥到极致,提供一个用既干净又有结构的内容的html是非常必要的,“HTML是在互联网上发布超文本的通用语,HTML使用标签来对文本结构化”。
语义化的HTML结构怎么写?
HTML是一种对文本内容进行结构和意义(或者说“语义”)进行补充的方法。它会告诉我们说:“这行是一个标题,这几行组成了一个段落。这些文字是项目列表,这些文字是链接到互联网上另一个文件的超链接。”值得注意的是,不应该让HTML来告诉我们:“这些文字是蓝色的,这些文字又是红色的。这部分内容是最最靠右的一栏,这行内容是斜体字。”这些和表现相关的信息是CSS的工作。在做前端开发的时候要记住:HTML告诉我们一块内容是什么(或其意义),而不是它长的什么样子。当我们提到“语义标记”的时候,我们所说的HTML应该是完全脱离表现信息的,其中的标签应该都是语义化地定义了文档的结构。
语义化的HTML结构其实很简单,首先掌握html中各个标签的语义,<div>是一个容器;<strong>是表示强调;<ul><li>是一个无序列表等等…在看到内容的时候想想用什么标签能更好的描述它,是什么就用什么标签。

语义化的HTML结构到底有什么好处?
我们知道HTML5新增的标签,比如<header>和<footer>,html正在朝着更加健壮的语义化的HTML结构发展,xhtml2在这点上没html5先进,这也是xhtml2死亡的一个原因,这一点也说明语义化的HTML结构是html的发展趋势。

1.去掉或样式丢失的时候能让页面呈现清晰的结构:
html本身是没有表现的,我们看到例如<h1>是粗体,字体大小2em,加粗;<strong>是加粗的,不要认为这是html的表现,这些其实html默认的css样式在起作用,所以去掉或样式丢失的时候能让页面呈现清晰的结构不是语义化的HTML结构的优点,但是浏览器都有有默认样式,默认样式的目的也是为了更好的表达html的语义,可以说浏览器的默认样式和语义化的HTML结构是不可分割的。

2.屏幕阅读器(如果访客有视障)会完全根据你的标记来“读”你的网页.
例如,如果你使用的含语义的标记,屏幕阅读器就会“逐个拼出”你的单词,而不是试着去对它完整发音.

3.PDA、手机等设备可能无法像普通电脑的浏览器一样来渲染网页(通常是因为这些设备对CSS的支持较弱).

使用语义标记可以确保这些设备以一种有意义的方式来渲染网页.理想情况下,观看设备的任务是符合设备本身的条件来渲染网页.
语义标记为设备提供了所需的相关信息,就省去了你自己去考虑所有可能的显示情况(包括现有的或者将来新的设备).例如,一部手机可以选择使一段标记了标题的文字以粗体显示.而掌上电脑可能会以比较大的字体来显示.无论哪种方式一旦你对文本标记为标题,您就可以确信读取设备将根据其自身的条件来合适地显示页面.

4.搜索引擎的爬虫也依赖于标记来确定上下文和各个关键字的权重.
过去你可能还没有考虑搜索引擎的爬虫也是网站的“访客”,但现在它们他们实际上是极其宝贵的用户.没有他们的话,搜索引擎将无法索引你的网站,然后一般用户将很难过来访问.

5.你的页面是否对爬虫容易理解非常重要,因为爬虫很大程度上会忽略用于表现的标记,而只注重语义标记.
因此,如果页面文件的标题被标记,而不是,那么这个页面在搜索结果的位置可能会比较靠后.除了提升易用性外,语义标记有利于正确使用CSS和JavaScript,因为其本身提供了许多“钩钩”来应用页面的样式与行为.SEO主要还是靠你网站的内容和外部链接的。

6.便于团队开发和维护
W3C给我们定了一个很好的标准,在团队中大家都遵循这个标准,可以减少很多差异化的东西,方便开发和维护,提高开发效率,甚至 实现模块化开发。
如有不同观点,补充,欢迎留言讨论。

4. web2.0是什么意思

Web2.0 是相对于Web1.0的新的时代。

指的是一个利用Web的平台,由用户主导而生成的内容互联网产品模式,为了区别传统由网站雇员主导生成的内容而定义为第二代互联网,web2.0是一个新的时代。

抛开纷繁芜杂的Web 2.0现象,进而将其放到科技发展与社会变革的大视野下来看,Web 2.0可以说是信息技术发展引发网络革命所带来的面向未来、以人为本的创新2.0模式在互联网领域的典型体现,是由专业人员织网到所有用户参与织网的创新民主化进程的生动注释。

Web2.0模式下的互联网应用具有以下显着特点:去中心化、开放、共享。

1、用户分享。在Web2.0模式下,可以不受时间和地域的限制分享各种观点。用户可以得到自己需要的信息也可以发布自己的观点。

2、信息聚合。信息在网络上不断积累,不会丢失。

3、以兴趣为聚合点的社群。在Web2.0模式下,聚集的是对某个或者某些问题感兴趣的群体,可以说,在无形中已经产生了细分市场。

4、开放的平台,活跃的用户。平台对于用户来说是开放的,而且用户因为兴趣而保持比较高的忠诚度,他们会积极地参与其中。

5. 知识图谱:方法、实践与应用笔记-第2章 知识图谱表示与建模

描述逻辑(description logic)是一簇知识表示的语言,其以结构化、形式化的方法来表示特定应用领域的知识.作为一类用于知识表示的形式化工具,描述逻辑在信息系统、软件工程以及自然语言处理等领域得到了广泛的应用[1].特别是在第三代Web——语义网(semantic Web)中,描述逻辑更是扮演着关键角色,并成为W3C推荐Web本体语言OWL的逻辑基础 。

现代知识图谱通常是以三元组为基础进行简单的知识表示,弱化了对强逻辑表示的要求。

基于向量的知识表示在现代知识图谱中越来越收到重视,因为基于向量的知识图谱表示可以使这些数据更易于和深度学习模型集成。

基于向量的知识表示: 知识表示学习的定义知识表示学习是将知识库中的知识表示为低维稠密的实体向量,即Embedding。知识图谱是由实体和关系组成,通常采用三元组的形式表示,【head(头实体),relation(实体的关系),tail(尾实体)】,简写为(h,r,t)。知识表示学习任务就是学习h,r,t的分布式表示(也被叫做知识图谱的嵌入表示(embedding))。

一阶谓词逻辑 :用变量和谓词来表示知识。

霍恩子句 :带有最多一个肯定文字的子句。有且只有一个肯定文字的霍恩子句叫做 明确子句 ,没有任何肯定文字的霍恩子句叫做 目标子句

霍恩逻辑

语义网络 :三元组(节点1,联想弧,节点2)

框架 :基本单元为类(槽,侧面)。基本单元表示一类事物吗?

描述逻辑 :一阶逻辑的一个可判定子集,即每个描述逻辑中的命题都可以在有限时间内完成证明或证否,只有极少数的描述逻辑类型被认为是不可判定的。利用一阶逻辑对语义网络和框架进行形式化后的产物?描述逻辑方法多数被用到涉及知识分类的应用领域,如数字图书馆和面向万维网的信息处理。描述逻辑是当前 语义网 发展中 本体 的理论基础。例如, OWL 因特网 本体 语言就是一种描述逻辑 SHIOQ (D) 的语法形式。

一个描述逻辑系统中的名字可分为概念(concept),属性(role)和个体(indivial)。例如,一个用描述逻辑描述的知识库如下:

男人 人 (男人 是 人)

丈夫 男人   婚配于人 (丈夫是 婚配于 至少一个 人 的 男人)

男人(张三) (张三是一个男人)

其中,“男人”、“人”、“丈夫”是概念,“婚配于”是属性,“张三”是个体

描述逻辑和一阶谓词逻辑的区别?

RDF/RDFS :DBpedia,Yago,Freebase

统一资源标识符 (英语: U niform  R esource  I dentifier,缩写: URI )在 电脑 术语中是一个用于 标识 某一 互联网 资源 名称的 字符串 。

该种标识允许用户对网络中(一般指 万维网 )的资源通过特定的 协议 进行交互操作。URI的最常见的形式是 统一资源定位符 (URL),经常指定为非正式的网址。更罕见的用法是 统一资源名称 (URN),其目的是通过提供一种途径。用于在特定的 名字空间 资源的标识,以补充网址。

OWL/OWL2 : 我认为就是在RDF的基础上再加一些约束。

OWL2QL为查询设计的;OWL2EL提供多项式推理,专为概念属于描述,本体的分类推理而设计,广泛应用于生物医疗领域,如临床医疗术语本体SNOMED CT;OWL2ET的分类复杂度是Ptime,用于推理(后两个区别?)

查询语言SPARQL

语义Markup表示语言 : 在网页中嵌入语义Markup的方法和表示语言。主要包括JSON-LD、RDFa和HTML5 MicroData。

Freebase:对象-object、事实-Facts、类型-Types和属性-Properties.

Wikidata:页面-Page、实体-Entities、条目-Items、属性-Properties、陈述-Statements、修饰-Qualifiers、引用-Reference等。

ConceptNet5:概念-Concepts、词-Words、短语-Phrases、断言-Assertions、关系-Relations、边-Edges。包含21种预定义的、多语言通用的关系。

词的向量表示方法:独热编码、词袋模型、词向量

词向量的产生方法中经典的额开源工具word2vec中包含两个模型cBoW和Skip-gram。

cBoW和Skip-gram都是用来训练word embeding的。

cBow和Bow的区别:Bow用于一段文本,是一种思想;cBow是把Bow的思想通过滑动窗口用于此向量的实现。

TransE是一个算法,用于graph enbeding.

word enbeding是将文本变成向量;graph emdeding是将实体和关系变成向量。

思考如何从word embeding变成graph embeding?

代表性知识图谱介绍:

1. SNOMED CT

SNOMED CT ( S ystematized  No menclature of  Med icine --  C linical  T erms, 医学系统命名法-临床术语 , 医学术语系统命名法-临床术语 ),是一部经过系统组织编排的,便于 计算机 处理的 医学 术语集 ,涵盖大多数方面的 临床信息 ,如 疾病 、所见、操作、 微生物 、 药物 等。采用该术语集,可以协调一致地在不同的 学科 、 专业 和照护地点之间实现对于临床数据的标引、存储、检索和聚合。同时,它还有助于组织 病历 内容,减少临床照护和科学研究工作中数据采集、编码及使用方式的变异。(From wiki)

SNOMED CT目前包括大约321 900条概念(Concept)、超过80万条临床概念相关的描述(Descriptions),和超过700万条进一步描述概念的关系(Relationships)。

SNOMED CT的主要内容包括概念表、描述表、关系表、历史表、ICD映射表和LONIC映射表。其中核心构成是: 概念表(按层级结构组织的具有临床含义的概念表)、描述表(用于表达概念的人类自然语言表)和关系表(用来说明的两个临床概念之间的关系) 。