『壹』 語義網是什麼有什麼好處
文/thomas claburn
一些公司聯手致力於語義網開發環境和資料庫的研發。
有人把語義網(semantic web)稱為web3.0,現在它就要粉墨登場了。編程工具開發商topquadrant公司和franz公司日前表示,他們將把前者的topbraid composer和franz的allegrograph 64位rdf存儲資料庫結合起來,形成一個語義網開發環境和資料庫,提高計算機的「智力」。
語義技術可增強計算機對數據的理解,在整合大型數據集時用處特別顯著。它對於搜索應用的用處也很大,因為語義技術讓計算機推斷出未有明確定義的數據元素之間的關系。一個關鍵詞搜索通常僅僅返回包含查詢關鍵字的文檔,而語義搜索則能返回與搜索詞彙的含義有關的結果(例如:tank一詞,有坦克、水容器等兩種含義,語義技術能予以辨別),或者是與搜索詞彙的同義字有關的結果(例如:tank意為坦克時,同義字有armored vehicle,裝甲車)。
目前,還沒有出現真正意義上的語義網,這在很大程度上是因為現有工具還無法承擔這樣的任務。topquadrant的聯合創始人和執行合夥人拉爾夫·霍奇森(ralph hodgson)說:「我們必須要創建出合適的工具,來支持語義網的實現。」他說,包括protege和swoop等在內的公共領域許可軟體都還無法商用。
使用標准資料庫和開發環境的語義程序似乎不能很好地拓展。「你可以用自己的方式進行編程,」霍奇森說,「就是費點勁。」
語義網有許多的標准、協議以及包括rdf、owl(web ontology language,web本體語言)、sparql等在內的多種語言,此外還有可讓開發者在語義框架下組織數據的xml相關技術。上述兩家公司的產品組合,提供了一個基於eclipse的圖形開發環境和一個能與大量rdf數據同比擴大的資料庫。
葛蘭素史克公司(glaxosmithkline,下稱gsk)正在對allegrograph進行測試,以提供一個更為靈活的it基礎設施並通過自動化提高生產力。這家制葯公司正在利用一個語義數據提取層進行試驗。這項生物實驗室工作有很多制葯公司參與其中,因而產生了許多數據,gsk的一位主管羅賓·麥克伊泰(robin mcentire)說:「因此我們希望把它聚合起來,並在更高的一個層級上把它呈現出來,語義技術大有用處。」
該公司的目標是應用基於計算機的推理,從而對大量實驗數據進行評估和過濾。「低層級的推理是很好的開端,我們的科學家從事的任務並非『高科技』,但是特別耗時的任務就可以利用這項技術實現自動化。」麥克伊泰說。
伊士曼-柯達公司(eastman kodak,下稱柯達)也在使用allegrograph軟體,它從可視化數據中進行含義推斷,從而來幫助客戶更好地維護他們日漸龐大、難以管理的數字影像。
「語義理解技術將幫助消費者更好地管理自己的的圖片,」柯達主席兼首席執行官(ceo)彭安東(antonio perez)去年在一場演講中表示,「照片之間也能相互『認識』了—不用人們指點,利用元數據(metadata),一張照片便可尋找到具有相關元數據的另一張照片,因此,所有的照片便能以新的類別進行重新組合,無非取決於它們之間不同的關聯方式而已。」
『貳』 什麼是web語義化,百度了一下講的都不是很好,太凌亂了 ,求高手支招啊,另外web語義化有什麼好處
你是說語義Web吧?
學術屆將其稱為Web3.0的核心,目標是將當前的網頁提升為計算機能夠「理解」和處理的網頁。
核心思想是標注網頁對象使其對應本體中的實體,並通過邏輯等手段進行自動推理。
作用在於更好整合網路上的資源,使計算機能夠處理分布於不同位置的信息,自動產生問題的解決方案。
『叄』 語義網的基本特徵
類似於Web 2.0以AJAX概念為契機,如果說Web 3.0以語義網概念為契機的話,同樣會有近似於AJAX的一種技術,成為網路的標准、置標語言或者相關的處理工具,用來擴展萬維網,開創語義網時代。擁有這一技術的企業將是網路時代的弄潮兒。 語義網不同於現在WWW,現有的WWW是面向文檔而語義網則面向文檔所表示的數據,而語義網更重視於計算機「理解與處理」,並且具有一定的判斷、推理能力。 語義網的實現意味著當時會存在一大批與語義網相互依賴的智能個體(程序),廣泛的存在於計算機、通訊工具、電器等等物品上,他們組合形成環繞人類生存的初級智能網路。 語義網是WWW的擴展與延伸,它展示了WWW的美好前景以及由此而帶來的互聯網的革命,但語義網的實現仍面臨著巨大的挑戰: 內容的可獲取性,即基於Ontology(本體,下同) 而構建的語義網網頁目前還很少; 本體的開發和演化,包括用於所有領域的核心本體的開發、開發過程中的方法及技術支持、本體的演化及標注和版本控制問題; 內容的可擴展性,即有了語義網的內容以後,如何以可擴展的方式來管理它,包括如何組織、存儲和查找等; 多語種支持; 本體語言的標准化。
『肆』 語義網的概念
語義網的概念是由萬維網聯盟的蒂姆·伯納斯-李(Tim Berners-Lee)在1998年提出的一個概念,實際上是基於很多現有技術的,也依賴於後來和text-and-markup與知識表現的綜合。其淵源甚至可以追溯到20世紀60年代末期的Collins、Quillian、Loftus等人的研究,還有之後70年代初Simon、Schamk、Minsky等人陸續提出的一些理論上的成果。其中Simon在進行自然語言理解的應用研究時提出了語義網路(Semantic Network,不是現在的Semantic Web)的概念。當時人們甚至發明了以邏輯為基礎的程序設計語言Prolog。
蒂姆·伯納斯-李在2006年普林斯頓大學演講和後期接受媒體采訪時公開表示,他最初將這種智能網路命名為語義網或許不夠貼切,也許更准確的名稱應該是數據網(外語:Data Web)。
語義網就是能夠根據語義進行判斷的智能網路,實現人與電腦之間的無障礙溝通。它好比一個巨型的大腦,智能化程度極高,協調能力非常強大。在語義網上連接的每一部電腦不但能夠理解詞語和概念,而且還能夠理解它們之間的邏輯關系,可以幹人所從事的工作。它將使人類從搜索相關網頁的繁重勞動中解放出來,把用戶變成全能的上帝。語義網中的計算機能利用自己的智能軟體,在萬維網上的海量資源中找到你所需要的信息,從而將一個個現存的信息孤島發展成一個巨大的資料庫。
語義網的建立極大地涉及了人工智慧領域的部分,與Web 3.0智能網路的理念不謀而合,因此語義網的初步實現也作為Web 3.0的重要特徵之一,但是想要實現成為網路上的超級大腦,需要長期的研究,這意味著語義網的相關實現會占據網路發展進程的重要部分,並且延續於數個網路時代,逐漸轉化成「智能網」。
『伍』 如何理解 web 語義化
語義化的HTML結構怎麼理解
關於html結構的面試題,語義化的html占據了很大一部分。那麼為什麼要使用語義化的HTML?語義化的HTML到底有什麼好處呢?
HTML是提供網頁文檔內容的上下文結構和含義;html本身是沒有表現的,我們看到例如<h1>是粗體,字體大小2em,加粗;<strong>是加粗的,不要認為這是html的表現,這些其實html默認的css樣式在起作用,所以首先我們要知道html和頁面的表現是沒有關系的,這些是css的事情。HTML在頁面中的作用就是結構和含義,通俗點說就是劃分內容,這里放什麼,我們放的是什麼。
語義化的HTML結構首先要強調HTML結構
HTML結構是頁面的骨架,一個頁面就好像一幢房子,HTML結構就是鋼精鋼筋混泥土的牆,一幢房子如果沒有鋼精鋼筋混泥土的牆那就是一堆費磚頭,不能住人,不能辦公。css是裝飾材料,是原木地板,是大理石,是油漆,是用來裝飾房子的,CSS的強大就不用多說了,css如果沒有html結構那就是一堆木板,一同油漆,沒有了實際使用價值。CSS完全依靠引用它的(X)HTML文檔。如果你想使CSS的能力充分發揮到極致,提供一個用既干凈又有結構的內容的html是非常必要的,「HTML是在互聯網上發布超文本的通用語,HTML使用標簽來對文本結構化」。
語義化的HTML結構怎麼寫?
HTML是一種對文本內容進行結構和意義(或者說「語義」)進行補充的方法。它會告訴我們說:「這行是一個標題,這幾行組成了一個段落。這些文字是項目列表,這些文字是鏈接到互聯網上另一個文件的超鏈接。」值得注意的是,不應該讓HTML來告訴我們:「這些文字是藍色的,這些文字又是紅色的。這部分內容是最最靠右的一欄,這行內容是斜體字。」這些和表現相關的信息是CSS的工作。在做前端開發的時候要記住:HTML告訴我們一塊內容是什麼(或其意義),而不是它長的什麼樣子。當我們提到「語義標記」的時候,我們所說的HTML應該是完全脫離表現信息的,其中的標簽應該都是語義化地定義了文檔的結構。
語義化的HTML結構其實很簡單,首先掌握html中各個標簽的語義,<div>是一個容器;<strong>是表示強調;<ul><li>是一個無序列表等等…在看到內容的時候想想用什麼標簽能更好的描述它,是什麼就用什麼標簽。
語義化的HTML結構到底有什麼好處?
我們知道HTML5新增的標簽,比如<header>和<footer>,html正在朝著更加健壯的語義化的HTML結構發展,xhtml2在這點上沒html5先進,這也是xhtml2死亡的一個原因,這一點也說明語義化的HTML結構是html的發展趨勢。
1.去掉或樣式丟失的時候能讓頁面呈現清晰的結構:
html本身是沒有表現的,我們看到例如<h1>是粗體,字體大小2em,加粗;<strong>是加粗的,不要認為這是html的表現,這些其實html默認的css樣式在起作用,所以去掉或樣式丟失的時候能讓頁面呈現清晰的結構不是語義化的HTML結構的優點,但是瀏覽器都有有默認樣式,默認樣式的目的也是為了更好的表達html的語義,可以說瀏覽器的默認樣式和語義化的HTML結構是不可分割的。
2.屏幕閱讀器(如果訪客有視障)會完全根據你的標記來「讀」你的網頁.
例如,如果你使用的含語義的標記,屏幕閱讀器就會「逐個拼出」你的單詞,而不是試著去對它完整發音.
3.PDA、手機等設備可能無法像普通電腦的瀏覽器一樣來渲染網頁(通常是因為這些設備對CSS的支持較弱).
使用語義標記可以確保這些設備以一種有意義的方式來渲染網頁.理想情況下,觀看設備的任務是符合設備本身的條件來渲染網頁.
語義標記為設備提供了所需的相關信息,就省去了你自己去考慮所有可能的顯示情況(包括現有的或者將來新的設備).例如,一部手機可以選擇使一段標記了標題的文字以粗體顯示.而掌上電腦可能會以比較大的字體來顯示.無論哪種方式一旦你對文本標記為標題,您就可以確信讀取設備將根據其自身的條件來合適地顯示頁面.
4.搜索引擎的爬蟲也依賴於標記來確定上下文和各個關鍵字的權重.
過去你可能還沒有考慮搜索引擎的爬蟲也是網站的「訪客」,但現在它們他們實際上是極其寶貴的用戶.沒有他們的話,搜索引擎將無法索引你的網站,然後一般用戶將很難過來訪問.
5.你的頁面是否對爬蟲容易理解非常重要,因為爬蟲很大程度上會忽略用於表現的標記,而只注重語義標記.
因此,如果頁面文件的標題被標記,而不是,那麼這個頁面在搜索結果的位置可能會比較靠後.除了提升易用性外,語義標記有利於正確使用CSS和JavaScript,因為其本身提供了許多「鉤鉤」來應用頁面的樣式與行為.SEO主要還是靠你網站的內容和外部鏈接的。
6.便於團隊開發和維護
W3C給我們定了一個很好的標准,在團隊中大家都遵循這個標准,可以減少很多差異化的東西,方便開發和維護,提高開發效率,甚至 實現模塊化開發。
如有不同觀點,補充,歡迎留言討論。
『陸』 什麼語義網
語義網的概念:
語義網是Semantic Web的中文名稱。
語義網就是能夠根據語義進行判斷的網路。
簡單地說,語義網是一種能理解人類語言的智能網路,它不但能夠理解人類的語言,而且還可以使人與電腦之間的交流變得像人與人之間交流一樣輕松。
語義網是對未來網路的一個設想,在這樣的網路中,信息都被賦予了明確的含義,機器能夠自動地處理和集成網上可用的信息.語義網使用XML來定義定製的標簽格式以及用RDF的靈活性來表達數據,下一步需要的就是一種Ontology的網路語言(比如OWL)來描述網路文檔中的術語的明確含義和它們之間的關系.
添加了更多的用於描述屬性和類型的詞彙,例如類型之間的不相交性(disjointness),基數(cardinality),等價性,屬性的更豐富的類型,屬性特徵(例如對稱性,symmetry),以及枚舉類型(enumerated classes).
語義網的一些基本特徵:
(1)語義網不同於現在WWW,它是現有WWW的擴展與延伸;
(2) 現有的WWW是面向文檔而語義網則面向文檔所表示的數據;
(3) 語義網將更利於計算機「理解與處理」,並將具有一定的判斷、推理能力。
『柒』 web是什麼
web,全稱為World Wide Web,是全球廣域網的簡稱,也稱為萬維網,是一種基於超文本和HTTP的、全球性的、動態交互的、跨平台的分布式圖形信息系統。
表現形式
1、超文本(Hyper text)
超文本是一種用戶介面方式,用以顯示文本及與文本相關的內容。現時超文本普遍以電子文檔的方式存在,其中的文字包含有可以鏈接到其他欄位或者文檔的超文本鏈接,允許從當前閱讀位置直接切換到超文本鏈接所指向的文字。
2、超媒體(hypermedia)
超媒體是超級媒體的簡稱。是超文本(hypertext)和多媒體在信息瀏覽環境下的結合。用戶不僅能從一個文本跳到另一個文本,而且可以激活一段聲音,顯示一個圖形,甚至可以播放一段動畫。
3、超文本傳輸協議(HTTP,HyperText Transfer Protocol)
超文本傳輸協議是互聯網上應用最為廣泛的一種網路協議。
(7)語義web基本思想擴展閱讀:
萬維網使得全世界的人們以史無前例的巨大規模相互交流。相距遙遠的人們,甚至是不同年代的人們可以通過網路來發展親密的關系或者使彼此思想境界得到升華,甚至改變他們對待小事的態度以及精神。情感經歷、政治觀點、文化習慣、表達方式、商業建議、藝術、攝影、文學都可以以人類歷史上從來沒有過的低投入實現數據共享。
盡管使用萬維網仍然要依靠於存在自身缺陷的物化的工具,但至少它的信息保存方式不是使用人們熟悉的方式如圖書館、出版物那樣實在的東西。因此信息傳播是經由萬維網和英特網來實現,而無須被搬運具體的書卷,或者手工的或實物的復制而限制。而且數字儲存方式的優點是,你可以比查閱圖書館或者實在的書籍更容易有效率地查詢網路上的信息資源。
『捌』 語義web的含義
現有的互聯網網路是網頁的集合,而谷歌及其他搜索引擎正是通過網頁互相之間的鏈接來幫助用戶上網進行搜索。與此不同的是,「語義Web」將在更加微小的信息之間建立直接的連接,例如一條街道的地址與一份地圖等等。
『玖』 語義web的體系結構
下圖描述了語義Web的七層體系結構: 自描述
文檔 數據 數據 規則 信任 證明 數
字
簽
名 邏輯 本體 RDF+RDF Schema XML+NS+XML Schema 名稱空間 Unicode URI 第一層:Unicode和URI。
Unicode是一個字元集,這個字元集中所有字元都用兩個位元組表示,可以表示65536個字元,基本上包括了世界上所有語言的字元。數據格式採用Unicode的好處就是它支持世界上所有主要語言的混合,並且可以同時進行檢索。URI(Uniform ResourceIdentifier),即統一資源定位符,用於唯一標識網路上的一個概念或資源。在語義Web體系結構中,該層是整個語義Web的基礎,其中Unicode負責處理資源的編碼,URI負責資源的標識。
第二層:XML+NS+xmlschema。
XML是一個精簡的標准通用標記語言,它綜合了標准通用標記語言的豐富功能與HTML的易用性,它允許用戶在文檔中加入任意的結構,而無需說明這些結構的含意。NS(NameSpace)即命名空間,由URI索引確定,目的是為了避免不同的應用使用同樣的字元描述不同的事物。XML Schema是文檔類型定義(外語縮寫:DTD)的替代品,它本身採用XML語法,但比DTD更加靈活,提供更多的數據類型,能更好地為有效的XML文檔服務並提供數據校驗機制。正是由於XML靈活的結構性、由URI索引的NS而帶來的數據可確定性以及XMLSchema所提供的多種數據類型及檢驗機制,使其成為語義Web體系結構的重要組成部分。該層負責從語法上表示數據的內容和結構,通過使用標準的語言將網路信息的表現形式、數據結構和內容分離。
第三層:RDF+rdfschema。
資源描述框架(外語縮寫:RDF)是一種描述WWW上的信息資源的一種語言,其目標是建立一種供多種元數據標准共存的框架。該框架能充分利用各種元數據的優勢,進行基於Web的數據交換和再利用。RDF解決的是如何採用XML標准語法無二義性地描述資源對象的問題,使得所描述的資源的元數據信息成為機器可理解的信息。如果把XML看作為一種標准化的元數據語法規范的話,那麼RDF就可以看作為一種標准化的元數據語義描述規范。Rdfschema使用一種機器可以理解的體系來定義描述資源的詞彙,其目的是提供詞彙嵌入的機制或框架,在該框架下多種詞彙可以集成在一起實現對Web資源的描述。
第四層:「本體詞彙」(Ontology vocabulary)。
該層是在RDF(S)基礎上定義的概念及其關系的抽象描述,用於描述應用領域的知識,描述各類資源及資源之間的關系,實現對詞彙表的擴展。在這一層,用戶不僅可以定義概念而且可以定義概念之間豐富的關系。
第五至七層:Logic、Proof、Trust。
Logic負責提供公理和推理規則,而Logic一旦建立,便可以通過邏輯推理對資源、資源之間的關系以及推理結果進行驗證,證明其有效性。通過Proof交換以及數字簽名,建立一定的信任關系,從而證明語義Web輸出的可靠性以及其是否符合用戶的要求。
『拾』 web到底是啥意思
World Wide Web,簡稱WWW,是英國人TimBerners-Lee 1989年在歐洲共同體的一個大型科研機構任職時發明的。通過WEB,互聯網上的資源,可以在一個網頁里比較直觀的表示出來;而且資源之間,在網頁上可以鏈來鏈去。在WEB1.0上做出巨大貢獻的公司有Netscape,Yahoo和Google。 Netscape研發出第一個大規模商用的瀏覽器,Yahoo的楊致遠提出了互聯網黃頁, 而Google後來居上,推出了大受歡迎的搜索服務。
搜索最大的貢獻是,把互聯網上海量的信息,用機器初步分了個線索。但是,光知道網頁里有哪些關鍵字,只解決了人瀏覽網頁的需求。所以,Tim-Berners-Lee在提出WWW不久,即開始推崇語義網(Semantic Web)的概念。為什麼呢?因為互聯網上的內容,機器不能理解。他的理想是,網頁製作時和架構資料庫時,大家都用一種語義的方式,將網頁里的內容表述成機器可以理解的格式。這樣,整個互聯網就成了一個結構嚴謹的知識庫。從理想的角度,這是很誘人的,因為科學家和機器都喜歡有次序的東西。Berners-Lee關心的是,互聯網上數據,及能否被其它的互聯網應用所重復引用。舉一個例子說明標准資料庫的魅力。有個產品叫LiberyLink。裝了它後,到Amazon上去瀏覽時,會自動告訴你某一本書在用戶當地的圖書館能否找到,書號是多少等。因為一本書有統一的書號和書名,兩個不同的互聯網服務(Amazon 和當地圖書館資料庫檢索)可以公享數據,給用戶提供全新服務。
但是,語義網提出之後,曲高和寡,響應的人不多。為什麼?因為指望要網頁的製作者提供這么多額外的信息去讓機器理解一個網頁,太難;簡直就是人給機器打工。這違反了人們能偷懶就偷懶的本性。看看Google的成功就知道。 Google有個Page Rank技術,將網頁之間互相鏈接的關系,用來做結果排序的一個依據,變相利用了網頁製作人的判斷力。想一想網頁的製作者們,從數量來說,比純瀏覽者的數量小得多。但Google就這一個革新,用上了網頁的製作者的一部份力量,已將其推上了互聯網的頂峰。
所以互聯網下一步,是要讓所有的人都忙起來,全民織網,然後用軟體,機器的力量使這些信息更容易被需要的人找到和瀏覽。如果說WEB1.0是以數據為核心的網,那我覺得WEB2.0是以人為出發點的互聯網。 我們看一看最近的一些WEB2.0產品,就可以理解以上觀點。
Blog: 用戶織網,發表新知識,和其他用戶內容鏈接,進而非常自然的組織這些內容。
RSS: 用戶產生內容自動分發,定閱
Podcasting: 個人視頻/聲頻的發布/定閱
SNS: blog+人和人之間的鏈接
WIKI: 用戶共同建設一個大網路全書
從知識生產的角度看,WEB1.0的任務,是將以前沒有放在網上的人類知識,通過商業的力量,放到網上去。WEB2.0的任務是,將這些知識,通過每個用戶的瀏覽求知的力量,協作工作,把知識有機的組織起來,在這個過程中繼續將知識深化,並產生新的思想火花;
從內容產生者角度看,WEB1.0是商業公司為主體把內容往網上搬,而WEB2.0則是以用戶為主,以簡便隨意方式,通過blog/podcasting 方式把新內容往網上搬;
從交互性看,WEB1.0是網站對用戶為主;WEB2.0是以P2P為主。
從技術上看,WEB客戶端化,工作效率越來越高。比如像Ajax技術, GoogleMAP/Gmail裡面用得出神入化。
我們看到,用戶在互聯網上的作用越來越大;他們貢獻內容,傳播內容,而且提供了這些內容之間的鏈接關系和瀏覽路徑。在SNS裡面,內容是以用戶為核心來組織的。WEB2.0是以用戶為核心的互聯網。
那麼,這種意義上的WEB2.0,和Tim Berners-Lee的語義網,有什麼不同呢?語義網的出發點是數據的規整及可重復被機器調用,提出使用語義化的內容發布工具, 試圖從規則和技術標准上使互聯網更加有序。 Google等搜索引擎,在沒有語義網的情況下,盡可能的給互聯網提供了線索。 WEB2.0則是鼓勵用戶用最方便的辦法發布內容(blog/podcasting),但是通過用戶自發的(blog)或者系統自動以人為核心(SNS)的互相鏈接給這些看似凌亂的內容提供索引。 因為這些線索是用戶自己提供,更加符合用戶使用感受。互聯網逐漸從以關鍵字為核心的組織方式和閱讀方式,到以互聯網用戶的個人portal(SNS)為線索,或者以個人的思想脈絡(blog/rss)為線索的閱讀方式。WEB2.0強調用戶之間的協作。WIKI是個典型例子。從這個角度看,互聯網是在變得更有序,每個用戶都在貢獻:要麼貢獻內容,要麼貢獻內容的次序.
對下一代互聯網的看法,還會有很多的討論。有一點可以肯定,WEB2.0是以人為核心線索的網。提供更方便用戶織網的工具,鼓勵提供內容。根據用戶在互聯網上留下的痕跡,組織瀏覽的線索,提供相關的服務,給用戶創造新的價值,給整個互聯網產生新的價值,才是WEB2.0商業之道。