1. 新浪微博資料庫是如何設計的
這個問題的答案好像很復雜。可以看下新浪微博架構師TimYang的《構建高性能的微博系統——再談新浪微博架構》
談談個人看法:
微博技術架構的關鍵點在於如何優化Cache和消息隊列的使用效率,以及合理規劃數據存儲方式。
如此海量的數據推送必然是通過非同步消息隊列處理,而不是簡單的資料庫直接寫入,因此系統的負載壓力會逐層分散到後端資料庫上,並不是集中於某幾台資料庫上。
新數據通知,應該通過各種基礎服務預先計算出的數據集合,再通過客戶端每30秒的輪詢請求返回,並非請求後的實時計算,因此壓力可能更多的集中在cache層上。
2. 新浪微博的「關注功能」資料庫是如何設計的
你好。方法有二個:
我覺得是這樣設計的
一個欄位記錄他所關注的好友信息
應該是json的
然後去資料庫查最新的就是更新就是
uchome就是這么乾的
sql">--用戶表(如果這個表數據相當多,可以用分區表)
createtableuserinfo
(useridnumber(38,0),--可以用序列遞增值也成,自己看著辦
usernamevarchar2(60),
phonevarchar2(20),
addressvarchar2(20),
sexchar(1),
cdatedatedefaultsysdate
--其他欄位,自己添加
);
_userinfoprimarykey(userid);
--用戶關注信息表(如果這個表數據相當多,可以用分區表):
createtableuserattention
(useridnumber(38,0),--用戶ID
attention_useridnumber(38,0),--被關注的用戶ID
statusnumber(18,0),--關注狀態(或者說關注等級,自己定義:0代表什麼,1代表什麼)
cdatedatedefaultsysdate,--創建時間
udatedatedefaultsysdate--修改時間
--其他欄位,自己添加
);
--為保持數據完整性:不管是「用戶ID」還是「被關注的用戶ID」其ID必須在userinfo表中存在!
_userattentionprimarykey(userid,attention_userid);
_userattention_useridforeignkey(userid)referencesuserinfo(userid);
_userattention_att_useridforeignkey(attention_userid)referencesuserinfo(userid);
userattention表中一個userid對應該可能有N條記錄(而不像你說的:用一條記錄,其不同的attention_userid用逗號隔開,這樣設置是不合理的)
--好比QQ號,我的QQ可以添加N個QQ好友,但我想:騰迅應該不會將我這N個QQ好友用字串連成一條記錄(這也太吝嗇啦)
3. 新浪微博 資料庫是用的redis嗎
不是的,用的mysql資料庫。
MySQ是一個關系型資料庫管理系統,由瑞典 MySQL AB 公司開發,目前屬於 Oracle 旗下公司。MySQL 最流行的關系型資料庫管理系統,在 WEB 應用方面 MySQL 是最好的 RDBMS (Relational Database Management System,關系資料庫管理系統) 應用軟體之一。MySQL 是一種關聯資料庫管理系統,關聯資料庫將數據保存在不同的表中,而不是將所有數據放在一個大倉庫內,這樣就增加了速度並提高了靈活性。
MySQL 所使用的 SQL 語言是用於訪問資料庫的最常用標准化語言。MySQL 軟體採用了雙授權政策,它分為社區版和商業版,由於其體積小、速度快、總體擁有成本低,尤其是開放源碼這一特點,一般中小型網站的開發都選擇 MySQL 作為網站資料庫。由於其社區版的性能卓越,搭配 PHP 和 Apache 可組成良好的開發環境。
4. 設計微博網頁連接資料庫實現發表功能
需要用到ajax,實時調用跟新
5. 比如微博上的文章和評論也都是保存在資料庫上嗎那麼多東西怎麼保存呢
是保存在資料庫上的,結構進行了各種優化,具體怎麼存儲和表結構就是商業機密了,而且隨著用戶增加,結構也曾經改過.
6. 新浪微博是用什麼語言和資料庫寫的
應該是PHP+MySQL
7. 微博數據是不會被刪除的嗎
這個關繫到資料庫的存儲問題,提供微博服務的這些門戶網站,伺服器都是性能非常好的。他們在資料庫的維護上,肯定會採取一些策略。我只是學習過資料庫這門課的皮毛,了解提高查詢效率可以用建立索引之類的操作。現實的操作肯定會比書本上講的復雜的多,所以這些維護會保證查詢效率的。希望對你有幫助。
8. 目前國內外的大多數微博系統是基於什麼平台開發的,以及後台的資料庫是什麼各自有什麼缺點嗎
一、什麼是C/S和B/S
要想對「C/S」和「B/S」技術發展變化有所了解,首先必須搞清楚三個問題。
第一、什麼是C/S結構。
C/S (Client/Server)結構,即大家熟知的客戶機和伺服器結構。它是軟體系統體系結構,通過它可以充分利用兩端硬體環境的優勢,將任務合理分配到Client端和Server端來實現,降低了系統的通訊開銷。目前大多數應用軟體系統都是Client/Server形式的兩層結構,由於現在的軟體應用系統正在向分布式的Web應用發展,Web和Client/Server 應用都可以進行同樣的業務處理,應用不同的模塊共享邏輯組件;因此,內部的和外部的用戶都可以訪問新的和現有的應用系統,通過現有應用系統中的邏輯可以擴展出新的應用系統。這也就是目前應用系統的發展方向。
傳統的C/S體系結構雖然採用的是開放模式,但這只是系統開發一級的開放性,在特定的應用中無論是Client端還是Server端都還需要特定的軟體支持。由於沒能提供用戶真正期望的開放環境,C/S結構的軟體需要針對不同的操作系統系統開發不同版本的軟體, 加之產品的更新換代十分快,已經很難適應百台電腦以上區域網用戶同時使用。而且代價高, 效率低。
第二、什麼是B/S結構。
B/S(Browser/Server)結構即瀏覽器和伺服器結構。它是隨著Internet技術的興起,對C/S結構的一種變化或者改進的結構。在這種結構下,用戶工作界面是通過WWW瀏覽器來實現,極少部分事務邏輯在前端(Browser)實現,但是主要事務邏輯在伺服器端(Server)實現,形成所謂三層3-tier結構。這樣就大大簡化了客戶端電腦載荷,減輕了系統維護與升級的成本和工作量,降低了用戶的總體成本(TCO)。
以目前的技術看,區域網建立B/S結構的網路應用,並通過Internet/Intranet模式下資料庫應用,相對易於把握、成本也是較低的。它是一次性到位的開發,能實現不同的人員,從不同的地點,以不同的接入方式(比如LAN, WAN, Internet/Intranet等)訪問和操作共同的資料庫;它能有效地保護數據平台和管理訪問許可權,伺服器資料庫也很安全 。特別是在JAVA這樣的跨平台語言出現之後,B/S架構管理軟體更是方便、快捷、高效。
第三、管理軟體主流技術。
管理軟體技術的主流技術與管理思想一樣,也經歷了三個發展時期。首先,界面技術從上世紀DOS字元界面到Windows圖形界面(或圖形用戶界面GUI),直至Browser瀏覽器界面三個不同的發展時期。其次,今天所有電腦的瀏覽器界面,不僅直觀和易於使用,更主要的是基於瀏覽器平台的任何應用軟體其風格都是一樣的,使用人對操作培訓的要求不高,而且軟體可操作性強,易於識別;再者,平台體系結構也從過去單用戶發展到今天的文件/伺服器(F/S)體系、客戶機/伺服器(C/S)體系和瀏覽器/伺服器(B/S)體系。
二、C/S和B/S 之比較
C/S和B/S是當今世界開發模式技術架構的兩大主流技術。C/S是美國 Borland公司最早研發,B/S是美國微軟公司研發。目前,這兩項技術以被世界各國所掌握,國內公司以C/S和B/S技術開發出產品也很多。這兩種技術都有自己一定的市場份額和客戶群,各家企業都說自己的管理軟體架構技術功能強大、先進、方便,都能舉出各自的客戶群體,都有一大群文人墨客為自己搖旗吶喊,廣告滿天飛,可謂仁者見仁,智者見智。
1、C/S架構軟體的優勢與劣勢
(1)、應用伺服器運行數據負荷較輕。
最簡單的C/S體系結構的資料庫應用由兩部分組成,即客戶應用程序和資料庫伺服器程序。二者可分別稱為前台程序與後台程序。運行資料庫伺服器程序的機器,也稱為應用伺服器。一旦伺服器程序被啟動,就隨時等待響應客戶程序發來的請求;客戶應用程序運行在用戶自己的電腦上,對應於資料庫伺服器,可稱為客戶電腦,當需要對資料庫中的數據進行任何操作時,客戶程序就自動地尋找伺服器程序,並向其發出請求,伺服器程序根據預定的規則作出應答,送回結果,應用伺服器運行數據負荷較輕。
(2)、數據的儲存管理功能較為透明。
在資料庫應用中,數據的儲存管理功能,是由伺服器程序和客戶應用程序分別獨立進行的,前台應用可以違反的規則,並且通常把那些不同的(不管是已知還是未知的)運行數據,在伺服器程序中不集中實現,例如訪問者的許可權,編號可以重復、必須有客戶才能建立定單這樣的規則。所有這些,對於工作在前台程序上的最終用戶,是「透明」的,他們無須過問(通常也無法干涉)背後的過程,就可以完成自己的一切工作。在客戶伺服器架構的應用中,前台程序不是非常「瘦小」,麻煩的事情都交給了伺服器和網路。在C/S體系的下,資料庫不能真正成為公共、專業化的倉庫,它受到獨立的專門管理。
(3)、C/S架構的劣勢是高昂的維護成本且投資大。
首先,採用C/S架構,要選擇適當的資料庫平台來實現資料庫數據的真正「統一」,使分布於兩地的數據同步完全交由資料庫系統去管理,但邏輯上兩地的操作者要直接訪問同一個資料庫才能有效實現,有這樣一些問題,如果需要建立「實時」的數據同步,就必須在兩地間建立實時的通訊連接,保持兩地的資料庫伺服器在線運行,網路管理工作人員既要對伺服器維護管理,又要對客戶端維護和管理,這需要高昂的投資和復雜的技術支持,維護成本很高,維護任務量大。
其次,傳統的C/S結構的軟體需要針對不同的操作系統系統開發不同版本的軟體,由於產品的更新換代十分快,代價高和低效率已經不適應工作需要。在JAVA這樣的跨平台語言出現之後,B/S架構更是猛烈沖擊C/S,並對其形成威脅和挑戰。
2、B/S架構軟體的優勢與劣勢
(1)、維護和升級方式簡單。
目前,軟體系統的改進和升級越來越頻繁,B/S架構的產品明顯體現著更為方便的特性。對一個稍微大一點單位來說,系統管理人員如果需要在幾百甚至上千部電腦之間來回奔跑,效率和工作量是可想而知的,但B/S架構的軟體只需要管理伺服器就行了,所有的客戶端只是瀏覽器,根本不需要做任何的維護。無論用戶的規模有多大,有多少分支機構都不會增加任何維護升級的工作量,所有的操作只需要針對伺服器進行;如果是異地,只需要把伺服器連接專網即可,實現遠程維護、升級和共享。所以客戶機越來越「瘦」,而伺服器越來越「胖」是將來信息化發展的主流方向。今後,軟體升級和維護會越來越容易,而使用起來會越來越簡單,這對用戶人力、物力、時間、費用的節省是顯而易見的,驚人的。因此,維護和升級革命的方式是「瘦」客戶機,「胖」伺服器。
(2)、成本降低,選擇更多。
大家都知道windows在桌面電腦上幾乎一統天下,瀏覽器成為了標准配置,但在伺服器操作系統上windows並不是處於絕對的統治地位。現在的趨勢是凡使用B/S架構的應用管理軟體,只需安裝在Linux伺服器上即可,而且安全性高。所以伺服器操作系統的選擇是很多的,不管選用那種操作系統都可以讓大部分人使用windows作為桌面操作系統電腦不受影響,這就使的最流行免費的Linux操作系統快速發展起來,Linux除了操作系統是免費的以外,連資料庫也是免費的,這種選擇非常盛行。
比如說很多人每天上「網易」(原文為新浪)網,只要安裝了瀏覽器就可以了,並不需要了解「網易」的伺服器用的是什麼操作系統,而事實上大部分網站確實沒有使用windows操作系統,但用戶的電腦本身安裝的大部分是windows操作系統。
(3)、應用伺服器運行數據負荷較重。
由於B/S架構管理軟體只安裝在伺服器端(Server)上,網路管理人員只需要管理伺服器就行了,用戶界面主要事務邏輯在伺服器(Server)端完全通過WWW瀏覽器實現,極少部分事務邏輯在前端(Browser)實現,所有的客戶端只有瀏覽器,網路管理人員只需要做硬體維護。但是,應用伺服器運行數據負荷較重,一旦發生伺服器「崩潰」等問題,後果不堪設想。因此,許多單位都備有資料庫存儲伺服器,以防萬一。
3,C/S 與 B/S 區別
Client/Server是建立在區域網的基礎上的,Browser/Server是建立在廣域網的基礎上的。
(1)、硬體環境不同:
C/S 一般建立在專用的網路上, 小范圍里的網路環境, 區域網之間再通過專門伺服器提供連接和數據交換服務。
B/S 建立在廣域網之上的, 不必是專門的網路硬體環境,例如電話上網, 租用設備, 信息自己管理, 有比C/S更強的適應范圍, 一般只要有操作系統和瀏覽器就行。
(2)、對安全要求不同
C/S 一般面向相對固定的用戶群, 對信息安全的控制能力很強。 一般高度機密的信息系統採用C/S 結構適宜,可以通過B/S發布部分可公開信息。
B/S 建立在廣域網之上, 對安全的控制能力相對弱, 面向是不可知的用戶群。
(3)、對程序架構不同
C/S 程序可以更加註重流程,可以對許可權多層次校驗,對系統運行速度可以較少考慮。
B/S 對安全以及訪問速度的多重的考慮, 建立在需要更加優化的基礎之上。 比C/S有更高的要求,B/S結構的程序架構是發展的趨勢,從MS的.Net系列的BizTalk 2000 Exchange 2000等,全面支持網路的構件搭建的系統。SUN和IBM推的JavaBean構件技術等,使B/S更加成熟。
(4)、軟體重用不同
C/S 程序可以不可避免的整體性考慮, 構件的重用性不如在B/S要求下的構件的重用性好。
B/S 對的多重結構,要求構件相對獨立的功能。 能夠相對較好的重用。就如買來的餐桌可以再利用,而不是做在牆上的石頭桌子。
(5)、系統維護不同
系統維護是軟體生存周期中,開銷大,相當重要
C/S 程序由於整體性,必須整體考察,處理出現的問題以及系統升級難, 可能是再做一個全新的系統。
B/S 構件組成方面構件個別的更換,實現系統的無縫升級。 系統維護開銷減到最小,用戶從網上自己下載安裝就可以實現升級。
(6)、處理問題不同
C/S 程序可以處理用戶面固定,並且在相同區域, 安全要求高的需求,與操作系統相關, 應該都是相同的系統。
B/S 建立在廣域網上, 面向不同的用戶群,分散地域, 這是C/S無法作到的,與操作系統平台關系最小。
(7)、用戶介面不同
C/S 多是建立在Window平台上,表現方法有限,對程序員普遍要求較高。
B/S 建立在瀏覽器上, 有更加豐富和生動的表現方式與用戶交流, 並且大部分難度減低,降低開發成本。
(8)、信息流不同
C/S 程序一般是典型的中央集權的機械式處理,交互性相對低。
B/S 信息流向可變化, B-B、 B-C、 B-G等信息流向的變化, 更象交易中心
9. 新浪微博使用什麼資料庫
用的mysql資料庫。
MySQ是一個關系型資料庫管理系統,由瑞典 MySQL AB 公司開發,目前屬於 Oracle 旗下公司。MySQL 最流行的關系型資料庫管理系統,在 WEB 應用方面 MySQL 是最好的 RDBMS (Relational Database Management System,關系資料庫管理系統) 應用軟體之一。MySQL 是一種關聯資料庫管理系統,關聯資料庫將數據保存在不同的表中,而不是將所有數據放在一個大倉庫內,這樣就增加了速度並提高了靈活性。
MySQL 所使用的 SQL 語言是用於訪問資料庫的最常用標准化語言。MySQL 軟體採用了雙授權政策,它分為社區版和商業版,由於其體積小、速度快、總體擁有成本低,尤其是開放源碼這一特點,一般中小型網站的開發都選擇 MySQL 作為網站資料庫。由於其社區版的性能卓越,搭配 PHP 和 Apache 可組成良好的開發環境。