1. 醫院信息系統中資料庫的設計有哪些原則與注意事項
1、准備項目計劃書。項目計劃書是醫院信息系統實施過程中第一個最重要的文件。它勾畫了醫院要建設的醫院信息系統總輪廓。通常是委託一家咨詢公司完成一份項目計劃書的標書,該標書的內容為醫院准備建設醫院信息系統的動機和全面、具體、細致的需求。
然後將標書發給參加競標的廠檔凳局商,在收到各廠商的計劃書後,進行認真的評價,決定最終執行方案。
2、選擇軟硬體的集成商、供應商和合作夥伴,通常委託有資質的咨詢公司或特別的專家小組進行方案評估。
3、需求分析。首先通過對目標醫院使用者的訪問、調查,詳細了解用戶的流程行讓與需求,最後形成文檔:《項目結構》文檔、《目標范圍說明書》文檔、《用戶需求說明書》文檔、初步的《用戶界面說明書》文檔、《測試戰略》文檔、《測試規范與通過標准》文檔。
4、系統設計與軟體客戶化。設計階段要做的工作:把用戶的需求變成技術上可實現的步驟;完善用戶界面演示程序,讓用戶完全接受系統的界面形式;制訂《客戶溝通計劃》,收集和控制用戶需求;完成《功能規格說明書》的簽署並凍結。
初步完成《測試規格》文檔;風險評估。要完成的文檔:《用戶界面說明書》、《概念設計》、《邏輯設計》、《物理設計》、《功能規格說明書》、《測試計劃和時間表》、《測試規格》文檔和大部分的《測試用例》文檔、《項目時間表》。
5、數據准備與裝入。數據准備是指將醫院的基礎數據按照系統的要求統一、規范、格式化的表達出來,並錄人系統基礎資料庫。這些是系統賴以正常運作的基礎。
6、系統測試。在系統測試階段要做的工作:代碼錯誤修改;進行ALPHA測試、BETA測試和RELEASE測試;繼續保持與客戶/用戶的緊密聯系,控制用戶的期望值;編寫聯機幫助和用戶使用手冊;進行用戶培訓和項目驗收;風險評估。
要完成的文檔:《用戶操作手冊》、《實施維護手冊》、《測試報告》、《驗收報告》、《聯機幫助》。階段到達標准後進行審核。
7、用戶培訓。供應商應該有事先安排好的計劃,專門粗旦的教師與教材,要准備設備完善的培訓教室和環境。對用戶的培訓可以為對醫院計算機技術人員的培訓和對最終用戶的培訓。
2. 資料庫的組織結構是什麼
看看你要找的這里有沒有?
※資料庫的概念與用途
?資料庫的概念
什麼是資料庫呢?當人們從不同的角度來描述這一概念時就有不同的定義(當然是描述性的)。例如,稱資料庫是一個"記錄保存系統"(該定義強調了資料庫是若干記錄的集合)。又如稱資料庫是"人們為解決特定的任務,以一定的組織方式存儲在一起的相關的數據的集合"(該定義側重於數據的組織)。更有甚者稱資料庫是"一個數據倉庫"。當然,這種說法雖然形象,但並不嚴謹。嚴格地說,資料庫是"按照數據結構來組織、存儲和管理數據的倉庫"。在經濟管理的日常工作中,常常需要把鍵嫌汪某些相關的數據放進這樣"倉庫",並根據管理的需要進行相應的處理。例如,企業或事業單位的人事部門常常要把本單位職工的基本情況(職工號、姓名、年齡、性別、籍貫、工資、簡歷等)存放在表20.6.3中,這張表就可以看成是一個資料庫。有了這個"數據倉庫"我們就可以根據需要隨時查詢某職工的基本情況,也可以查詢工資在某個范圍內的職工人數等等。這些工作如果都能在計算機上自動進行,那我們的人事管理就可以達到極高的水平。此外,在財務管理、倉庫管理、生產管理中也需要建立眾多的這種"資料庫",使其可以利用計算機實現財務、倉庫、生產的自動化管理。
J.Martin給資料庫下了一個比較完整的定義:資料庫是存儲在一起的相關數據的集合,這些數據是結構化的,無有害的或不必要的冗餘,並為多種應用服務;數據的存儲獨立於使用它的程序;對資料庫插入新數據,修改和檢索原有數據均能按一種公用的和可控制的方式進行。當某個系統中存在結構上完全分開的若干個資料庫時,則該系統包含一個"資料庫集合"。
? 資料庫的優點
使用資料庫可以帶來許多好處:如減少了數據的冗餘度,從而大大地節省了數據的存儲空間;實現數據資源的充分共享等等。此外,資料庫技術還為用戶提供了非常簡便的使用手段使用戶易於編寫有關資料庫應用程序。特別是近年來推出的微型計算機關系資料庫者握管理系統dBASELL,操作直觀,使用靈活,編程方便,環境適應廣泛(一般的十六位機,如IBM/PC/XT,國產長城0520等均可運行種軟體),數據處理能力極強。資料庫在我國正得到愈來愈廣泛的應用,必將成為經濟管理的有力工具。
資料庫是通過資料庫管理系統(DBMS-DATA BASE MANAGEMENT SYSTEM)軟體來實現數據的存儲、管理與使用的dBASELL就是一種資料庫管理系統軟體。
? 資料庫結構與資料庫種類
資料庫通常分為層次式資料庫、網路式資料庫和關系式資料庫三種。而不同的資料庫是按不同的數據結構來聯系和組織的。
1.數據結構模型
(1)數據結構
所謂數據結構是指數據的組織形式或數據之間的聯系。如果用D表示數據,用R表示數據對象之間存在的關系集合,則將DS=(D,R)稱為數據結構。例如,設有一個電話號碼簿,它記錄了n個人的名字和相應的電話號碼。為了方便地查找某人的電話號碼,將人名和號碼按字典順序排列,並在名字的後面跟隨著對應的電話號碼。這樣,若要查找某人的電話號碼(假定他的名字的第一個字母是Y),那麼只須查找以Y開頭的那些名字就可以了。該例中,數據的集合D就是人名和電話號碼,它們之間的聯系R就是按字典順序的排列,其相應的數據結構就是DS=(D,R),即一個數組。
(2)數據結構種類
數據結構又分為數據的邏輯結構和數據的物理結構。數據的邏輯結構是從邏輯的角度(即數據間的聯系和組織方式)來觀察數據,分析數據,與數據的存儲位置無關。數據的物理結構是指數據在計算機中存放的結構,即數據的邏輯結構在計算機中的實現形式,所以物理結構也被稱稿仔為存儲結構。本節只研究數據的邏輯結構,並將反映和實現數據聯系的方法稱為數據模型。
目前,比較流行的數據模型有三種,即按圖論理論建立的層次結構模型和網狀結構模型以及按關系理論建立的關系結構模型。
2.層次、網狀和關系資料庫系統
(1)層次結構模型
層次結構模型實質上是一種有根結點的定向有序樹(在數學中"樹"被定義為一個無回的連通圖)。例如圖20.6.4是一個高等學校的組織結構圖。這個組織結構圖像一棵樹,校部就是樹根(稱為根結點),各系、專業、教師、學生等為枝點(稱為結點),樹根與枝點之間的聯系稱為邊,樹根與邊之比為1:N,即樹根只有一個,樹枝有N個。這種數據結構模型的一般結構見圖20.6.5所示。
圖20.6.4 高等學校的組織結構圖 圖20.6.5 層次結構模型
圖20.6.5中,Ri(i=1,2,…6)代表記錄(即數據的集合),其中R1就是根結點(如果Ri看成是一個家族,則R1就是祖先,它是R2、R3、R4的雙親,而R2、R3、R4互為兄弟),R5、R6也是兄弟,且其雙親為R3。R2、R4、R5、R6又被稱為葉結點(即無子女的結點)。這樣,Ri(i=1,2,…6)就組成了以R1為樹根的一棵樹,這就是一個層次數據結構模型。
按照層次模型建立的資料庫系統稱為層次模型資料庫系統。IMS(Information Manage-mentSystem)是其典型代表。
(2)網狀結構模型?
在圖20.6.6中,給出了某醫院醫生、病房和病人之間的聯系。即每個醫生負責治療三個病人,每個病房可住一到四個病人。如果將醫生看成是一個數據集合,病人和病房分別是另外兩個數據集合,那麼醫生、病人和病房的比例關系就是M:N:P(即M個醫生,N個病人,P間病房)。這種數據結構就是網狀數據結構,它的一般結構模型如圖20.6.7所示。在圖中,記錄Ri(i=1,2,8)滿足以下條件:
①可以有一個以上的結點無雙親(如R1、R2、R3)。
②至少有一個結點有多於一個以上的雙親。在"醫生、病人、病房"例中,"醫生集合有若干個結點(M個醫生結點)無"雙親",而"病房"集合有P個結點(即病房),並有一個以上的"雙親"(即病人)。
圖20.6.6 醫生、病房和病人之間的關系
圖20.6.7 網狀結構模型
按照網狀數據結構建立的資料庫系統稱為網狀資料庫系統,其典型代表是DBTG(Data Base Task Group)。用數學方法可將網狀數據結構轉化為層次數據結構。
(3)關系結構模型
關系式數據結構把一些復雜的數據結構歸結為簡單的二元關系(即二維表格形式)。例如某單位的職工關系就是一個二元關系(見表20.6.8)。這個四行六列的表格的每一列稱為一個欄位(即屬性),欄位名相當於標題欄中的標題(屬性名稱);表的每一行是包含了六個屬性(工號、姓名、年齡、性別、職務、工資)的一個六元組,即一個人的記錄。這個表格清晰地反映出該單位職工的基本情況。
表20.6.8 職工基本情況
通常一個m行、n列的二維表格的結構如表20.6.9所示。
表中每一行表示一個記錄值,每一列表示一個屬性(即欄位或數據項)。該表一共有m個記錄。每個記錄包含n個屬性。
作為一個關系的二維表,必須滿足以下條件:
(1)表中每一列必須是基本數據項(即不可再分解)。
(2)表中每一列必須具有相同的數據類型(例如字元型或數值型)。
(3)表中每一列的名字必須是唯一的。
(4)表中不應有內容完全相同的行。
(5)行的順序與列的順序不影響表格中所表示的信息的含義。
由關系數據結構組成的資料庫系統被稱為關系資料庫系統。
在關系資料庫中,對數據的操作幾乎全部建立在一個或多個關系表格上,通過對這些關系表格的分類、合並、連接或選取等運算來實現數據的管理。dBASEII就是這類資料庫管理系統的典型代表。對於一個實際的應用問題(如人事管理問題),有時需要多個關系才能實現。用dBASEII建立起來的一個關系稱為一個資料庫(或稱資料庫文件),而把對應多個關系建立起來的多個資料庫稱為資料庫系統。dBASEII的另一個重要功能是通過建立命令文件來實現對資料庫的使用和管理,對於一個資料庫系統相應的命令序列文件,稱為該資料庫的應用系統。因此,可以概括地說,一個關系稱為一個資料庫,若干個資料庫可以構成一個資料庫系統。資料庫系統可以派生出各種不同類型的輔助文件和建立它的應用系統。
? 資料庫的要求與特性
為了使各種類型的資料庫系統能夠充分發揮它們的優越性,必須對資料庫管理系統的使用提出一些明確的要求。
1.建立資料庫文件的要求
(1)盡量減少數據的重復,使數據具有最小的冗餘度。計算機早期應用中的文件管理系統,由於數據文件是用戶各自建立的,幾個用戶即使有許多相同的數據也得放在各自的文件中,因而造成存儲的數據大量重復,浪費存儲空間。資料庫技術正是為了克服這一缺點而出現的,所以在組織數據的存儲時應避免出現冗餘。
(2)提高數據的利用率,使眾多用戶都能共享數據資源。
(3)注意保持數據的完整性。這對某些需要歷史數據來進行預測、決策的部門(如統計局、銀行等)特別重要。
(4)注意同一數據描述方法的一致性,使數據操作不致發生混亂。如一個人的學歷在人事檔案中是大學畢業,而在科技檔案中卻是大學程度,這樣就容易造成混亂。
(5)對於某些需要保密的數據,必須增設保密措施。
(6)數據的查找率高,根據需要數據應能被及時維護。
2.資料庫文件的特徵
無論使用哪一種資料庫管理系統,由它們所建立的資料庫文件都可以看成是具有相同性質的記錄的集合,因而這些資料庫文件都有相同的特性:
(1)文件的記錄格式相同,長度相等。
(2)不同的行是不同的記錄,因而具有不同的內容。
(3)不同的列表示不同的欄位名,同一列中的數據的性質(屬性)相同。
(4)每一行各列的內容是不能分割的,但行的順序和列的順序不影響文件內容的表達。
3.文件的分類
對文件引用最多的是主文件和事物文件。其他的文件分類還包括表文件、備份文件、檔案的輸出文件等。下面將講述這些文件。
(1)主文件。主文件是某特定應用領域的永久性的數據資源。主文件包含那些被定期存取以提供信息和經常更新以反映最新狀態的記錄。典型的主文件有庫存文件、職工主文件和收帳主文件等。
(2)事務文件。事務文件包含著作為一個信息系統的數據活動(事務)的那些記錄。這些事務被分批以構成事務文件。例如,從每周工資卡上錄制下來的數分批存放在一個事務文件上,然後對照工資清單文件進行處理以便列印出工資支票和工資記錄簿。
(3)表文件。表文件是一些表格。之所以單獨建立表文件而不把表設計在程序中是為了便於修改。例如,一個公用事業公司的稅率表或國內稅務局的稅率就可以存儲在表中文件。
(4)備用文件。備用文件是現有生產性文件的一個復製品。一旦生產性文件受到破壞,利用備用文件就可以重新建立生產性文件。
(5)檔案文件。檔案文件不是提供當前處理使用的,而是保存起來作為歷史參照的。例如,國內稅務局(IRS)可能要求檢查某個人最近15年的歷史。實際上,檔案文件恰恰是在給定時間內工作的一個"快照"。
(6)輸出文件。輸出文件包含將要列印在列印機上的、顯在屏幕上的或者繪制在繪圖儀上的那些信息的數值映象。輸出文件可以是"假離線的"(存儲在輔存設備上),當輸出設備可
用時才進行實際的輸出。
3. PACS系統的架構數據
PACS有別於HIS、LIS等其它醫學信息系統的最重要一點就是:海量數據存儲。合理設計PACS的數據存儲結構,是成功建設PACS的關鍵。一個大型的醫院擁有大批現代化的大型醫療影像設備,每天影像檢查產生的數據量多達4個GB左右(未壓縮的原始數據),一年數據總量大約1200GB。而隨著醫院的業務飛速發展和新的影像設備的引進,這一數據量還可能進一步增長。此外,如何提高在線數據隨機存取的效率也是一個非常關鍵的問題。
基於這一原因,現有的PACS醫療影像信息系統提供商多採用分級存儲(HSM)的策略,將PACS存儲分成在線存儲和離線存儲兩級結構。用兩種不同性能的存儲介質來分別完成高容量和高效率的要求,低速超大容量存儲設備(離線存儲伺服器)用作永久存儲;高速存儲設備(SAN)用作在線數據存儲,確保在線數據的極高效存取。對於2年以上的歷史數據保存在離線存儲設備里,在線存儲設備僅保存最近三年的數據。 DICOM文件是指按照DICOM標准而存儲的醫學文件。
DICOM文件由多個數據集組成。數據集表現了現實世界信息對象的相關屬性,如病人姓名、性別、身高和體重等。數據集由數據元素組成,數據元素包含進行編 碼的信息對象屬性的值,並由數據元素標簽(Tag)唯一標識。數據元素具有三種結構,其中兩種具有類型表示VR(是否出現由傳輸語法決定),差別在於其長 度的表達方式,另外一種不包括類型表示。類型表示指明了該數據元素中的數據是哪種類型,它是一個長度為2的字元串,例如一個數據元素的VR為FL,表示該數據元素中存儲的數據類型為浮點型。所有數據元素都包含標簽、值長度和數據值體。
標簽是一個16位無符號整數對,按順序排列包括組號和元素號。數據集中的數據元素應按數據元素標簽號的遞增順序組織,且在一個數據集中最多出現一次。
值長度是一個16或32位(取決於顯式VR或隱式VR)無符號整數,表明了准確的數據值的長度,按位元組數目(為偶數)記錄。此長度不包含數據元素標簽、VR、值長度欄位。
數據值體表明了數據元素的值,其長度為偶數位元組,該欄位的數據類型是由數據元素的VR所明確定義。數據元素欄位由三個公共欄位和一個可選欄位組成。 以現廣東市場上的主流SUPER PACS系統為例。
目前SUPER PACS系統資料庫共有36個表,按用途分為:公用表、數字膠片室專用表、放射專用表、超聲專用表、遠程專用表。其中起到關鍵性作用的是Patient、Study、Series、Image四個主表。
Patient表用於存放病人的基本信息,應用范圍涉及到SUPER PACS的所有子系統;Study表用於存放病人的檢查信息,應用范圍涉及到SUPER PACS的所有子系統;Series表用於圖象序列表的生成,應用范圍涉及到SUPERPACSR DICOM放射系統;Image表用於保存系統圖象記錄。
資料庫表間關系如右: