




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、V S6B823南開大學碩士研究生畢業(yè)學位論文Linux環(huán)境下基于網(wǎng)絡存儲技術的 操作系統(tǒng)遠程備份恢復研究姓 名:肖飛研究方向:智能自動化與網(wǎng)絡通信 專 業(yè):控制理論與控制工程 導 師:陳增強教授南開大學信息技術科學學院自動化系二零零六年五月網(wǎng)絡存儲技術的飛速發(fā)展,為各種應用提供了廉價安全的網(wǎng)絡存儲空間。操 作系統(tǒng)作為管理服務器信息和終端系統(tǒng)信息的必備單元,其中也包含有大量重要 的配置及日志信息。利用網(wǎng)絡存儲技術建立操作系統(tǒng)的遠程備份恢復方案不僅有 利于服務器系統(tǒng)的災后重建,也可以減少終端操作系統(tǒng)損壞帶來的損失。Linux是當前應用最廣泛的類UNIX操作系統(tǒng),它具有高效、穩(wěn)定的優(yōu)點, 并且對硬
2、件支持較好,非常適合服務器領域的應用。而JFS、XFS等大型日志文 件系統(tǒng)是服務器系統(tǒng)安裝時的首選文件系統(tǒng)。在這個背景下,本文以Linux平臺 及開源代碼資源為基礎,研究文件系統(tǒng)備份恢復技術,并利用成熟的網(wǎng)絡存儲技 術構(gòu)建了這兩種模式的操作系統(tǒng)遠程備份恢復方案,其中:實現(xiàn)了一個基于Linux操作系統(tǒng),具有跨域工作能力的NAS服務器。 對Unh iSCSI Target端驅(qū)動程序與LVM聯(lián)合使用時產(chǎn)生的錯誤進行處理,并完善了相關功能。 開發(fā)了 JFS/XFS文件系統(tǒng)備份和恢復軟件。 處理了非正常狀態(tài)的JFS/XFS文件系統(tǒng)的備份和恢復。 本論文首先將介紹有關網(wǎng)絡存儲、文件系統(tǒng)的背景知識;然后詳細
3、介紹了各 種網(wǎng)絡存儲技術;最后,將NAS技術、iSCSI技術及文件系統(tǒng)備份和恢復技術綜 合起來搭建了操作系統(tǒng)遠程備份恢復平臺。 本文的創(chuàng)新性在于:提出了一個基于Linux系統(tǒng)的,可工作在Windows和NIS混合域中的NAS 服務器,能完成各種域用戶的安全認證,并且支持即插即用的功能,為操作系統(tǒng) 備份鏡像的局域網(wǎng)存儲提供了良好的網(wǎng)絡環(huán)境。將UNH的iSCSItarget與LVM管理工具結(jié)合起來,改正了該程序在對外 提供LVM邏輯卷時出現(xiàn)的各種錯誤,為操作系統(tǒng)的遠程運行時備份提供良好的數(shù) 據(jù)傳輸服務。通過移植Linux內(nèi)核中JFS/XFS的支持代碼,實現(xiàn)一套不依賴于操作系 統(tǒng)文件系統(tǒng)支持的,文件
4、系統(tǒng)備份恢復軟件。通過進一步研究操作系統(tǒng)備份恢復中可能遇到的文件系統(tǒng)不一致現(xiàn)象, 綜合分析文件系統(tǒng)日志功能,建立了在文件系統(tǒng)不一致的情況下完成文件系統(tǒng)正 確備份的方案。關鍵詞:Linux操作系統(tǒng)網(wǎng)絡存儲技術iSCSI文件系統(tǒng)備份恢復JFS文件系統(tǒng)XFS 文件系統(tǒng)AbstractThe rapid growth of network storage technologies, gives all kinds of application a safe and inexpensive storage space. The Operation System (OS) which manages th
5、e system information of the server and the terminal has a lot of configuration and log information. Using the network storage technologies implement a platform to backup and restore the Operation System remotely, which not only can help the rebuilding of the server system, but also can reduce the lo
6、st of cause by the damage of the terminal system.As a UNIX-like operating system, Linux operating system works with high efficiency and outstanding stability, and supports most popular hardware, so it has been used widely, especially on network server area. JFS, XFS etc. are the most popular file sy
7、stem used by servers. This thesis research the file system backup and restore by using the Linux open source code, and two model of Operation System remote backup and restore are designed, by using the network storage technologies:Developed a NAS server using the Linux OS, which can work in a mixed
8、domain.Deal with the bugs appeared in UNH iSCSI drivers when it works with LVM, and improved some correlated functions.Developed the JFS/XFS backup and restore system.Solve the backup and restore problem of JFS/XFS when they are in a incoherent mode.After the brief background introduction of network
9、 storage and file system, this thesis elaborates all kinds of network storage technology. At last, with the NAS, iSCSI and file system backup and restore technology, a platform is build witch can implement the remote backup restore of the Operation System. The new idea of this thesis:(1) Design and
10、implement a NAS server based on Linux operating system. This NAS server can work properly under mixed domains, and also support plug and play features. It can well store the images that build by the backup and restore system.Use the UNH iSCSI target with the LVM tools, and correct the bugs that appe
11、ared when share the LVM logical volume with in target. This can help the remotely backup and restore system send the data through the network.With the porting of Linux kernel code that implement the JFS/XFS, design a file system backup and restore software, which can work without the support of the
12、Operation Systerm.After research the incoherent mode of the JFS/XFS that will occur in the backup and restore process, and the journal of the file system, design a plan that can help the system backup and restore that kind of file system correctly.Key Words: Linux Operation System Network Storage Te
13、chnology Internet SCSl(iSCSl) File System Backup Restore JFS XFS第一章緒論第一章緒論隨著計算機信息技術的飛速發(fā)展,人們對計算機的依賴也越來越大。不僅需 要利用計算機的運算功能完成復雜的計算任務,更多的是利用計算機存儲和管理 各種各樣數(shù)字化了的信息。本地存儲資源,在大量關鍵數(shù)據(jù)的存儲方面,無法全面滿足用戶在存儲量和存儲的安全性上的需求。網(wǎng)絡存儲技術11應運而生,專業(yè)化的異地存儲模式在提供大存儲空間的同時,也保障了數(shù)據(jù)的安全性。操作系統(tǒng)在使用過程中保存了大量的軟件安裝配置信息和軟件使用的記錄 及曰志信息,這些信息對于存儲業(yè)務數(shù)據(jù)的用戶
14、而言當然并不重要,他們關心的 是介質(zhì)中存儲的關鍵性業(yè)務信息,然而對于系統(tǒng)的使用和維護人員,這些信息則 相當重要,在沒有備份信息的情況下,一個應用服務器的恢復工作也許會花上好 幾個維護人員幾天的時間。即使是終端操作系統(tǒng)的重建也會花費使用人員一到兩 個工作日的時間。由于實現(xiàn)自動從操作系統(tǒng)中提取關鍵信息并進行備份相當困難,而手工提取 這些信息耗費工作量太大,因此實現(xiàn)簡單的備份操作系統(tǒng)全部信息,在存儲價格 曰益低廉的今天也是一個不錯的解決方案。這樣雖然會花費大量空間備份多余信 息,但是相對于復雜的系統(tǒng)重建工作,這樣的代價是值得的。網(wǎng)絡存儲技術的飛速發(fā)展為實現(xiàn)快速、安全、可靠的遠程備份恢復系統(tǒng)提供 了各
15、種可行技術。本文從網(wǎng)絡存儲技術出發(fā),結(jié)合文件系統(tǒng)數(shù)據(jù)備份恢復方案的研究21及實現(xiàn),設計了操作系統(tǒng)遠程備份恢復方案。一方面實現(xiàn)基于Linux操作系統(tǒng)的大型服務器的操作系統(tǒng)異地遠程備份恢復,為服務器的災后重建提供方 便,節(jié)省服務器重建的時間及勞動量,減少災難帶來的經(jīng)濟損失;另一方面實現(xiàn) 終端PC機Linux操作系統(tǒng)的網(wǎng)絡備份恢復,為局域網(wǎng)用戶提供方便快捷的操作 系統(tǒng)備份恢復方案,減少工作中由于錯誤操作、病毒等帶來的經(jīng)濟損失。第一節(jié)操作系統(tǒng)備份恢復操作系統(tǒng)(Operating System,簡稱OS)是指負責對計算機硬件直接控制及管理的系統(tǒng)軟件。操作系統(tǒng)的功能一般包括處理器管理、存儲管理、文件管理、
16、 設備管理和作業(yè)管理等。當多個程序同時運行時,操作系統(tǒng)負責規(guī)劃進程以優(yōu)化 每個程序的處理時間。小型嵌入式操作系統(tǒng),存儲ROM或Flash中,對于PC或大型服務器,操作系統(tǒng)都存儲在硬盤或硬盤陣列上。不論使用何種存儲介質(zhì), 操作系統(tǒng)的存儲都必須用到某種文件系統(tǒng),實現(xiàn)操作系統(tǒng)文件的管理。我們開發(fā)的不依賴于操作系統(tǒng)文件系統(tǒng)支持的數(shù)據(jù)備份和恢復軟件,是實現(xiàn) 操作系統(tǒng)遠程備份恢復的基本技術。該軟件在完成文件系統(tǒng)備份恢復的同時實現(xiàn) 了操作系統(tǒng)內(nèi)核鏡像文件物理位置讀取,保證了在恢復后的存儲介質(zhì)上操作系統(tǒng) 能正常啟動,對于日志信息的處理,在保證文件系統(tǒng)完整性的同時,不丟失操作 系統(tǒng)運行相關的任何有用數(shù)據(jù)。以此備
17、份恢復技術為基礎,配合邏輯卷管理器(Logic Volume Manager,LVM)13的快照功能就實現(xiàn)了操作系統(tǒng)的運行時備份而不必擔心數(shù)據(jù)備份期間操作系統(tǒng)運行帶來的數(shù)據(jù)更新。為實現(xiàn)操作系統(tǒng)的遠程備份與恢復,必須利用某種成熟的網(wǎng)絡存儲技術,實 現(xiàn)備份恢復信息的遠程傳輸。由于操作系統(tǒng)備份和恢復需要直接讀寫存儲介質(zhì),iSCSI技術14以其獨特性質(zhì)成為實現(xiàn)操作系統(tǒng)遠程備份恢復的首選網(wǎng)絡存儲技第二節(jié)網(wǎng)絡存儲技術網(wǎng)絡存儲技術利用傳統(tǒng)的存儲設備和網(wǎng)絡設備實現(xiàn)網(wǎng)絡存儲功能,構(gòu)造出能 夠直接被網(wǎng)絡訪問的網(wǎng)絡存儲設備。在這種新型的存儲結(jié)構(gòu)中,存儲系統(tǒng)不再通 過I/O總線附屬于某個特定的服務器或客戶機,而是通過
18、網(wǎng)絡接口與網(wǎng)絡相連,由用戶通過網(wǎng)絡訪問。目前常見的網(wǎng)絡存儲技術主要有NAS,3鄉(xiāng)|5】和18081。 NASNAS(Network Attached Storage,網(wǎng)絡附加存儲),是一種將分布、獨立的數(shù)據(jù) 整合為大型、集中化管理的數(shù)據(jù)中心,以便于不同主機和應用服務器進行訪問的 技術。NAS是一種特殊的專用數(shù)據(jù)存儲服務器,包括存儲器件(例如磁盤陣列、 CD/DVD驅(qū)動器、磁帶驅(qū)動器或可移動的存儲介質(zhì))和內(nèi)嵌系統(tǒng)軟件,可提供跨 平臺文件共享功能。NAS通常在一個LAN上占有自己的節(jié)點,無需應用服務器的千預,允許用 戶在網(wǎng)絡上存取數(shù)據(jù),在這種配置中,NAS集中管理和處理網(wǎng)絡上的所有數(shù)據(jù), 將負載從
19、應用或企業(yè)服務器上卸載下來,有效降低總成本,保護用戶投資。 NAS本身能夠支持多種協(xié)議(如NFS、CIFS、SAMBA, FTP、 等), 而且能夠支持各種操作系統(tǒng)。通過任何一臺工作站,采用E或Netscape 瀏覽器就可以對NAS設備進行直觀方便的管理。NAS是真正即插即用 的產(chǎn)品,并且物理位置靈活,可放置在工作組內(nèi),也可放在混合環(huán)境中,如混合了 UNIX/Windows NT局域網(wǎng)的環(huán)境中,而無需對網(wǎng)絡環(huán)境進行 任何的修改- NAS產(chǎn)品直接通過網(wǎng)絡接口連接到網(wǎng)絡上,只需簡單地配 置一下IP地進,就可以被網(wǎng)絡上的用戶所共享。SANSAN(Storage Area Network,存儲區(qū)域網(wǎng))
20、是一種將磁盤陣列、磁帶等存儲設備與服務器連接起來的髙速專用子網(wǎng)。SAN以FC( Fiber Channel,光纖通道)為硬件基礎,結(jié)合了 FC和LAN的優(yōu)點,繞過了傳統(tǒng)網(wǎng)絡的瓶頸,使數(shù)據(jù)的遷 移性更好。典型的SAN通常由存儲設備(包括磁盤、磁盤陣列、磁帶和磁帶庫)、 服務器、連接設備(包括銅纜、光纖、網(wǎng)橋、集線器、交換機和接口適配器等)、 存儲管理應用軟件(涉及數(shù)據(jù)共享、網(wǎng)絡結(jié)構(gòu)、數(shù)據(jù)保護和數(shù)據(jù)備份、數(shù)據(jù)交換、 群集、數(shù)據(jù)保護和災難恢復等)。與傳統(tǒng)服務器與磁盤陣列之間的主/從關系不同, FC-SAN上的所有設備均處于平等的地位,多臺服務器以及多個存儲器可以配置 在同一個SAN上,實現(xiàn)了在不同的
21、硬件和操作平臺之間異構(gòu)存儲設備和數(shù)據(jù)的 整合。iSCSIiSCSI即Internet SCSI,是一種基于IP網(wǎng)絡的數(shù)據(jù)塊級的數(shù)據(jù)傳送協(xié)議,它 能夠通過IP網(wǎng)絡傳輸包含SCSI命令和SCSI數(shù)據(jù)包的數(shù)據(jù)塊,從而實現(xiàn)存儲 設備的遠程訪問?;趇SCSI協(xié)議的SAN結(jié)合了 NAS和傳統(tǒng)光纖SAN的優(yōu)點,利用了現(xiàn)有 的IP網(wǎng)絡實現(xiàn)塊級存儲。改變了 NAS設備中操作系統(tǒng)(包括文件系統(tǒng)和存儲 子系統(tǒng)緊耦合的關系,將操作系統(tǒng)和存儲子系統(tǒng)分開,其文件系統(tǒng)功能部分單獨 構(gòu)成一個Server用以保存元數(shù)據(jù)。其存儲子系統(tǒng)采用外置式的SAN結(jié)構(gòu)由 多個智能存儲設備構(gòu)成一個存儲池,每個存儲設備有獨立的IP核,支持SC
22、SI 驅(qū)動。面向數(shù)據(jù)塊的訪問更靠近磁盤陣列和操作系統(tǒng)的底層,消除了對文件操作 的延遲,確保了系統(tǒng)的高性能,適合于對延遲敏感的應用程序和基于事務處理的 數(shù)據(jù)庫。第三節(jié)文件系統(tǒng)第-章緒論文件系統(tǒng)m是操作系統(tǒng)重要的組成部分,它是系統(tǒng)中的數(shù)據(jù)信息的管理和組 織形式。文件系統(tǒng)管理和組織保存在磁盤驅(qū)動器上的數(shù)據(jù),實現(xiàn)了數(shù)據(jù)完整性,即 保證寫入磁盤的數(shù)據(jù)和隨后讀出的內(nèi)容的一致性。除了保存以文件方式存儲的數(shù) 據(jù)以外,文件系統(tǒng)同樣存儲和管理關于文件和文件系統(tǒng)自身的一些重要信息。然而具體分析起來,文件系統(tǒng)的含義又比較模糊。首先,文件含義就有狹義 與廣義之分。狹義地說,文件是指磁盤文件,進而可以是有組織有次序地存儲
23、于 任何介質(zhì)(包括內(nèi)存)中的一組信息。廣義地講,Linux從開始時就把外部設備 都當成“文件”。從這個意義上講,凡是可以產(chǎn)生或消耗信息的都是文件。以在 網(wǎng)絡環(huán)境中中來收發(fā)報文的“套接口”機制來說,它就不代表存儲著的信息但 套接口的發(fā)送端“消耗”信息,而接收端則“產(chǎn)出”信息,所以把套接口看成文 件是合乎邏輯的。即使拋開文件定義的模糊性不說,文件系統(tǒng)又進一步有幾種不同的含義,要 根據(jù)上下文才能加以區(qū)分:指一種特定的文件格式。例如,我們說Linux的文件系統(tǒng)是Ext2, MSDOS的文件系統(tǒng)是FAT16,而WindowsNT的文件系統(tǒng)是NTFS或Fat32就 是指這個意思。指按特定格式進行了“格式化
24、”的塊存儲介質(zhì)。上我們說“安裝”或 “拆卸” 一個文件系統(tǒng)時指的就是這個意思。指操作系統(tǒng)中(通常在內(nèi)核中)用來管理文件系統(tǒng)以及對文件進行操 作的機制及其實現(xiàn)。文件系統(tǒng)實現(xiàn)數(shù)據(jù)的儲存、檢索和操作。為了實現(xiàn)這一目的文件系統(tǒng)需要 保持一個內(nèi)在的數(shù)據(jù)結(jié)構(gòu)使得數(shù)據(jù)的有組織存儲,并且便于訪問。這一內(nèi)部的數(shù) 據(jù)結(jié)構(gòu)被稱為元數(shù)據(jù)。就是這個元數(shù)據(jù)的結(jié)構(gòu)為文件系統(tǒng)提供了其特定的身份和 性能特征。通常,我們并不直接和文件系統(tǒng)的元數(shù)據(jù)打交道。而是一個特別的文件系統(tǒng) 驅(qū)動程序為我們作相應的工作。文件系統(tǒng)驅(qū)動程序是專門用來操作復雜的元數(shù)據(jù) 的。然而,為了使得文件系統(tǒng)驅(qū)動程序正常工作,有一個很重要的必要條件:它 需要在某種
25、合理的、一致的和沒有干擾的狀態(tài)下找到元數(shù)據(jù)。否則,文件系統(tǒng)驅(qū) 動程序就不能理解和操作元數(shù)據(jù),那么也就不能存取文件了。文件系統(tǒng)檢査程序?qū)崿F(xiàn)對元數(shù)據(jù)的掃描從而保證元數(shù)據(jù)的一致性。當操作系 統(tǒng)關閉時,它仔細地把所有的緩沖區(qū)數(shù)據(jù)轉(zhuǎn)送到磁盤,并確保文件系統(tǒng)被徹底卸 載,以保證系統(tǒng)再次啟動時能夠使用。然而,意外是無法避免的,操作系統(tǒng)可能 沒有時間徹底卸載文件系統(tǒng),這就導致元數(shù)據(jù)在某種情況下會陷入困境。第一章緒論 為了彌補這種情況,文件系統(tǒng)檢查程序?qū)⒃谙到y(tǒng)啟動時徹底的掃描并且全面 地檢查元數(shù)據(jù),修正這一過程中找到的任何錯誤。一旦文件系統(tǒng)檢查程序完成這 樣的工作,文件系統(tǒng)就可以使用了。盡管意想不到的電源故障或
26、者系統(tǒng)掛起可能 造成最近修改的數(shù)據(jù)丟失,但是由于元數(shù)據(jù)現(xiàn)在是一致的,文件系統(tǒng)就可以被裝 載和投入使用了。為確保文件系統(tǒng)的一致性,使用文件系統(tǒng)檢査程序全面掃描文件系統(tǒng)以維護 全部的元數(shù)據(jù),是一項極為費時的工作。通常至少要花上好幾分鐘才能完成。更 糟糕的是,文件系統(tǒng)越大,完成這個徹底的掃描所花費的時間就越長。更好的解 決方式是為文件系統(tǒng)添加日志。曰志文件系統(tǒng)通過增加一個叫做日志的新的數(shù)據(jù)結(jié)構(gòu)來解決系統(tǒng)檢查問題。 這個日志是位于磁盤上的結(jié)構(gòu)。在對元數(shù)據(jù)做任何改變以前,文件系統(tǒng)驅(qū)動程序 會向日志中寫入一個條目,這個條目描述了它將要做些什么。然后,繼續(xù)修改元 數(shù)據(jù)。通過這種方法,日志文件系統(tǒng)就擁有了近期
27、元數(shù)據(jù)被修改的歷史記錄,當 檢查到?jīng)]有徹底卸載的文件系統(tǒng)的一致性問題時,就可以使用這個記錄維護文件 系統(tǒng)的一致性了。JFS文件系統(tǒng)JFS8)由IBM公司開發(fā),最初出現(xiàn)在AIX操作系統(tǒng)之上,它是一種基于日志的字節(jié)級、面向事務的高性能文件系統(tǒng)。它具有可伸縮性和健壯性,與非日志 文件系統(tǒng)相比,它的優(yōu)點是其快速重啟能力:JFS能夠在幾秒或幾分鐘內(nèi)就把文 件系統(tǒng)恢復到一致狀態(tài)。JFS是完全64位的文件系統(tǒng)。所有JFS文件系統(tǒng)結(jié) 構(gòu)化字段都是64位大小。這允許JFS同時支持大文件和大分區(qū)。2000年2月,IBM宣布在一個開放資源許可證下,移植Linux版的JFS文件 系統(tǒng)。JFS也是一個有大量用戶安裝使用
28、的企業(yè)級文件系統(tǒng)。使用日志文件系統(tǒng),性能上會稍有損失,因為維護一個日志,系統(tǒng)需要寫許 多數(shù)據(jù)。JFS通過把同步日志轉(zhuǎn)為異步日志從而減少了性能的損耗。使用同步日 志,系統(tǒng)直接進行與文件系統(tǒng)的動作成比例的日志記錄操作;而異步日志,日志 記錄較少,在不影響其它文件系統(tǒng)操作時進行記錄,從而減少了日志開銷。XFS文件系統(tǒng)XFS8文件系統(tǒng)是SGI開發(fā)的高級日志文件系統(tǒng),XFS極具伸縮性,非常健 壯。所幸的是SGI將其移植到了 Linux系統(tǒng)中,它以開放資源形式發(fā)布了他們自 己擁有的XFS的源代碼,并實現(xiàn)了向Linux的移植。作為一個64位文件系統(tǒng), XFS可以支持超大數(shù)量的文件(9gxlgb,甚至更大的1
29、8gxlgb),可在大型2d和 3d數(shù)據(jù)方面提供顯著的性能。XFS主要特性包括以下幾點: 第一章緒論數(shù)據(jù)完全性采用XFS文件系統(tǒng),當意想不到的當機事件發(fā)生后,首先,由 于文件系統(tǒng)開啟了日志功能,所以你磁盤上的文件不再會意外當機而遭到破壞。 不論目前文件系統(tǒng)上存儲的文件與數(shù)據(jù)有多少,文件系統(tǒng)都可以根據(jù)所記錄的曰 志在很短的時間內(nèi)迅速恢復磁盤文件內(nèi)容。可擴展性XFS被設計成可擴展的,以面對大多數(shù)的存儲容量和I/O存儲需 求,可處理大型文件和包含巨大數(shù)量文件的大型目錄,滿足快速增長的磁盤需求。 XFS有能力動態(tài)地為文件分配索引空間,使系統(tǒng)形成髙效支持大數(shù)量文件的能 力。在它的支持下,用戶可使用lex
30、abyte (lgxlgb)大的文件,遠遠大于現(xiàn)在 最大的文件系統(tǒng)。優(yōu)秀的I/O性能典型的現(xiàn)代服務器使用大型的條帶式磁盤陣列,以提供達 數(shù)gb/秒的總帶寬。XFS可以很好地滿足I/O請求的大小和并發(fā)I/O請求的數(shù)量。第四節(jié)Linux LVM技術簡介Linux LVM是一個更高的層次存儲介質(zhì)管理工具,在LVM的使用中,將涉 及以下相關概念:物理卷物理卷是指硬盤分區(qū)或者從邏輯上看起來和硬盤分區(qū)類似的設備(比 如RAID設備)。邏輯卷一個或者多個物理卷組成一個邏輯卷。對于LVM而言邏輯卷類似 于非LVM系統(tǒng)中的硬盤分區(qū)。邏輯卷可以包含一個文件系統(tǒng)(比如/home或者 /usr)o卷組一個或者多個邏輯
31、卷組成一個卷組。對于LVM而言,卷組類似于非 LVM系統(tǒng)中的物理硬盤。卷組把多個邏輯卷組合在一起,形成一個可管理的單LVM的具體工作原理是,將每一個物理卷分成幾個基本單元,即所謂的 PE(Pliysical Extents)。PE的大小是可變的,但是必須和其所屬卷組的物理卷相同。 PE是一個物理存儲里可以被LVM尋址的最小單元。每一個邏輯卷也被分成一些可被尋址的基本單位,即所謂的LE(Logical Extents在同一個卷組中,LE的大小和PE是相同的,LE的大小對于一個卷組 中的所有邏輯卷來說都是相同的。在一個物理卷中,每一個PE都有一個惟一的編號,但是對于邏輯卷這并不 一定是必需的。這是
32、因為當這些PE ID號不能使用時,邏輯卷可以由一些物理卷 組成。因此,LE ID號是用于識別LE以及與之相關的特定PE的。正如前面所 提到的,LE和PE之間是一一對應的。每一次存儲區(qū)域被尋址訪問或者LE的ID 被使用,都會把數(shù)據(jù)寫在物理存儲設備之上。類似的在非LVM系統(tǒng)中,有關分區(qū)的數(shù)據(jù)是存儲在分區(qū)表中,而分區(qū)表被 存儲在了每一個物理卷的起始位置,有關邏輯卷和邏輯卷組的所有元數(shù)據(jù)都存到 在VGDA(卷組描述符區(qū)域)中,其功能就好象是LVM的分區(qū)表,它存儲在每一 個物理卷的起始處。第五節(jié)本文的結(jié)構(gòu)安排本文第一章為引言,介紹了數(shù)據(jù)容災、網(wǎng)絡存儲、文件系統(tǒng)、及LVM相關 的的基本概念。第二章主要涉及
33、網(wǎng)絡存儲技術,詳細介紹了他們的特點、原理以及應用。 第三章詳細介紹了 JFS和XFS文件系統(tǒng)的技術細節(jié)。 第四章講述如何實現(xiàn)操作系統(tǒng)的遠程備份恢復。第五章給出了搭建iSCSI服務器的方法和實現(xiàn)過程,從而實現(xiàn)操作系統(tǒng)遠程 備份恢復的鏡像數(shù)據(jù)傳輸。第六章給出了搭建跨域工作NAS服務器的方法和實現(xiàn)過程,為終端操作系 統(tǒng)備份鏡像數(shù)據(jù)提供網(wǎng)絡存儲空間。第七章給出了 JFS/XFS文件系統(tǒng)的備份恢復的設計與實現(xiàn)。 第八章給出了非正常態(tài)JFS/XFS文件系統(tǒng)備份恢復的策略及實現(xiàn)。 第九章總結(jié)了系統(tǒng)設計的思路及部分模塊設計心得。第二章網(wǎng)絡存儲技術 第二章網(wǎng)絡存儲技術網(wǎng)絡存儲沿著兩條主要技術的發(fā)展方向前進:SA
34、N和NAS。 本章首先從起源,技術及應用等方面介紹NAS;其后將會詳細講解SAN技 術,包括它的拓撲結(jié)構(gòu)、特點和應用。最后介紹iSCSI技術的基礎原理和iSCSI 協(xié)議及體系結(jié)構(gòu)。第一節(jié)NAS技術簡介NAS的起源隨著人們對存取其他機器上文件需求的產(chǎn)生,文件服務器概念應運而生。文 件服務器一般都要比桌面系統(tǒng)擁有更大的存儲容量,并具有其他一些功能,如磁 盤鏡像、雙電源、多個網(wǎng)絡接口卡。到后來,文件服務器逐漸進化到帶有RAID 存儲子系統(tǒng)和其他一些高可用特性的高性能系統(tǒng)。1985年,SUN公司發(fā)明了 NFS,用于UNIX桌面系統(tǒng)與UNIX服務器之間 的連接,以及在它們之間存取文件。同時,人們多次努力
35、在PC網(wǎng)絡世界中也實 現(xiàn)同樣的功能。IBM、3COM、微軟和其他一些廠商開發(fā)出了網(wǎng)絡操作系統(tǒng)設備。 在這些業(yè)界巨人的競爭中,Novell公司憑借其設備NetWare,成功推進了 PC領 域內(nèi)網(wǎng)絡服務的概念。很長一段時間里,Novell NetWare成為最主要的網(wǎng)絡操作 系統(tǒng)(NOS),在主要包含PC的網(wǎng)絡市場中非常流行。NOS解決方案需要消耗大量的管理資源,而且它的集成和安裝工作相當復 雜,安裝和管理上更加方便的NAS系統(tǒng),在這種需求驅(qū)動下悄然出現(xiàn)。NAS的特點大多數(shù)NAS都具有三個基本的特點: (1)特殊的操作系統(tǒng)NAS最顯著的特點之一是采用可提供存儲功能的特殊操作系統(tǒng)或應用系統(tǒng)。 這些特
36、殊的操作系統(tǒng)去掉了一些與文件服務無關的功能,而將主要功能集中在文 件管理與操作。優(yōu)化后的操作系統(tǒng)使內(nèi)核更好地支持對存儲器的讀寫,更充分地 利用諸如內(nèi)存、CPU、總線周期和網(wǎng)絡帶寬等硬件資源,具有較大的數(shù)據(jù)吞吐量; 圖2.1顯示了專用操作系統(tǒng)和通用操作系統(tǒng)的區(qū)別。不過,NAS設備并不一定要 建立在這種特殊的操作系統(tǒng)之上。第二章網(wǎng)絡存儲技術(2)即插即用的網(wǎng)絡集成NAS的另一個特性是可以快速地安裝到一個網(wǎng)絡上,而無需客戶系統(tǒng)進行太 多的配置工作。一般的想法是在移動設備時,無需在客戶系統(tǒng)上安裝和配置新的 軟件,也可以使用該設備。例如,對于Windows客戶系統(tǒng)來說,通過使用Windows 系統(tǒng)的網(wǎng)絡
37、鄰居功能,可以定位和使用移動后的專用設備,就好像使用本地設備 一樣。(3)NAS裝置的可伸縮性NAS裝置的一個主要特性是在幾乎不影響客戶系統(tǒng)的情況下,插入到網(wǎng)絡 中。由于具備這種特性,因此NAS裝置的功能易于擴展或伸縮。當設備增加容 量時,客戶可以立即使用所增加的容量,這種特性為客戶實現(xiàn)了無縫的存儲伸縮 性。雖然不同設備的存儲容量不能合并成單個存儲池或使用單一的邏輯視圖,但 至少可以在不中止現(xiàn)有的操作下添加額外的存儲容量。(4客戶端的靈活性采用NAS的另一個優(yōu)點是它能適用于多種平臺。因為NAS裝置具有自己的 操作系統(tǒng)和通信功能,所以只需通過標準的協(xié)議接口和網(wǎng)絡中其他的節(jié)點互聯(lián), 而無需弄清各個
38、客戶和服務器系統(tǒng)內(nèi)部的實現(xiàn)細節(jié)。NAS 般會支持Windows 系統(tǒng)和UNIX最常用的一些版本,以及蘋果公司的Macintosh系統(tǒng),但是MVS、 VAX. AS/400和OS/2系統(tǒng)通常不是NAS裝置幵發(fā)商的目標,它們更適宜于與 NOS產(chǎn)品集成。NAS技術的應用NAS的應用領域比較廣泛,這里主要介紹以下幾個方面: (1)大型企業(yè)級的存儲應用大型的NAS文件服務器能在高容量、高流量的環(huán)境下支持幾百個用戶,可 以滿足大型企業(yè)級對存儲的需求。這樣的系統(tǒng)通常都設有專門的硬件和軟件,以 支持大量的用戶和流量;通過采用RAID技術、特殊文件系統(tǒng)、協(xié)議處理和完備 的冗余硬件設計,能支持多達TB數(shù)量級的存儲
39、容量。NAS裝置也可以集成光纖 路徑SAN技術,以連接它們內(nèi)部的磁盤子系統(tǒng)。通過一個或多個網(wǎng)絡接口進行 以太網(wǎng)連接,NAS也可以支持FDDI、ATM和千兆以太網(wǎng),如圖2.1所示。第二章網(wǎng)絡存儲技術 圖2.1企業(yè)級應用部門級的存儲應用部門級或者中小企業(yè)的NAS存儲設備,是一種比大型企業(yè)級存儲設備規(guī)模 稍小的NAS產(chǎn)品。這些部門級的存儲設備,雖然沒有大型企業(yè)級NAS裝置那樣 的處理能力和容量,但是它們相對來說花費少,并且也具有相似的管理軟件和集 成能力。它們的存儲容量一般在50250GB范圍內(nèi),并通常釆用SCSI總線連接 的磁盤子系統(tǒng)。這類系統(tǒng)通常帶有1或2個10Mb或100Mb帶寬的以太網(wǎng)接口。
40、SoHo類文件存儲應用有一類NAS是體積非常小的SoHo類存儲服務器。這種服務器的容量通常在 10240GB范圍內(nèi),一般基于Linux或BSD UNIX系統(tǒng),采用Intel處理器?;?于成本問題的考慮,這種文件服務器通常使用1或2個的SCSI或IDE獨立磁盤, 它們可以做成鏡像使用,但通常不做成RAID。另外,這種產(chǎn)品一般只提供一個 10/100Mb的以太網(wǎng)接口。NAS數(shù)據(jù)庫類應用到目前為止,已經(jīng)有一些NAS服務器被嘗試能用來作為專門的數(shù)據(jù)庫服務 器,但并沒有取得人們預想的成功。盡管如此,人們還是期待NAS數(shù)據(jù)庫產(chǎn)品 能作為數(shù)據(jù)庫技術的接口,成功推向市場。正如文件服務NAS產(chǎn)品需要提供與 文件
41、訪問協(xié)議的集成,數(shù)據(jù)庫NAS產(chǎn)品也要求具備與數(shù)據(jù)庫訪問協(xié)議的集成能 力。Oracle和其他數(shù)據(jù)庫廠商已公開表明了他們的計劃,準備向這種NAS數(shù)據(jù) 庫設備提供相關的軟件甚至硬件支持。(6)備份類應用設計用來專門用于網(wǎng)絡備份的NAS產(chǎn)品,但到目前為止都還沒有取得很大 的成功。通常,這類產(chǎn)品設計用于備份網(wǎng)絡操作系統(tǒng)及其連接的客戶。不過,這 種網(wǎng)絡備份設備還不足以用來保護高容量的服務器,通常高容量的服務器還需要 通過直接相連的磁帶驅(qū)動器及時完成備份工作。也許,將來通過在一個設備上集 成NAS和SAN功能、支持以太網(wǎng)和I/O路徑連接后,服務器備份設備能取得更第二章網(wǎng)絡存儲技術多的成功。NAS文件服務器設
42、備,被認為是用于備份桌面工作站和便攜機的一 種方案。通常,桌面系統(tǒng)的備份對于許多機構(gòu)來說是一個難題,它并不容易通過 服務器備份產(chǎn)品來解決。主要的困難在于,當運行服務器備份進程時,工作站和 便攜機通常不能用于備份工作。另外,性能要求也是一個難點。采用NAS備份 桌面和便攜機系統(tǒng)的基本思想,是當用戶登錄網(wǎng)絡時,從用戶系統(tǒng)到NAS裝置 的磁盤信息同步。這種方法,類似于用來在桌面和便攜機系統(tǒng)之間同步數(shù)據(jù)的磁 盤同步產(chǎn)品。總之,NAS設備有很大的伸縮性,大到企業(yè)級應用,小到家庭應用都可以看 到NAS的身影。NAS本身所具有的靈活、簡單、性價比高的特性也使其在中小 型企業(yè)的應用中更加廣泛。第二節(jié)SAN技術
43、簡介SAN技術打破了傳統(tǒng)的存儲設備和計算機之間的聯(lián)系方式。它將存儲設備從 網(wǎng)絡分離出來,使它成為計算機網(wǎng)絡的對等體。換而言之,SAN技術將存儲設 備重新組合為網(wǎng)絡的組成部分,而不是將它們視為特定的集成系統(tǒng)中的一部分, 并根據(jù)數(shù)據(jù)存儲和訪問的要求對它們進行管理和規(guī)劃。SAN技術借用了許多現(xiàn) 有的網(wǎng)絡拓撲結(jié)構(gòu),并將其應用到數(shù)據(jù)存儲中。SAN的拓撲結(jié)構(gòu)點到點SAN最簡單的SAN連接2個節(jié)點,使用一種被稱為點到點的拓撲結(jié)構(gòu)。這和一 個通過交叉線纜建造的2節(jié)點以太網(wǎng)很相似。除了點對點的SAN不是連接兩個 系統(tǒng),而是一個系統(tǒng)和它的存儲器。圖4.1說明了一個簡單的點對點SAN,連接 距離最長能超過10000
44、米;其他的技術如SCSI和ATA也可以同樣將一個設備連 到總線上來實現(xiàn)點對點的拓撲結(jié)構(gòu),但連接距離要遠遠小于SAN。圖2.2點到點SAN第二章網(wǎng)絡存儲技術 交換式SAN:主機吵 圖2.4環(huán)狀SAN交換式SAN是釆用網(wǎng)絡交換機構(gòu)建的一種存儲網(wǎng)絡,這種網(wǎng)絡交換機類似 于數(shù)據(jù)網(wǎng)絡中所使用的交換機。交換式SAN在建立點對點通信方面,類似于點 對點網(wǎng)絡。不同之處在于,它所建立的點對點連接并不是永久性的,可同時并發(fā) 很多點對點的虛連接。圖2.3說明如何使用交換機建立SAN。asf-sse圖2.3交換式SAN環(huán)狀SAN環(huán)狀SAN提供了在一個邏 輯環(huán)狀網(wǎng)絡上對公用管道的共 享類似于令牌環(huán)和FDDI。在 一個環(huán)
45、狀SAN中使用的網(wǎng)絡設 備被稱為集線器,在有相同端口 數(shù)的情況下,它比交換機便宜許 多。環(huán)狀SAN也可以級聯(lián),但 它不是通過多層交換層級聯(lián),而 是通過增加環(huán)的邏輯圓周尺寸 來級聯(lián)環(huán)。圖2.4是一個環(huán)狀 SAN。SAN的特點SAN技術有如下的特點。 容量易擴展SAN沒有提高單個磁盤驅(qū)動器的容量。它們也沒有增加主機系統(tǒng)中支持的主 機I/O控制器的數(shù)量。然而,它們能顯著地提髙連接到每個主機I/O控制器的設備數(shù)。它們還提供了通過將網(wǎng)絡交換機和集線器級聯(lián)來擴展容量的方法。能被連 接到一個SAN上的設備數(shù)目取決于所使用的技術。以光纖路徑的使用為例,光 纖路徑環(huán)網(wǎng)能支持多達126和設備,而具有交換功能的網(wǎng)絡
46、在結(jié)構(gòu)上沒有尋找的 限制。由專門以太網(wǎng)改造而來的SAN也具有虛擬的無限尋址的能力。因此,對 于SAN而言,主機I/O控制器不再具有最大連接15個設備的限制,相反的,每 個控制器可以連接上百個甚至上千個設備。性能易擴展除了提供lOOMB/s的網(wǎng)絡傳輸速率,SAN還可以為數(shù)據(jù)存取提供更好的可 擴展性。對于交換SAN,它使用一個私有的虛擬網(wǎng)絡,在網(wǎng)絡上,每個設備或子系統(tǒng) 有它們自己的路徑。因此,在設備防火墻或I/O控制器的設備驅(qū)動器中沒有必要 進行仲裁。設備訪問的網(wǎng)絡擁塞處理也轉(zhuǎn)而由高速交換產(chǎn)品來完成。盡管使用多 個設備通過一個交換機進行連接的方式肯定會帶來使用性能的下降,但和使用總 線仲裁技術帶來
47、的性能下降相比是微乎其微的。而最終的結(jié)果是被安裝的存儲器 容量越大,其訪問速度越快。對于環(huán)狀SAN。它們對所有的節(jié)點是平等的,性能擴展要比SCSI總線能提 供的好得多。但和交換網(wǎng)比則還略遜一籌。但光纖路徑環(huán)路由器的價格比光纖路 徑交換機便宜得多。距離易擴展SAN能以高速在很長的距離上運作。而串行傳輸技術,如光纖路徑,能比 并行傳輸技術(如S C S I)在更長的距離上進行數(shù)據(jù)傳輸。不僅僅是線纜更長 了,而且也更容易在一個大的面積范圍中進行橋接。光纖路徑技術在單模光纖中 不使用重發(fā)器,可以支持長達10公里的數(shù)據(jù)傳輸,價格便宜些的多模光纖技術 支持大約5 0 0米的傳輸距離。即使是使用銅芯的光纖路
48、徑,它的3 0米的距離 限制也是SCSI的距離的兩倍多。易升級SAN允許存儲系統(tǒng)和設備在不中斷服務器工作的情況下連接到已有的存儲 網(wǎng)絡。這是SAN存儲技術的關鍵優(yōu)勢。設備和子系統(tǒng)能在SAN中存在,而不 屬于任何一個特定的服務器系統(tǒng),且允許存儲升級的很大一部分工作在不中斷現(xiàn) 存工作服務器的情況下被完成。替換存儲子系統(tǒng)可以在被升級的設備和子系統(tǒng)間 斷工作的同時完成測試。這樣,新的子系統(tǒng)可以在對工作服務器影響很小,甚至 沒有影響的條件下,用很短的時間甚至不用關閉系統(tǒng)就能完成升級過程。SAN的應用 備份SAN備份是第一個大的應用。SAN備份是一種基礎應用,它將伴隨著SAN 技術的發(fā)展產(chǎn)生根本的變化。備
49、份的解決方案會影響系統(tǒng)集成的其他方面,如支 持更大服務器系統(tǒng)的能力。存儲池傳統(tǒng)的存儲系統(tǒng)面臨的一個主要問題在于,它不能訪問未使用的或空白的存 儲資源。這些存儲資源從網(wǎng)絡中的其他服務器連接到一個服務器上。這導致了在 對容量和性能的要求做出改變時,改變存儲結(jié)構(gòu)要經(jīng)歷很長的時間。而SAN允 許所有的服務器能輕松訪問其中的存儲設備,從而解決了這些困難。這樣,任何 空閑存儲器都能被需要它的服務器訪問。這種存儲器可以隨時根據(jù)指令使用,或 者固定地進行分配。這種將存儲資源集中到一個存儲池,從而被當作一個單一的多功能集合的能 力,被稱為SAN的一個重要的基礎應用。存儲池將收集可用的存儲空間,然后 將它們打包成
50、虛擬驅(qū)動器。數(shù)據(jù)共享上面描述的存儲池允許服務器訪問相同存儲子系統(tǒng)中不同的存儲資源,但它 不允許服務器共享相同的實際物理磁盤或虛擬磁盤上的相同文件或記錄。如果能 夠維護數(shù)據(jù)單個拷貝而不是同時保留若干個不同版本,則不僅可以防止當數(shù)據(jù)頻 繁地在系統(tǒng)之間拷貝時不可避免發(fā)生的錯誤,而且,如果數(shù)據(jù)形成后不用再次遷 移,那么在復制數(shù)據(jù)傳輸時消耗的帶寬也可以避免。數(shù)據(jù)共享是非常有用的系統(tǒng)基本應用。在諸如ERP分布式應用系統(tǒng)、互聯(lián)網(wǎng)、 電子商務系統(tǒng)等應用中,常常會發(fā)生改變,應用模塊需要從一個系統(tǒng)遷移到另一 個系統(tǒng),此時總線連接的系統(tǒng)要求這些模塊使用的數(shù)據(jù)也相應地進行遷移,從而 很大程度上增加了系統(tǒng)的復雜性。SA
51、N環(huán)境中的數(shù)據(jù)共享可以通過允許應用模 塊在服務器之間的遷移,而不移動相關的數(shù)據(jù)來消除這些困難。I/O尋徑I/O尋徑指決定和管理系統(tǒng)和存儲器之間的V0數(shù)據(jù)傳輸選用路徑的能力。 改變I/O數(shù)據(jù)傳輸?shù)穆窂交蜻B接將極大地提髙系統(tǒng)管理和存儲管理的效率。第二章網(wǎng)絡存儲技術SAN的一個主要特征在于,它能提供系統(tǒng)到設備的靈活連接。當這種自由被 視為一種主要的優(yōu)勢時,就需要對它進行正確的管理以避免出現(xiàn)問題。這就是I/O 尋徑的由來。I/O尋徑提供了一種通過SAN系統(tǒng)地將系統(tǒng)連接到存儲器,以及當 發(fā)生變化時能有效進行響應的方法。I/O尋徑都是使SAN正常工作的重要組成部數(shù)據(jù)遷移最后一個要討論的SAN應用領域是數(shù)據(jù)
52、移動器。它的想法很簡單,即一個 SAN實體直接將數(shù)據(jù)由一個設備子系統(tǒng)移動到另外一個子系統(tǒng)。系統(tǒng)管理功能、 文件傳輸、軟件分發(fā)和數(shù)據(jù)復制等,會使用數(shù)據(jù)移動技術。數(shù)據(jù)移動器的主要優(yōu) 點在于它的速度。通過使用直接的設備到設備傳輸,數(shù)據(jù)遷移能繞過會帶來延遲 和阻塞的許多I/O路徑部分。更重要的是,數(shù)據(jù)移動器將主機服務器從直接管理 數(shù)據(jù)傳輸中解放出來。數(shù)據(jù)移動器可以在幾乎所有的I/O尋徑組件中實現(xiàn)。這些 組件可以作為SAN中的發(fā)起者來啟動它們的操作??赡軐崿F(xiàn)的數(shù)據(jù)移動器包括 以下兒個部分:存儲橋和路由器。 存儲磁盤和磁帶子系統(tǒng)。 SAN交換機和集線器。 主機I/O控制器和設備驅(qū)動器。 基于主機的卷管理器
53、。數(shù)據(jù)移動器的一個主要問題在于決定將哪些數(shù)據(jù)在存儲設備間移動。所有設 備上和數(shù)據(jù)位置信息相關的智能,是由服務器的文件系統(tǒng)高速緩存或服務器上運 行的存儲管理來實現(xiàn)。第三節(jié)iSCSI技術簡介iSCSI協(xié)議把SCSI和TCP/IP網(wǎng)絡結(jié)合起來,拓展了 SCSI的使用,使得存 儲服務器可以通過IP網(wǎng)絡同存儲設備交換塊數(shù)據(jù);而且,面向數(shù)據(jù)塊的訪問更 靠近磁盤陣列和操作系統(tǒng)的底層,消除了對文件操作的延遲,在提高系統(tǒng)性能的 同時為遠程備份恢復系統(tǒng)讀取和寫入本地數(shù)據(jù)提供了方便。iSCSI協(xié)議概述2003 年 2 月 11 日,IETF (Internet Engineering Task Force,互聯(lián)網(wǎng)工
54、程任務 組)通過了 iSCSI (Internet SCSI)標準,這項由IBM、Cisco共同發(fā)起的技術標 準,經(jīng)過三年20個版本的不斷完善,終于得到IETF認可。iSCSI技術最重要的 貢獻在于其對傳統(tǒng)技術的繼承和發(fā)展上:其一,SCSI (Small Computer Systems Interface,小型計算機系統(tǒng)接口)技術是被磁盤、磁帶等設備廣泛采用的存儲標第二章網(wǎng)絡存儲技術 準,從1986年誕生起到現(xiàn)在仍然保持著良好的發(fā)展勢頭:其二,沿用TCP/IP 協(xié)議,TCP/IP在網(wǎng)絡方面是最通用、最成熟的協(xié)議,且IP網(wǎng)絡的基礎建設非常 完善。這兩點為iSCSI的無限擴展提供了堅實的基礎。i
55、SCSI協(xié)議定義了在TCP/IP網(wǎng)絡發(fā)送、接收block (數(shù)據(jù)塊)級的存儲數(shù)據(jù) 的規(guī)則和方法。發(fā)送端將SCSI命令和數(shù)據(jù)封裝到TCP/IP包中再通過網(wǎng)絡轉(zhuǎn)發(fā), 接收端收到TCP/IP包之后,將其還原為SCSI命令和數(shù)據(jù)并執(zhí)行完成之后將 返回的SCSI命令和數(shù)據(jù)再封裝到TCP/IP包中再傳送回發(fā)送端。而整個過程在 用戶看來,使用遠端的存儲設備就象訪問本地的SCSI設備一樣簡單。支持iSCSI 技術的服務器和存儲設備能夠直接連接到現(xiàn)有的IP交換機和路由器上,因此 iSCSI技術具有易于安裝、成本低廉、不受地理限制、良好的互操作性、管理方 便等優(yōu)勢。2,3.2 iSCSI協(xié)議模型iSCSI層對SC
56、SI層的命令和數(shù)據(jù)進行了封裝,使其能通過TCP/IP協(xié)議在網(wǎng) 絡中傳輸。iSCSI實現(xiàn)了 SCSI到TCP/IP的映射。當Initiator將SCSI命令和數(shù)據(jù) 封裝到iSCSi協(xié)議包后,將向下提交到TCP層,最后封裝成IP包在IP網(wǎng)絡上傳 輸?shù)竭_Target后通過解封裝還原成SCSI指令和數(shù)據(jù),再由驅(qū)動程序發(fā)送到指定 的驅(qū)動器,從而實現(xiàn)SCSI命令和數(shù)據(jù)在IP網(wǎng)絡上的傳輸。iSCSI PDU 格式iSCSI PDU(Protocol Data Unit,協(xié)議數(shù)據(jù)單元)由4部分構(gòu)成:BHS(Basic Header Segment,基本頭部),長度 48 字節(jié)。AHS(Additional H
57、eader Segment,附加頭部),包含一些附加信息,可選。Header-Digest,頭部數(shù)據(jù)校驗碼。Data Segment,數(shù)據(jù)段,包含要傳輸?shù)臄?shù)據(jù),可選。 BHS包括的字段有:Opcode作碼。Total AHS LengthAHS的長度,如果AHS不存在,該項值為0。LUNLUN 號。Initiator Task TagInitiator用來區(qū)別不同iSCSI任務的唯一標識符。 會話管理iSCSI Initiator和Target通過建立TCP連接進行通信和數(shù)據(jù)傳輸,特定的 Initiator和Target之間的所有TCP連接組成了一個會話(session)iSCSI的會話由 一
58、個二元組#識,類似于SCSI協(xié)議中的I-T-Nexus(I-T-聯(lián)結(jié))。iSCSI會話分為登錄階段(Login Phase)和全工階段(Full Feature Phase)。 iSCSI會話起始于登錄階段,登錄階段主要的工作包括:建立TCP連接,認 證,協(xié)商會話的參數(shù),標識TCP連接所屬會話等。最初,Target端程序會監(jiān)聽某個TCP端口等待請求,當Initiator連接到該端 口后,登錄進程便開啟了。會話的建立時需要進行認證,認證過程會受到會話協(xié) 商參數(shù)的影響。登錄階段的具體過程其實是一系列登錄請求和及其響應。當認 證通過后,會話便進入全工階段,這時便可以傳輸SCSI命令了。編號和排序iS
59、CSI對命令和狀態(tài)進行編號,對數(shù)據(jù)進行排序。iSCSI協(xié)議規(guī)定SCSI命令在會話過程中被順序傳輸,因此需要對這些命令進 行編號,iSCSI PDU 中使用 CmdSN(Command Sequence Number,命令順序字) 儲存這些序號,CmdSN字段長度為4個字節(jié)。命令順序是建立在會話的基礎上 的,被分配的CmdSN在會話范圍內(nèi)是統(tǒng)一的。Initiator和Target通過在會話中 都維護三個變量來實現(xiàn)命令的順序傳輸。命名與尋址iSCSI的Initiator和Target使用IP地址作為網(wǎng)絡實體的標識,iSCSI節(jié)點名 作為iSCSI節(jié)點的標識。典型的iSCSI地址包含了 IP地址或域
60、名、端口號以及iSCSI設備名稱,其格 式如下:iSCSI:/:/錯誤處理(1)格式錯誤格式錯誤分為兩種:PDU頭中的內(nèi)容非法和PDU內(nèi)容不一致。當Initiator 或Target收到格式錯誤的PDU后,需要馬上中止會話的所有連接。 摘要錯誤當Initiator和Target收到有頭摘要錯誤的PDU時,需要丟棄該包以及前一個 包包頭后的所有數(shù)據(jù)或者關閉該連接,因為摘要錯誤意味著頭的長度域被損壞序列錯誤Initiator或Target收到的PDU中存在亂序的R2TSN/DataSN,說明發(fā)生了摘 要錯誤。如果是狀態(tài)SN亂序,Initiator收到雙份R2T/DataSN,則需要丟棄副本。協(xié)議錯
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 土地驗收檢查方案(3篇)
- 教研活動競標方案(3篇)
- 商鋪拆遷定價方案(3篇)
- 球館裝修規(guī)劃方案(3篇)
- 協(xié)商經(jīng)費分攤方案(3篇)
- 故宮木器修繕方案(3篇)
- DB23-T3036-2021-篤斯越桔野生資源調(diào)查技術規(guī)程-黑龍江省
- 鄉(xiāng)村小院低價改造方案(3篇)
- DB23-T2890-2021-元蘑林下栽培技術規(guī)程-黑龍江省
- DB23-T2879-2021-藍靛果與中藥材赤芍復合種植技術規(guī)程-黑龍江省
- 管理理論論文(5篇)
- 關于幼兒園建設實施方案范文
- 江蘇省蘇州市2023年中考語文真題試卷
- 統(tǒng)編教材小學生詩詞大賽題庫(各種題型)及答案
- 《軍事理論與國家安全》參考試題庫(含答案)
- 爬架懸挑找平架施工方案
- 呈閱件(清流縣城市管理辦法)
- 公務員職務與及職級并行規(guī)定課件
- 紅河縣年產(chǎn)50噸珍珠棉建設項目環(huán)評報告
- 術中大出血的搶救及護理配合
- 商務英語聽說-對外經(jīng)濟貿(mào)易大學中國大學mooc課后章節(jié)答案期末考試題庫2023年
評論
0/150
提交評論