數(shù)據(jù)挖掘技術(shù)在嬰幼兒營養(yǎng)狀況評估中的應(yīng)用研究-無錫班.doc_第1頁
數(shù)據(jù)挖掘技術(shù)在嬰幼兒營養(yǎng)狀況評估中的應(yīng)用研究-無錫班.doc_第2頁
數(shù)據(jù)挖掘技術(shù)在嬰幼兒營養(yǎng)狀況評估中的應(yīng)用研究-無錫班.doc_第3頁
數(shù)據(jù)挖掘技術(shù)在嬰幼兒營養(yǎng)狀況評估中的應(yīng)用研究-無錫班.doc_第4頁
數(shù)據(jù)挖掘技術(shù)在嬰幼兒營養(yǎng)狀況評估中的應(yīng)用研究-無錫班.doc_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)挖掘技術(shù)在嬰幼兒營養(yǎng)狀況評估中的應(yīng)用研究聲 明創(chuàng)新性聲明 我們所呈交的論文是我們小組所有成員在代課老師指導(dǎo)下進(jìn)行的研究成果。除了文中特別加以標(biāo)注的內(nèi)容以外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果。 簽名: 日期 :摘 要本文將數(shù)據(jù)挖掘理論中的聚類分析方法應(yīng)用到嬰幼兒營養(yǎng)狀況評估中,論述了聚類分析理論指導(dǎo)下的簡化營養(yǎng)狀況測量指標(biāo)的方法。將常用的測量指標(biāo)分組,進(jìn)行層次分解,采用凝聚的方法,去除相關(guān)性較強(qiáng)的測量指標(biāo),從而達(dá)到簡化測量指標(biāo)的目的。最后通過采樣實(shí)驗(yàn),對挖掘結(jié)果進(jìn)行了論證,并在采樣實(shí)驗(yàn)的指導(dǎo)下修正了挖掘結(jié)果,從而得到實(shí)用可靠的簡化測量指標(biāo)。關(guān)鍵詞:數(shù)據(jù)挖掘,微量元素,聚類分析AbstractIn this paper the method of clustering in data mining theory is applied to the evaluation of babys nutrition. It is discussed that predigest the method of evaluate babys nutrition. The process of predigest the evaluate method is cluster the index of measurements, decompose the layer, use the method of agglomerate, wide of tight correlation index. Finally we sample the experiment results and demonstrate the mining results, modify the result by use the sample experiments in succession. Now the practicality, credibility and simple measurements index is gained.Keywords: data mining, clustering, nutrition evaluation,cluster analysis34目 錄數(shù)據(jù)挖掘技術(shù)在嬰幼兒營養(yǎng)狀況評估中的應(yīng)用研究1聲 明2摘 要2目 錄3第一章 緒論41.1微量元素對人體的重要性41.2嬰幼兒營養(yǎng)狀況評估的研究意義51.3 國內(nèi)外相關(guān)研究發(fā)展現(xiàn)狀61.3.1傳統(tǒng)的微量元素檢測的方法71.3.2原子吸收光譜分析法的介紹71.3.3微量元素檢測的質(zhì)量控制101.3.4TH-AAS的技術(shù)特長111.4 本文的主要研究工作和目的11第二章 理論基礎(chǔ)132.1 數(shù)據(jù)預(yù)處理132.1.1數(shù)據(jù)預(yù)處理重要性132.2關(guān)聯(lián)挖掘142.2.1 Apriori算法152.2.2 關(guān)聯(lián)規(guī)則152.3 聚類分析162.3 層次聚類方法16第三章 嬰幼兒營養(yǎng)狀況評估方案的數(shù)據(jù)挖掘?qū)嵗P?83.1、工具介紹183.2、原始數(shù)據(jù)說明193.3、用到的數(shù)據(jù)挖掘理論知識193.4、具體實(shí)施步驟203.5、對挖掘結(jié)果的修正25第四章 總結(jié)33參考文獻(xiàn)34第一章 緒論1.1微量元素對人體的重要性世間萬物乃至人體內(nèi)最復(fù)雜、最敏感的高級生命物質(zhì),都是由元素組成的。人體是由40多種元素構(gòu)成的,根據(jù)元素在體內(nèi)含量不同,可將體內(nèi)元素分為兩類:其一為常量元素,占體重的99.9%,包括碳、氫、氧、磷、硫、鈣、鉀、鎂、鈉、氯等10種,它們構(gòu)成機(jī)體組織,并在體內(nèi)起電解質(zhì)作用;其二為微量元素,占體重的0.05%左右,包括鐵、銅、鋅、鈷、錳、鉻、硒、碘、鎳、氟、鉬、釩、錫、硅、鍶、硼、銣、砷等18種。微量元素與人類健康有密切關(guān)系。它們的攝入過量、不足、或缺乏都會不同程度地引起人體生理的異?;虬l(fā)生疾病。微量元素最突出的作用是與生命活力密切相關(guān),僅僅像火柴頭那樣大小或更少的量就能發(fā)揮巨大的生理作用。值得注意的是這些微量元素必須直接或間接由土壤供給。而每種微量元素都有其特殊的生理功能。盡管它們在人體內(nèi)含量極小,但它們對維持人體中的一些決定性的新陳代謝卻是十分必要的。一旦缺少了這些必需的微量元素,人體就會出現(xiàn)疾病,甚至危及生命。國外曾有報(bào)道:機(jī)體內(nèi)含鐵、銅、鋅總量減少,均可減弱免疫機(jī)制(抵抗疾病力量),降低抗病能力,助長細(xì)菌感染,而且感染后的死亡率亦較高。微量元素在抗病、防癌、延年益壽等方面都還起著不可忽視的作用。幾種微量元素在人體中的主要功能有:鐵:鐵是人體需要量最多的微量元素,27%的鐵組成血紅蛋白,3%的鐵組成肌紅蛋白,0.2%的鐵構(gòu)成多種含鐵酶。血紅蛋白能將氧氣送至全身組織,肌紅蛋白和氧的結(jié)合力很強(qiáng),能儲備部分氧氣,在骨骼肌缺氧時(shí)可以釋放這部分氧。每日鐵需要量為1018毫克,如果供給不足,可以發(fā)生缺鐵性貧血。 鋅:鋅是僅次于鐵的需要量較大的微量元素,是200多種含鋅酶的組成成分,也是酶的激活劑,在核酸代謝和蛋白質(zhì)合成中發(fā)揮重要作用。嬰兒每天需鋅量為35毫克,110歲兒童每天需鋅量為10毫克。嬰幼兒鋅供給不足,影響生長和智力發(fā)育,也影響味覺和免疫功能,缺鋅是厭食癥的主要原因。 碘:碘能調(diào)節(jié)體內(nèi)熱能代謝,是構(gòu)成甲狀腺素的重要成分。嬰兒每天需碘量為0.0450.15毫克。若碘不足會影響小兒生長發(fā)育,引起克汀病或地方性甲狀腺腫;如果攝入過多,也可發(fā)生碘中毒。鈣: 鈣離子約99%構(gòu)成骨鹽,分布在骨骼和牙齒中,約1%分布在體液中。對于心臟的正常搏動(dòng),血液的凝固、肌肉和神經(jīng)正常興奮性的傳導(dǎo)、適宜感應(yīng)性的維持、以及對細(xì)胞膜的滲透性、許多種酶的激活,均有重要作用。銅:銅在人體內(nèi)含量很少,是組成體內(nèi)多種金屬酶的重要成分,主要功能是促進(jìn)鐵構(gòu)成血紅蛋白,也是許多氧化酶的輔助因素。人體缺銅時(shí),可發(fā)生貧血、中性粒細(xì)胞減少、生長緩慢和情緒不穩(wěn)。硒:硒參與體內(nèi)谷胱甘肽過氧化酶的代謝過程,是人體的肌代謝不可缺少的微量元素。缺硒時(shí)容易發(fā)生克山病。鎂:鎂是構(gòu)成人體內(nèi)多種酶的重要來源。鎂盡管在人體中的含量微乎其微,可缺乏鎂元素人們就會精神疲憊、面黃肌瘦、皮膚粗糙,甚至情緒不穩(wěn)定,面部、四肢肌肉顫抖。鉛:鉛是一種嚴(yán)重的環(huán)境毒和神經(jīng)毒。據(jù)研究,隨著環(huán)境污染的加劇,每人每天從空氣、水和食物中吸收大約20至40微克的鉛,鉛在體內(nèi)長期積累而不易排出,損傷神經(jīng)系統(tǒng)和造血系統(tǒng)。隨著社會工業(yè)化的發(fā)展及人們生活方式的改變,人體內(nèi)微量元素的平衡也受到影響并導(dǎo)致許多疾病,如嬰兒母乳喂養(yǎng)不足引起某些微量元素缺乏使嬰兒生長發(fā)育異常并易患疾病;食物加工的過于精細(xì)會丟失某些微量元素從而導(dǎo)致飲食中微量元素的缺乏;飲食的過于單調(diào)使體內(nèi)微量元素失衡引起疾?。欢捎阡X制品炊具的廣泛應(yīng)用使人體內(nèi)鋁元素的過多及其它微量元素的失衡可引起老年性癡呆等等。此外,在人體的新陳代謝過程中,每天都有一定數(shù)量的礦物質(zhì)通過糞便、尿液、汗液、頭發(fā)等途徑排出體外,因此必須通過飲食予以補(bǔ)充。由此看來,雖然微量元素在人體中的含量很少,但作用卻不可替代,它們參與體內(nèi)各種酶或激素的合成,調(diào)節(jié)人體的各項(xiàng)生理功能。1.2嬰幼兒營養(yǎng)狀況評估的研究意義隨著現(xiàn)代科技飛速發(fā)展,在醫(yī)學(xué)微量元素學(xué)領(lǐng)域的研究受到世界各國的重視1。近幾年,國內(nèi)外大量的研究結(jié)果顯示微量元素與人體的生長發(fā)育密切相關(guān)2。鐵參與血紅蛋白的合成,鐵缺乏可引起大腦組織的改變,導(dǎo)致行為改變,注意力不集中,甚至神經(jīng)系統(tǒng)障礙;鈣是骨骼的主要成分,在細(xì)胞水平上促進(jìn)神經(jīng)介質(zhì)釋放,維持神經(jīng)系統(tǒng)正常傳導(dǎo)功能;鋅促進(jìn)機(jī)體生長發(fā)育,促進(jìn)核酸及蛋白質(zhì)的生物合成,影響生長激素的合成與釋放,促使正常免疫功能;銅參與細(xì)胞呼吸,催化血紅蛋白合成及膠原、彈性蛋白的合成,維護(hù)中樞神經(jīng)系統(tǒng)發(fā)育;鉛是神經(jīng)毒性的重金屬元素,對中樞神經(jīng)系統(tǒng)和周圍神經(jīng)系統(tǒng)有明顯的損害作用。然而,嬰幼兒的發(fā)育除了受遺傳因素和環(huán)境因素的影響之外,還有語言、撫養(yǎng)方式、教育及營養(yǎng)等因素的影響,而營養(yǎng)是大腦發(fā)育的物質(zhì)基礎(chǔ)。已經(jīng)證實(shí),微量元素在嬰幼兒生長發(fā)育過程中同樣具有重要的生理功能:(1) 參與機(jī)體內(nèi)酶的構(gòu)成與激活。(2) 構(gòu)成體內(nèi)重要的載體及電子傳遞系統(tǒng)。(3) 參與激活維生素的合成,影響內(nèi)分泌系統(tǒng)的功能。(4) 清除體內(nèi)過多的自由基。微量元素的缺乏或超標(biāo)可導(dǎo)致嬰幼兒生長發(fā)育遲滯、神經(jīng)發(fā)育障礙和智能低下,并引起多器官功能障礙等。比如,缺鐵會引起嬰幼兒貧血和影響體格發(fā)育,甚至還可影響智力發(fā)育。缺鋅將出現(xiàn)食欲減退、生長停滯、貧血、創(chuàng)傷愈合不良、皮炎、智力減退等癥狀。缺碘可引起甲狀腺功能不足,使嬰幼兒生長發(fā)育遲緩,智力低下。缺氟會使骨骼脫鈣、骨質(zhì)疏松、骨極痛、畸形,出現(xiàn)氟骨癥;同時(shí)牙齒也受損,牙齒失去光澤或變色,發(fā)脆易于折斷和磨損??偠灾?,微量元素對嬰幼兒的生長發(fā)育起到了舉足輕重的作用。何況,近幾年在國內(nèi)頻頻出現(xiàn)假奶粉的新聞報(bào)道,造成了大片地區(qū)的嬰幼兒營養(yǎng)不良,因此對嬰幼兒營養(yǎng)狀況的檢測逐漸變成了每個(gè)家庭乃至國家所關(guān)心的頭等大事。所以說,對嬰幼兒營養(yǎng)狀況評估的研究已是迫在眉睫的事情,具有極其重要的意義。1.3 國內(nèi)外相關(guān)研究發(fā)展現(xiàn)狀微量元素被認(rèn)為是關(guān)系到人類健康和長壽的一個(gè)充滿希望的新領(lǐng)域,已引起國內(nèi)外營養(yǎng)界和醫(yī)學(xué)界的普遍重視。而準(zhǔn)確檢測微量元素在人體中的含量是任何理論研究與臨床應(yīng)用的前提和基礎(chǔ),如果沒有準(zhǔn)確地檢測,根本談不上研究與應(yīng)用。隨著醫(yī)療水平的不斷提高,微量元素與人體健康的關(guān)系得到了充分的認(rèn)識,人們更加關(guān)心如何補(bǔ)充微量元素,如何排除有害元素。微量元素在人體內(nèi)是一個(gè)平衡過程,微量元素的缺乏和過量都會對人體產(chǎn)生不良影響。下面就國內(nèi)外微量元素檢測的方法學(xué)做一介紹:1.3.1傳統(tǒng)的微量元素檢測的方法目前傳統(tǒng)的可用于人體微量元素檢測的方法有:同位素稀釋質(zhì)譜法、分子光譜法、原子發(fā)射光譜法、原子吸收光譜法、X射線熒光光譜分析法、中子活化分析法、生化法、電化學(xué)分析法等。但在臨床醫(yī)學(xué)上廣泛應(yīng)用的方法主要為生化法、電化學(xué)分析法、原子吸收光譜法這幾種。下面簡單介紹一下生化法、電化學(xué)分析法這兩種檢驗(yàn)方法的主要特點(diǎn):1 生化法(鋅原卟啉法、雙硫腙法、其它比色法等):l 用血量較大l 需要前處理,操作復(fù)雜,澄清血清耗時(shí)長l 檢測血清,而血清受近期飲食等因素影響極大,從而缺乏客觀準(zhǔn)確性l 試劑成本較高l 檢測元素種類受限制l靈敏度達(dá)不到臨床檢測的要求l重復(fù)性差2 電化學(xué)分析法:l 儀器價(jià)格較低l 可以用于痕量的測量,但誤差較大l 測定多種元素時(shí),重復(fù)性差l 對環(huán)境和實(shí)驗(yàn)人員污染嚴(yán)重l 很難將保養(yǎng)到最佳條件l 前處理極其繁雜耗時(shí)l 整個(gè)實(shí)驗(yàn)很難控制,結(jié)果非常不穩(wěn)定1.3.2原子吸收光譜分析法的介紹所謂原子吸收光譜法(Atomic Absorption Spectroscopy ) 又稱為原子吸收分光光度法,通常簡稱原子吸收法(AAS),其基本原理為:從空心陰極燈或光源中發(fā)射出一束特定波長的入射光,在原子化器中待測元素的基態(tài)原子蒸汽對其產(chǎn)生吸收,未被吸收的部分透射過去。通過測定吸收特定波長的光量大小,來求出待測元素的含量。原子吸收光譜分析法的定量關(guān)系可用郎伯-比耳定律,A-abc來表示。a式中,A是吸收度,a是吸光系數(shù),b是吸收池光路長度,c是被測樣品濃度。該法具有靈敏度高、精確高;選擇性好、干擾少;速度快,易于實(shí)現(xiàn)自動(dòng)化;可測元素多、范圍廣;結(jié)構(gòu)簡單、成本低等特點(diǎn),也正因?yàn)槿绱?,該法的發(fā)展也相當(dāng)迅速。1955年,原子吸收光譜法誕生后,因其強(qiáng)大的生命力,迅速應(yīng)用于分析化學(xué)的各個(gè)領(lǐng)域,國內(nèi)大規(guī)模的應(yīng)用是在上世紀(jì)90年代開始,應(yīng)用最廣泛的是冶金、地質(zhì)勘探、質(zhì)檢監(jiān)督、環(huán)境檢測、疾病控制等。原子吸收光譜分析法(AAS)在疾病控制中心更是作為“金標(biāo)準(zhǔn)”。隨著臨床醫(yī)學(xué)的進(jìn)步,最近開始應(yīng)用于醫(yī)療衛(wèi)生領(lǐng)域。原子吸收光譜分析在醫(yī)學(xué)上的應(yīng)用,才使得正確檢測各種含量在ppm或ppb級的微量元素成為可能。目前,原子吸收光譜分析檢測微量元素在臨床中得到廣泛的應(yīng)用,各大醫(yī)院均采用此方法,是徹底淘汰生化法(鋅原卟啉法、雙硫腙法、其它比色法等)、電化學(xué)法的首選方法。1 原子吸收光譜儀的發(fā)展進(jìn)程原子吸收光譜分析法(AAS)所使用的儀器為原子吸收光譜儀或原子吸收分光光度計(jì)。目前國內(nèi)所見到的原子吸收光譜儀按照技術(shù)發(fā)展的水平,大致可分為三代:第一代:單火焰原子吸收光譜儀(日立的Z500、 沈分廠的WYX-9004、華洋的AA2610、博暉的BH5100)第二代:火焰原子吸收光譜儀+外置石墨爐(日立的Z180-80、興科天合公司的TH-AAS-、博暉的BH2100)第三代:一體化的火焰+內(nèi)置石墨爐原子吸收光譜儀(此為當(dāng)前的主流產(chǎn)品,國際上的所有的大公司和國內(nèi)的少數(shù)公司掌握此技術(shù)。(代表:日立公司的Z5000,島津公司的AA6800、PE公司的AA800、興科天合公司的TH-AAS-、熱電公司的solaar S等)原子吸收光譜儀按照原子化的方式不同可分為火焰原子吸收和石墨爐原子吸收,石墨爐原子吸收需要瞬間大電流,所以對系統(tǒng)的抗干擾等技術(shù)要求較高,為防止石墨爐對整個(gè)系統(tǒng)的影響,第二代原子吸收光譜儀采用了外置石墨爐。隨著科技的發(fā)展,世界上各大廠家開始實(shí)現(xiàn)了完全整體化設(shè)計(jì),將全部分光檢測系統(tǒng)、火焰、石墨爐和加熱電熱的所有部件集成于同一儀器主體中,并實(shí)現(xiàn)火焰和石墨爐的自由轉(zhuǎn)換,興科天合公司和世界同步,具有自主知識產(chǎn)權(quán)的TH-AAS系列原子吸收光譜儀采用了最新的電路設(shè)計(jì)和制造,徹底實(shí)現(xiàn)了火焰、石墨爐一體化。2 關(guān)于火焰原子吸收多元素測定的技術(shù),主要有兩類:順序多元素測定:如美國VARIAN 公司的Spectr AA220FS等同時(shí)多元素測定:從技術(shù)上看要實(shí)現(xiàn)火焰AAS多元素比較容易,但實(shí)現(xiàn)石墨爐AAS多元素測定比較困難,因此國外的廠商主要在此尋求突破,如日立的Z9000、PE的SIMAA6000。多元素同時(shí)測定技術(shù)的發(fā)展為AAS儀器技術(shù)的發(fā)展帶來了改進(jìn),但是由于較大幅度的提高了儀器成本,在實(shí)際應(yīng)用中需要尋求折中條件,由于AAS法各元素的測量動(dòng)力學(xué)范圍比較窄,一般只有兩個(gè)數(shù)量級,而且多元素?zé)舻陌l(fā)光強(qiáng)度一般都較單元素?zé)羧?,?dāng)同一樣品中要測定的各元素濃度范圍差異較大時(shí),為保證測試的靈敏度,則很難同時(shí)測量。因火焰原子吸收法檢測元素速度較快,所以在臨床檢測時(shí),應(yīng)用火焰原子吸收法同時(shí)多元素測定并無實(shí)際意義。應(yīng)用石墨爐原子吸收檢測血鉛時(shí),為提高工作效率,可使用自動(dòng)進(jìn)樣器。3 關(guān)于石墨管的技術(shù)在石墨爐原子吸收中,石墨管的技術(shù)的好壞直接影響了測試的靈敏度和重復(fù)性以及石墨管的使用壽命,各廠家在此做了許多的技術(shù)改進(jìn),如鍍鈀、鍍銠、錐型、平臺、錐型、襯鉭、鎢舟、浸酸等。需要注意的是所謂“鎢舟”并不是什么新技術(shù)。目前使用最為廣泛的是熱解石墨管(PGT),它具有很好的耐氧化性能,升華溫度高,可達(dá)3700C;它還具有良好的惰性,因而不易與高溫元素(如V、Ti、Mo等)形成碳化物而影響原子化;它還具有較好的機(jī)械強(qiáng)度,使用壽命明顯地優(yōu)于其他石墨管,可使用2000次以上。1.3.3微量元素檢測的質(zhì)量控制因?yàn)檠U等微量元素檢測屬微量分析范疇,而且微量元素在自然界普遍存在,任何細(xì)微的內(nèi)、外界因素都可能影響其結(jié)果的可靠性,所以質(zhì)量控制在微量元素分析過程中非常重要。質(zhì)量控制包括分析前的質(zhì)量管理、分析時(shí)的質(zhì)量管理及統(tǒng)計(jì)質(zhì)量控制。而現(xiàn)在一些實(shí)驗(yàn)人員往往忽視了理論學(xué)習(xí)和分析前的質(zhì)量管理,迷信廠家夸大其詞的宣傳,片面追求簡便快速,直接采取末梢血來檢測,而這又是分析過程中的質(zhì)量控制手段所無法控制的,得到結(jié)果就偏差巨大。(例如:轟動(dòng)全國的河南安陽婦幼保健院用北京公司提供的血鉛檢測儀檢測當(dāng)?shù)貎和U事件,最后醫(yī)院巨額賠償,領(lǐng)導(dǎo)撤職)醫(yī)院在開展微量元素檢測工作時(shí)應(yīng)該注意以下問題:l了解相關(guān)的法律、法規(guī),采用國家標(biāo)準(zhǔn)的儀器和實(shí)驗(yàn)方法。隨著醫(yī)保制度改革的進(jìn)行和新的醫(yī)療事故處理?xiàng)l例的頒布實(shí)施,醫(yī)院在給患者提供醫(yī)療服務(wù)時(shí),一定要注意標(biāo)準(zhǔn)化和規(guī)范化。關(guān)于血鉛檢測,國家衛(wèi)生部在2000年就實(shí)行了標(biāo)準(zhǔn)化。(WS/T 174-1999)l實(shí)驗(yàn)人員要具備相應(yīng)的理論。l不要檢測頭發(fā)。雖然頭發(fā)微量元素測定具有標(biāo)本收集、輸送方便,適用與任何年齡的兒童等的優(yōu)點(diǎn)。但是頭發(fā)是人體末端,代謝活動(dòng)低,只能反映某一時(shí)間段的變化情況,而不能反映近期變化。現(xiàn)代社會各種污染隨處存在,頭發(fā)裸露在外,受到人體所到過的各種環(huán)境污染,在目前,尚沒有任何一種標(biāo)本預(yù)處理的方法能區(qū)別頭發(fā)中的微量元素是內(nèi)源性的還是外源性的。此外,不同部位的頭發(fā)中微量元素的含量也不一樣,頭發(fā)微量元素水平還與性別、皮膚顏色深淺、洗發(fā)的經(jīng)常性、頭發(fā)的處理(染、燙,等)等許多不易控制的因素有關(guān)。測試結(jié)果離散性大。因此,目前不認(rèn)為頭發(fā)中的微量元素對反應(yīng)體內(nèi)的微量元素含量有任何實(shí)用價(jià)值。l采樣時(shí)要防污染。既往將耳垂和指尖取血稱毛細(xì)管采血,實(shí)為小動(dòng)脈、毛細(xì)管和小靜脈血及組織液的混合,國外文獻(xiàn)都改稱“皮膚針刺血”(Skin Puncture Blood)。耳垂和指尖采血的差異已為臨床所熟知,我國逐步摒棄耳垂采血。目前,各儀器廠家在技術(shù)上都可以實(shí)現(xiàn)微量血檢測,可是衛(wèi)生部的標(biāo)準(zhǔn)要求在采樣時(shí)還是要采靜脈血,這樣做有如下優(yōu)點(diǎn):盡可能防止皮膚表面污染和組織液滲入測試結(jié)果異常可及時(shí)復(fù)查符合衛(wèi)生部的標(biāo)準(zhǔn),避免醫(yī)療糾紛。采血時(shí)要徹底清潔靜脈穿刺部位的皮膚,使用無鉛注射器、試管、抗凝劑等;采血后要充分混勻、完全抗凝等。1.3.4TH-AAS的技術(shù)特長l第三代原子吸收光譜儀,一體化的火焰+內(nèi)置石墨爐,自由切換,和世界領(lǐng)先水平同步,一臺設(shè)備即可檢測血中鉛、鋅、銅、鈣、鎂、鐵等元素l符合國家標(biāo)準(zhǔn),保證結(jié)果的可比性l專用試劑,省去繁雜的樣品的前處理過程,消除污染l快速、簡便,只需將微量血加入試劑中,即可上機(jī)l取樣少、準(zhǔn)確性好,真正實(shí)現(xiàn)微量血測試鉛、銅、鋅、鈣、鎂、鐵等元素l強(qiáng)大的擴(kuò)展能力,無需任何改造即可檢測50多種元素興科天合公司不但提供了先進(jìn)的儀器和試劑,還建立了一套完整的微量元素檢測的方案。其中包括理論培訓(xùn)、儀器、試劑、校準(zhǔn)品、操作程序、質(zhì)量控制、保養(yǎng)計(jì)劃和學(xué)術(shù)交流等各個(gè)方面,這樣才能更好地為臨床微量元素檢測提供有力的支持。1.4 本文的主要研究工作和目的目前我國的各級醫(yī)療保健單位,尤其是婦幼保健單位、兒童醫(yī)院、綜合醫(yī)院等,已經(jīng)將人體元素(鉛、鋅、銅、鈣、鎂、鐵等)檢測作為常規(guī)項(xiàng)目。雖然從20世紀(jì)70年代就開始了微量元素研究,但它畢竟是一個(gè)新興學(xué)科,檢測微量元素的手段還比較陳舊和落后,無論從采樣到測試前處理到測試直到結(jié)果分析都需專業(yè)人士來操作,步驟相當(dāng)復(fù)雜,污染嚴(yán)重,且出結(jié)果時(shí)間長。這也正是醫(yī)院在人體微量元素檢測方面無法普及的重要原因之一。如何選擇一種適合的儀器,是醫(yī)院管理者在采購過程中面臨的首要問題。出于對病人健康的高度責(zé)任感和可能出現(xiàn)醫(yī)患糾紛的自我保護(hù),選擇一種能夠準(zhǔn)確而且規(guī)范的測量儀器最為重要;其次應(yīng)考慮操作流程簡便性、設(shè)備使用安全性和穩(wěn)定性;還要考慮受檢者經(jīng)濟(jì)承擔(dān)能力和受影響程度,滿足其希望能夠又準(zhǔn)又快又便宜地完成檢測的要求;最后,也要考慮到儀器利用率高,保證投資收益。因此如何準(zhǔn)確快速、方便地檢測人體微量元素含量就成為醫(yī)務(wù)工作者亟須解決的課題。因此,為了從另外一個(gè)角度來解決這一棘手的問題,本文的主要研究工作就是通過聚類分析法對2004年某地區(qū)10029名兒童血液中微量元素(ug/100ml)與血紅蛋白(g/100ml)測定數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘。希望通過聚類分析篩選出代表性指標(biāo),以便更經(jīng)濟(jì)、快捷的評價(jià)兒童的營養(yǎng)狀態(tài)。第二章 理論基礎(chǔ)2.1 數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘(知識發(fā)現(xiàn))過程中的一個(gè)重要步驟,尤其是在對包含有噪聲、不完整,甚至是不一致數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘時(shí),更需要進(jìn)行數(shù)據(jù)的預(yù)處理,以提高數(shù)據(jù)挖掘?qū)ο蟮馁|(zhì)量,并最終達(dá)到提高數(shù)據(jù)挖掘所獲模式知識質(zhì)量的目的。2.1.1數(shù)據(jù)預(yù)處理重要性數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘(知識發(fā)現(xiàn))過程中的一個(gè)重要步驟,尤其是在對包含有噪聲、不完整,甚至是不一致數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘時(shí),更需要進(jìn)行數(shù)據(jù)的預(yù)處理,以提高數(shù)據(jù)挖掘?qū)ο蟮馁|(zhì)量,并最終達(dá)到提高數(shù)據(jù)挖掘所獲模式知識質(zhì)量的目的。由于數(shù)據(jù)庫系統(tǒng)所獲數(shù)據(jù)量的迅速膨脹(已達(dá)G或T數(shù)量級),從而導(dǎo)致了現(xiàn)實(shí)世界數(shù)據(jù)庫中常常包含許多含有噪聲、不完整、甚至是不一致的數(shù)據(jù)。顯然對數(shù)據(jù)挖掘所涉及的數(shù)據(jù)對象必須進(jìn)行預(yù)處理。數(shù)據(jù)預(yù)處理主要包括:數(shù)據(jù)清洗(data cleaning)、數(shù)據(jù)集成(data integration)、數(shù)據(jù)轉(zhuǎn)換(data trandformation)和數(shù)據(jù)消減(data reduction)。數(shù)據(jù)清洗處理例程通常包括:填補(bǔ)遺漏的數(shù)據(jù)值、平滑有噪聲數(shù)據(jù)、識別或除去異常值,以及解決不一致問題。對于遺漏數(shù)據(jù)的處理有以下方案:忽略該條記錄,手工填補(bǔ)遺漏值,利用缺省值填補(bǔ)遺漏值,利用均值填補(bǔ)遺漏值,利用同類別均值填補(bǔ)遺漏值,利用最可能的值填補(bǔ)遺漏值,我們采取的方法是忽略該條記錄,因?yàn)槲覀冇谐渥愕耐暾麛?shù)據(jù)。數(shù)據(jù)集成就是將來自多個(gè)數(shù)據(jù)源(如:數(shù)據(jù)庫、文件等)數(shù)據(jù)合并到一起。數(shù)據(jù)轉(zhuǎn)換主要是對數(shù)據(jù)進(jìn)行規(guī)格化操作。 數(shù)據(jù)消減的目的就是縮小所挖掘數(shù)據(jù)的規(guī)模,但卻不會影響(或基本不影響)最終的挖掘結(jié)果。這里需要強(qiáng)調(diào)的是以上所提及的各種數(shù)據(jù)預(yù)處理方法,并不是相互獨(dú)立的,而是相互關(guān)聯(lián)的。如:消除數(shù)據(jù)冗余既可以看成是一種形式的數(shù)據(jù)清洗,也可以認(rèn)為是一種數(shù)據(jù)消減。由于現(xiàn)實(shí)世界數(shù)據(jù)常常是含有噪聲、不完全的和不一致的,數(shù)據(jù)預(yù)處理能夠幫助改善數(shù)據(jù)的質(zhì)量,進(jìn)而幫助提高數(shù)據(jù)挖掘進(jìn)程的有效性和準(zhǔn)確性。高質(zhì)量的決策來自高質(zhì)量的數(shù)據(jù)。因此數(shù)據(jù)預(yù)處理是整個(gè)數(shù)據(jù)挖掘與知識發(fā)現(xiàn)過程中一個(gè)重要步驟。2.2關(guān)聯(lián)挖掘關(guān)聯(lián)規(guī)則挖掘就是從大量的數(shù)據(jù)中挖掘出有價(jià)值描述數(shù)據(jù)項(xiàng)之間相互聯(lián)系的有關(guān)知識。隨著收集和存儲在數(shù)據(jù)庫中的數(shù)據(jù)規(guī)模越來越大,人們對從這些數(shù)據(jù)中挖掘相應(yīng)的關(guān)聯(lián)知識越來越有興趣。挖掘關(guān)聯(lián)規(guī)則主要包含以下二個(gè)步驟:步驟一:發(fā)現(xiàn)所有的頻繁項(xiàng)集,根據(jù)定義,這些項(xiàng)集的頻度至少應(yīng)等于(預(yù)先設(shè)置的)最小支持頻度;步驟二:根據(jù)所獲得的頻繁項(xiàng)集,產(chǎn)生相應(yīng)的強(qiáng)關(guān)聯(lián)規(guī)則。根據(jù)定義這些規(guī)則必須滿足最小信任度閾值。此外還可利用有趣性度量標(biāo)準(zhǔn)來幫助挖掘有價(jià)值的關(guān)聯(lián)規(guī)則知識。由于步驟二中的相應(yīng)操作極為簡單,因此挖掘關(guān)聯(lián)規(guī)則的整個(gè)性能就是由步驟一中的操作處理所決定。有許多不同類型的關(guān)聯(lián)規(guī)則知識挖掘,可以根據(jù)以下標(biāo)準(zhǔn)對這些關(guān)聯(lián)規(guī)則挖掘方法進(jìn)行分類:(1)根據(jù)關(guān)聯(lián)規(guī)則所處理的具體值來進(jìn)行分類劃分若一個(gè)規(guī)則僅描述數(shù)據(jù)項(xiàng)是否在出現(xiàn)這種情況間的聯(lián)系,那這種關(guān)聯(lián)規(guī)則就是一個(gè)布爾關(guān)聯(lián)規(guī)則。若一個(gè)規(guī)則描述的是定量數(shù)據(jù)項(xiàng)(或?qū)傩裕┲g的關(guān)系,那它就是一個(gè)定量關(guān)聯(lián)規(guī)則。在這些規(guī)則中,數(shù)據(jù)項(xiàng)(或?qū)傩裕┑亩繑?shù)值可以劃分為區(qū)間范圍。(2)根據(jù)規(guī)則中數(shù)據(jù)的維數(shù)來進(jìn)行分類劃分若一個(gè)關(guān)聯(lián)規(guī)則中的項(xiàng)(或?qū)傩裕﹥H涉及一個(gè)維,那它就是一個(gè)單維關(guān)聯(lián)規(guī)則。(3)根據(jù)規(guī)則描述內(nèi)容所涉及的抽象層次來進(jìn)行分類劃分(4)根據(jù)關(guān)聯(lián)規(guī)則所涉及的關(guān)聯(lián)特性來進(jìn)行分類劃分2.2.1 Apriori算法這一節(jié)介紹單維單層次布爾關(guān)聯(lián)規(guī)則的挖掘方法:Apriori算法Apriori算法是挖掘產(chǎn)生布爾關(guān)聯(lián)規(guī)則所需頻繁項(xiàng)集的基本算法;它也是一個(gè)很有影響的關(guān)聯(lián)規(guī)則挖掘算法。Apriori算法就是根據(jù)有關(guān)頻繁項(xiàng)集特性的先驗(yàn)知識而命名的。該算法利用了一個(gè)層次順序搜索的循環(huán)方法來完成頻繁項(xiàng)集的挖掘工作。這一循環(huán)方法就是利用k-項(xiàng)集來產(chǎn)生. (k+1)項(xiàng)集。具體做法就是:首先找出頻繁1 -項(xiàng)集,記為L1;然后利用L1來挖掘L2,即頻繁2 -項(xiàng)集;不斷如此循環(huán)下去直到無法發(fā)現(xiàn)更多的頻繁k-項(xiàng)集為止。每挖掘一層Lk就需要掃描整個(gè)數(shù)據(jù)庫一遍。為提高按層次搜索并產(chǎn)生相應(yīng)頻繁項(xiàng)集的處理效率。Apriori算法利用了一個(gè)重要性質(zhì),又稱為Apriori性質(zhì)來幫助有效縮小頻繁項(xiàng)集的搜索空間。2.2.2 關(guān)聯(lián)規(guī)則在從數(shù)據(jù)庫_中挖掘出所有的頻繁項(xiàng)集后,就可以較為容易獲得相應(yīng)的關(guān)聯(lián)規(guī)則。也就是要產(chǎn)生滿足最小支持度和最小信任度的強(qiáng)關(guān)聯(lián)規(guī)則,可以利用公式來計(jì)算所獲關(guān)聯(lián)規(guī)則的信任度。這里的條件概率是利用項(xiàng)集的支持頻度來計(jì)算的。規(guī)則的操作說明如下:(1) 對于每個(gè)頻繁項(xiàng)集l產(chǎn)生_的所有非空子集;(2) 對于每個(gè)_的非空子集s,若則 產(chǎn)生一個(gè)關(guān)聯(lián)規(guī)則;其中min_conf為最小信任度閾值。由于規(guī)則是通過頻繁項(xiàng)集直接產(chǎn)生的,因此關(guān)聯(lián)規(guī)則所涉及的所有項(xiàng)集均滿足最小支持度閾值。頻繁項(xiàng)集及其支持頻度可以存儲在哈希表中以便它們能夠被快速存取。2.3 聚類分析聚類(clustering)是一個(gè)將數(shù)據(jù)集劃分為若干組(class)或類(cluster)的過程,并使得同一個(gè)組內(nèi)的數(shù)據(jù)對象具有較高的相似度;而不同組中的數(shù)據(jù)對象是不相似的。相似或不相似的描述是基于數(shù)據(jù)描述屬性的取值來確定的。通常就是利用(各對象間)距離來進(jìn)行表示的。在研究論文中有許多聚類算法,需要根據(jù)應(yīng)用所涉及的數(shù)據(jù)類型、聚類的目的以及具體應(yīng)用要求來選擇合適的聚類算法。我們所采取的聚類分析算法是:劃分方法。給定一個(gè)包含n個(gè)對象或數(shù)據(jù)行,劃分方法將數(shù)據(jù)集劃分為k個(gè)子集(劃分)。其中每個(gè)子集均代表一個(gè)聚類(kn)。也就是說將數(shù)據(jù)分為k組,這些組滿足以下要求:(a)每組至少應(yīng)包含一個(gè)對象;且(b)每個(gè)對象必須只能屬于某一組。給定需要?jiǎng)澐值膫€(gè)數(shù)k,一個(gè)劃分方法創(chuàng)建一個(gè)初始劃分;然后利用循環(huán)再定位技術(shù),即通過移動(dòng)不同劃分(組)中的對象來改變劃分內(nèi)容。一個(gè)好的劃分衡量標(biāo)準(zhǔn)通常就是同一個(gè)組中的對象“相近”或彼此相關(guān);而不同組中的對象“較遠(yuǎn)”或彼此不同。當(dāng)然還有許多其它判斷劃分質(zhì)量的衡量標(biāo)準(zhǔn)。為獲得基于劃分聚類分析的全局最優(yōu)結(jié)果就需要窮舉所有可能的對象劃分。為此大多數(shù)應(yīng)用采用一至二種常用啟發(fā)方法:(a)k-means 算法,該算法中的每一個(gè)聚類均用相應(yīng)聚類中對象的均值來表示;和(b)k-medoids算法,該算法中的每一個(gè)聚類均用相應(yīng)聚類中離聚類中心最近的對象來表示。這些啟發(fā)聚類方法在分析中小規(guī)模數(shù)據(jù)集以發(fā)現(xiàn)圓形或球狀聚類時(shí)工作的很好。但為了使劃分算法能夠分析處理大規(guī)模數(shù)據(jù)集或復(fù)雜數(shù)據(jù)類型,就需要對其進(jìn)行擴(kuò)展。2.3 層次聚類方法有兩種基本層次聚類方法:(1) 自下而上聚合層次聚類方法。這種自下而上策略就是最初將每個(gè)對象(自身)作為一個(gè)聚類;然后將這些原子聚類進(jìn)行聚合以構(gòu)造越來越大的聚類,直到所有對象均聚合為一個(gè)聚類,或滿足一定終止條件為止。大多數(shù)層次聚類方法都屬于這類方法,但它們在聚類內(nèi)部對象間距離定義描述方面有所不同。(2) 自頂而下分解層次聚類方法。這種自頂而下策略的作法與自下而上策略做法相反。它首先將所有對象看成一個(gè)聚類的內(nèi)容;將其不斷分解以使其變成越來越小但個(gè)數(shù)越來越多的小聚類,直到所有對象均獨(dú)自構(gòu)成一個(gè)聚類,或滿足一定終止條件為止。2.3.1 BIRCH方法BIRCH方法是一個(gè)集成的層次聚類方法。它包含兩個(gè)重要概念:聚類特征(簡稱CF)和聚類特征樹(CF tree)。這兩個(gè)概念用于對聚類描述進(jìn)行概要總結(jié)。相應(yīng)的有關(guān)數(shù)據(jù)結(jié)構(gòu)將幫助聚類方法獲得較好的聚類速度和可對大數(shù)據(jù)庫進(jìn)行處理的可擴(kuò)展性。此外BIRCH方法在進(jìn)行增量和動(dòng)態(tài)聚類時(shí)也是很有效的。 聚類特征(CF)是有關(guān)對象子集概要信息的一個(gè)三元組。設(shè)一個(gè)子聚類(subcluster)包含N個(gè)d維數(shù)據(jù)或?qū)ο驩i ,那么這個(gè)子聚類的CF就定義為:聚類特征基本上就是對給定子聚類統(tǒng)計(jì)信息的總結(jié)。它包含了聚類計(jì)算和空間存儲利用所需要的關(guān)鍵信息。CF樹是一個(gè)高度平衡樹,它存有用于層次聚類的聚類特征。如圖所示就是一個(gè)CF樹示意描述。根據(jù)定義CF樹中非葉結(jié)點(diǎn)存放其子女結(jié)點(diǎn)的CF值。一個(gè)CF樹有兩個(gè)主要參數(shù):分支系數(shù)% 和閾值0。分支系數(shù)% 指定了每個(gè)非葉結(jié)點(diǎn)的最大子女?dāng)?shù);而閾值0 則指定了存放在葉節(jié)點(diǎn)中子聚類的最大直徑。這兩個(gè)參數(shù)影響所獲CF樹的大小。BIRCH方法工作主要包括兩個(gè)階段:第一階段:BIRCH方法掃描數(shù)據(jù)庫以建立一個(gè)初始基于內(nèi)存的CF樹,該樹可以看成是對數(shù)據(jù)的壓縮且還保留著數(shù)據(jù)中所包含的有關(guān)聚類結(jié)構(gòu)的內(nèi)涵。第二階段:BIRCH方法應(yīng)用一個(gè)(所選擇)的聚類算法對CF樹的葉結(jié)點(diǎn)進(jìn)行聚類。在構(gòu)造完CF樹后,(第二階段)可利用任何聚類算法,主要是劃分聚類方法,對所獲得的CF樹進(jìn)行聚類分析第三章 嬰幼兒營養(yǎng)狀況評估方案的數(shù)據(jù)挖掘?qū)嵗P?.1、工具介紹我們使用工具是SPSS(Statistics Package for Social Science)。它是目前世界上最優(yōu)秀的統(tǒng)計(jì)分析軟件之一。SPSS已廣泛應(yīng)用于自然科學(xué)和社會科學(xué)中,涉及的領(lǐng)域包括工程技術(shù)、應(yīng)用數(shù)學(xué)、經(jīng)濟(jì)學(xué)、商業(yè)、金融、生物學(xué)、醫(yī)療衛(wèi)生、體育、心理學(xué)、農(nóng)林等等甚至可以毫不夸張地說只要有需要對各種數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的地方就有SPSS的用武之地。SPSS提供的統(tǒng)計(jì)分析方法有如下幾個(gè)方面:(1) 基礎(chǔ)統(tǒng)計(jì)分析a) 描述性統(tǒng)計(jì)b) 列聯(lián)表分析c) 各種簡單的方差分析d) 回歸分析e) 相關(guān)分析f) t檢驗(yàn)g) 非參數(shù)檢驗(yàn)(2)專業(yè)統(tǒng)計(jì)分析a) 因子分析b) 聚類分析c) 距離分析(2) 高級分析a) 多變量方差分析b) 重復(fù)測量方差分析c) 多協(xié)變量方差分析d) 非線性回歸分析e) 曲線估計(jì)f) Logistic 回歸分析g) 概率單位回歸分析h) Cox 模型回歸分析3.2、原始數(shù)據(jù)說明我們的原始數(shù)據(jù)是2004年某地區(qū)10029名兒童血液中血紅蛋白(g/100ml)與微量元素(ug/100ml)測定數(shù)據(jù)。由于微量元素的測定成本高、耗時(shí)長,故希望通過聚類分析篩選出代表性指標(biāo),以便更經(jīng)濟(jì)、快捷的評價(jià)兒童的營養(yǎng)狀態(tài)。3.3、用到的數(shù)據(jù)挖掘理論知識我們運(yùn)用數(shù)據(jù)挖掘中聚類分析的知識,對原始數(shù)據(jù)進(jìn)行挖掘。希望對原始數(shù)據(jù)中的幾個(gè)測量指標(biāo)進(jìn)行分組,使得同一個(gè)組內(nèi)指標(biāo)之間具有較高的相似度,而不同組內(nèi)指標(biāo)差別較大。根據(jù)原始數(shù)據(jù)的類型以及應(yīng)用目的,我們選擇層次方法。對原始數(shù)據(jù)進(jìn)行層次分解,采用凝聚的方法,開始時(shí)將每個(gè)對象作為單獨(dú)的一個(gè)組,然后相繼的合并相近的對象和組,直到所有的組合并為一個(gè),或是達(dá)到一個(gè)中止條件。3.4、具體實(shí)施步驟建立數(shù)據(jù)文件,將原始數(shù)據(jù)輸入工具中。在工具中選擇層次聚類分析方法對原始數(shù)據(jù)進(jìn)行分析。(AnalyzeClassifyHierarchical Cluster)彈出Hierarchical Cluster Analysis對話框(如圖所示)。選擇Method,彈出Hierarchical Cluster Analysis:Method對話框(如圖所示)。在對話框中根據(jù)需要指定聚類方法、距離測度的方法、對數(shù)值進(jìn)行轉(zhuǎn)換方法,即標(biāo)準(zhǔn)化數(shù)值的方法何對測度的轉(zhuǎn)換方法。系統(tǒng)提供了7種聚類方法供用戶選擇:a) Between-groups linkage:類間平均連鎖法。合并兩類的結(jié)果使所有的兩兩項(xiàng)對之間的平均距離最小。項(xiàng)對的兩個(gè)成員分別屬于不同的類。該方法中使用的是各對之間的距離,即非最大距離,也非最小距離。b) Within-groups linkage:類內(nèi)平均連鎖法。若當(dāng)兩類合并為一類后,合并后的類中的所有項(xiàng)之間的平均距離最小。兩類間的距離即是合并后的類中所有可能的觀測量對之間的距離平方。c) Nearest neighbor:最近鄰居法。該方法首先合并最近的或最相似的兩項(xiàng),用兩類間最近點(diǎn)間的距離代表兩類間的距離。d) Furthest neighbor:最遠(yuǎn)鄰居法。用兩類之間最遠(yuǎn)點(diǎn)的距離代表兩類之間的距離。也稱之為完全連接法。e) Centroid clustering:重心法,應(yīng)與歐氏距離平方法一起使用,像計(jì)算所有各項(xiàng)均值之間的聚類那樣計(jì)算兩類之間的距離。該距離隨聚類的進(jìn)行不斷減小。f) Median clustering:中間距離法,應(yīng)與歐氏距離平方法一起使用。g) Wards method:離差平方和法,應(yīng)與歐氏距離平方法一起使用。在Measure欄中指定距離的測度方法,用兩點(diǎn)間的距離來決定是否合并兩類。距離的具體計(jì)算方法還和變量的類型有關(guān),工具提供3種變量類型:(1)等間隔測度的變量(一般為連續(xù)變量);(2)計(jì)數(shù)變量(一般為離散變量);(3)二值變量。我們這個(gè)系統(tǒng)中選擇的是連續(xù)變量,針對這種類型的變量,工具提供了8種距離測量技術(shù):a) Euclidean(歐幾里得) distance:兩觀察單位間的距離為其值差的平方和的平方根,該技術(shù)用于Q型聚類。b) Squared Euclidean distance:兩觀察單位間的距離為其值差的平方和,該技術(shù)用于Q型聚類。c) Cosine:變量矢量的余弦,這是模型相似性的度量。d) Pearson correlation:相關(guān)系數(shù)距離,適用于R型聚類(對研究對象的觀察指標(biāo)進(jìn)行分類)。e) Chebychev:兩觀察單位間得距離為其任意變量的最大絕對差值,該技術(shù)用于Q型聚類。f) Block:曼哈坦距離,即兩觀察單位間得距離為其值差的絕對值和,使用于Q型聚類。g) Minkowski(明考斯基):變量絕對值的第p次冪之和的平方根,p由用戶指定。h) Customized:變量絕對值的第p次冪之和的第r次根,p和r由用戶指定。通過SPSS工具對數(shù)據(jù)進(jìn)行層次聚類分析的結(jié)果如下:計(jì)算出原始數(shù)據(jù)各個(gè)測定指標(biāo)之間的歐氏相關(guān)系數(shù)平方矩陣,如下表所示:Case1鈣2鎂3鐵4錳5銅6血紅蛋白1鈣0.0000.9990.9980.5430.9260.9762鎂0.9990.0000.9980.5430.9260.9793鐵0.9980.9980.0000.5390.9240.9824錳0.5430.5430.5390.0000.4570.5085銅0.9260.9260.9240.4570.0000.9036血紅蛋白0.9760.9790.9820.5080.9030.000根據(jù)各變量之間的相關(guān)系數(shù)進(jìn)行類間平均鎖鏈法的合并。第一步、將鈣和鎂合并,它們之間的相關(guān)系數(shù)最大,為0.999;第二步、將鐵和第一步合并項(xiàng)進(jìn)行合并,它們之間的相關(guān)系數(shù)為(0.9980.998)/20.998;第三步、將血紅蛋白和第二步合并項(xiàng)進(jìn)行合并,它們之間的相關(guān)系數(shù)為(0.976+0.979+0.982)/30.979;第四步、將銅和第三步合并項(xiàng)進(jìn)行合并,它們之間的相關(guān)系數(shù)為(0.926+0.926+0.924+0.903)/40.920;第五步、將錳和第四步合并項(xiàng)進(jìn)行合并,它們之間相關(guān)系數(shù)最小,為(0.543+0.543+0.539+0.457+0.508)/50.518。整個(gè)凝聚過程如下圖所示:Cluster CombinedCoefficientsStage Cluster First AppearsStageCluster 1Cluster 2Cluster 1Cluster 2Next Stage11鈣2鎂0.99900221鈣3鐵0.99810331鈣6血紅蛋白0.97920441鈣5銅0.92030551鈣4錳0.518400使用更為直觀的聚類樹狀關(guān)系圖表示:由圖可見鈣、鎂、鐵、血紅蛋白和銅先聚合后再與錳聚合,鈣、鎂、鐵、血紅蛋白和銅之間的相關(guān)系數(shù)較大,這表明,在評價(jià)兒童營養(yǎng)狀態(tài)時(shí),可在微量元素鈣、鎂、鐵、銅和血紅蛋白5個(gè)指標(biāo)中選擇任意一個(gè),再加上微量元素錳即可,其效果和六個(gè)指標(biāo)都測定效果基本是等價(jià)的,但是更加經(jīng)濟(jì)快捷。3.5、對挖掘結(jié)果的修正我們已經(jīng)通過工具對原始數(shù)據(jù)的初步分析,得出了一些有價(jià)值的結(jié)論,挖掘出一些非常有價(jià)值的信息。下一步我們將把我們得出的結(jié)論和使用實(shí)際的營養(yǎng)狀況評價(jià)指標(biāo)測量的結(jié)果相比較,驗(yàn)證使用我們得出的簡化的測定指標(biāo)的測量結(jié)果和實(shí)際的結(jié)果是否一致,如果發(fā)現(xiàn)有偏差,我們將分析原因,改進(jìn)我們的方法,修正我們的結(jié)果,最終得出與實(shí)際相符,簡單實(shí)用的測定指標(biāo)。我們通過挖掘得出這樣的結(jié)論,即在評價(jià)兒童營養(yǎng)狀態(tài)時(shí),可在微量元素鈣、鎂、鐵、銅和血紅蛋白5個(gè)指標(biāo)中選擇任意一個(gè),再加上微量元素錳即可,其效果和六個(gè)指標(biāo)都測定效果基本是等價(jià)的。為了驗(yàn)證我們得出結(jié)論的正確性,我們考慮通過采樣實(shí)驗(yàn)來證明。具體的做法是:(1) 選取鈣和錳作為測量指標(biāo);(2) 統(tǒng)計(jì)鈣的測量值在前50位和后50位的被測兒童,查看對應(yīng)的鎂、鐵、銅和血紅蛋白測量值是否和鈣測量值的變化趨勢相似;(3) 再查看對應(yīng)的錳測量值和鈣測量值之間的變化趨勢(4) 得出結(jié)論。通過對測量數(shù)據(jù)的統(tǒng)計(jì),我們得到各個(gè)微量元素的測量結(jié)果的分布范圍:鈣鎂鐵錳銅血紅蛋白最小值43.6725.43258.940.000.597.00最大值86.9052.90469.800.901.9014.25平均值65.28539.165364.370.451.24510.625最小閥值49.0728.86285.300.110.757.91最大閥值81.5049.47443.440.791.7413.34最大值最小值平均值最大閥值最小閥值011/21/41/83/85/83/47/8我們對微量元素鈣的測量結(jié)果進(jìn)行統(tǒng)計(jì),分別找出排在前50位和排在后50位的被測試兒童編號,并列出其對應(yīng)的其他指標(biāo)的測量值。此表以鈣測量值的前50位來排序,其他指標(biāo)的測量值低于最大閥值的用紅色表示,使用這種方法來查看是否鈣的測量值高的時(shí)候,其他指標(biāo)的測量值也高。前50位編號鈣鎂鐵錳銅血紅蛋白471486.9052.84469.62.641.7712.00542886.9052.84469.62.641.7712.00702286.9052.84469.63.641.7712.00971586.9052.84469.63.641.7712.00339886.7052.83469.51.641.7712.00393986.7052.83469.55.641.7712.00511486.7052.83469.55.641.7712.00580486.7052.83469.52.641.7712.00841686.7052.83469.54.641.7712.0075686.6052.83469.50.641.7712.00571686.6052.82469.50.641.7712.00861886.6052.82469.46.641.7712.00878286.5052.82469.43.641.7712.00901786.5052.82469.45.641.7712.0032386.4052.81469.37.641.7712.00112686.4052.81469.38.641.7712.00448886.4052.81469.36.641.7712.00737986.4052.81469.37.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論