




付費下載
下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、輪對壓裝曲線中異常點數據的處理方法肖 峻,李光海,韓建斌(武漢理工大學 機電工程學院,湖北 武漢 430070)摘 要:為了去除輪對壓裝壓力信號中的異常點,獲得真實的壓裝曲線,提出了一種異常點數據處理算法-增量均值法,該算法結合壓裝壓力信號的特點,能較好的識別并剔除異常點數據。經過在輪對壓裝過程中的實際應用,該算法收到了較好的效果,消除了干擾對輪對壓裝曲線的影響,減少了對壓裝質量的誤判。關鍵詞:輪對壓裝曲線;異常點;增量均值法中圖分類號: TP301.65輪對是機車和車輛走行部的主要部件之一,是由一根車軸與兩個車輪以及齒輪、制動盤等組成的完整裝置。車軸與車輪、齒輪、制動盤采用過盈配合的連接方式
2、,通過壓裝的方法組成輪對。在輪軸壓裝過程中,壓裝曲線(即壓力-位移曲線)是反映壓裝質量的重要評判依據。在目前廣泛使用的數控輪對壓裝機中,壓裝壓力信號是由計算機數據采集系統(tǒng)采集到的一系列具有固定時間間隔(采樣頻率固定)的數字時序信號。理想情況下,采集到的數字時序信號與壓裝過程中的壓裝壓力是一致的,但是由于實際應用場合存在一定的干擾(突變的電、磁場或其它因素),使采集到的壓力數字時序信號夾雜有信號突變,即異常點。這些異常點并不能反映油缸壓力的真實變化,如果不對其加以剔除,會使壓裝曲線失真,造成對壓裝質量的誤判。1 異常點對壓裝曲線的影響以某一臺數控輪對壓裝機為例,其壓裝 曲線是通過壓力傳感器和位移
3、傳感器采集到的數據經過數字濾波后繪制的。圖1為某一輪對中左輪的壓裝曲線,曲線在壓裝位移大約42mm處出現了降噸凹槽,依據TB/T1718-2003鐵道車輛輪對組裝技術條件中關于輪對壓裝的判斷標準,此車輪壓裝不合格。為了尋找造成該現象的原因,需要對采集信號做進一步的分析。圖1 某一輪對的壓裝曲線在壓力-位移曲線中,將出現降噸凹槽的部分放大顯示,如圖2所示,可以看到,在42mm之前,壓力信號勻速上升,之后,有3個數據()陡然變化,由300kN降到數據(270kN),然后又急速上升到(281kN),再急速上升到(296kN)。然而,反映壓裝過程中壓裝壓力收稿日期:作者簡介:肖峻(1964),男,湖北
4、武漢人,武漢理工大學機電工程學院教授;博士.基金項目:湖北省科學技術研究與開發(fā)基金項目(201097289).的動態(tài)壓力信號是連續(xù)變化的,經過等間隔的數據采集后獲得的壓力時序信號,其數據間的變化不應該有突變。因而,可以斷定,此處數據的急速突變并不是壓裝過程中壓力變化的真實反映,而是干擾數據點,應該加以剔除。圖2 信號突變位置2 數據異常點的挖掘方法異常點產生有很多原因,根據不同的角度,可以將異常點分為如圖3所示的幾種類型。圖3 異常點分類目前,比較常用的異常點挖掘方法有以下幾大類:(1) 基于統(tǒng)計模型的挖掘方法基于統(tǒng)計模型的異常點挖掘方法,其思想主要來自于統(tǒng)計學,統(tǒng)計中常用的方法是:對于給定的
5、數據集合,先假設一個分布 (例如一個正態(tài)分布),然后根據該分布模型,采用不一致的原則對異常點進行檢驗挖掘。這種方法的缺陷在于,需要事先知道數據集數據模型、分布參數和估計的異常點的數目。由于統(tǒng)計學方法要求預先知道關于數據集合參數的知識,例如數據分布,但許多情況下,數據分布是未知的,尤其是在沒有特定檢驗的情況下,統(tǒng)計學方法不能發(fā)現所有的異常點,或者觀察到的分布情況過于特殊,不能用標準分布來建模描述。(2) 基于距離模型的挖掘方法基于距離的異常點DB(p,d)的定義:如果數據集合中至少有p部分對象與對象O的距離大于d,則對象O是一個帶參數p、d的基于距離的異常點,即DB(p,d)。由上面關于異常點的
6、定義可看出,DB(p,d)統(tǒng)一了異常點的概念,對異常點的判斷方法也比較明確,例如,設存在一個正態(tài)分布數據集,如果數據集中存在與均值之間的距離大于或等于3倍偏差的數據對象,則被認為是異常點。直觀而言,如果不依賴于統(tǒng)計檢驗,可將基于距離的異常點看作是那些沒有足夠多鄰居的對象,此處鄰居是基于給定對象之間的距離定義的目前,該領域研究人員提供了若干高效的基于距離的異常點挖掘算法,比較有代表性的是基于索引的算法、嵌套循環(huán)算法和基于單元的算法,這些算法的主要特點是以對象間的距離作為相似性度量?;诰嚯x模型的異常點挖掘方法概括了基于統(tǒng)計模型的異常點的含義,并且對相對高維數據集有較好的挖掘效果,然而,當數據集由
7、不同密度的子集混合而成時,基于距離的異常點挖掘效果不好。(3) 基于密度模型的挖掘方法Hawkwins異常點的定義如下:異常點是明顯地偏離了其他測量值,使人們對其真實性產生懷疑,懷疑它的產生機理的點。如圖4所示,為一個二維數據集的例子,該數據集包含兩個聚類C1、C2和兩個異常點O1、O2,雖然O1、O2都為異常點,但是有區(qū)別的,O1是局部異常點,O2是全局異常點。根據上面提到的算法,O2異常點特征明顯,容易挖掘,但O1異常點卻比較難挖掘出來。圖4一個二維數據集從上面的例子可看出,基于距離的異常點定義DB(p,d)在一些特定的情況下是準確和充分的,但如果數據聚類密度存在不同的單元,就會出現問題。
8、為了有效的解決這個問題,基于密度模型的局部異常點挖掘算法被提出,從而保證可以判斷出O1和O2在數據集中都是異常點?;诿芏鹊脑\斷方法引入了度量單位:局部離群系數,來表示一個數據集中數據的離群程度,正常數據的基本上都近似等于1,所以它們不是異常點。根據局部異常點的定義及其特征,可通過對數據集中的計算來確定異常點,只要一個數據對象的遠大于1,它很有可能是一個異常點,應該引起注意或者加以排除。但是,基于密度的診斷方法仍然存在一定的問題,在數據量較大時,處理時間比較長,效率比較低。(4) 基于相似度的挖掘方法數據集的相似度隨應用領域的不同,相似度的定義也不同。例如,兩個量的變化速度(斜率描述)保持一致
9、;波形允許在一定范圍內漂移、伸縮。這種診斷方法,可以大大的減少計算量,提高效率。但相似度的確定是一個難點。3 增量均值法在介紹增量均值法之前,先給出以下定義:定義1(時間序列)時間序列是一組或多組由記錄時間和記錄值共同組成的元素有序集合,記為X=,,元素表示時間序列在時刻的記錄值為,記錄時間是嚴格增加的。在本文所采用的壓力數據采集系統(tǒng)中,時間序列的采樣間隔相等(采樣周期為70ms),可以認為,此時將壓力信號時間序列簡記為。用代表時間序列中的第各元素。定義2(元素距離)元素與元素的距離是指它們的序列號之差的絕對值,記為。定義3(鄰域)壓力信號時間序列中的元素的鄰域是指以元素為中心,與的距離不超過
10、的所有元素的集合,記為。定義4(壓力增量絕對值)指壓力信號時間序列中的元素相對于其前一個采樣點的變化量的絕對值,記為。正常情況下,壓力信號是連續(xù)均勻變化的,相鄰數據的變化量在一定的范圍內。以上述車輪的壓力數據為例,將壓力數據中相鄰元素的壓力增量絕對值計算出來,如圖5所示,橫坐標為元素序列編號,縱坐標為元素相對于其前一個元素的增量絕對值。從圖5中可以看出,正常情況下,壓力增量絕對值在一定的范圍微小波動,當有外界干擾時,壓力增量絕對值陡增,超出了正常的波動范圍(10kN左右)。因此,可以通過設定適當的壓力增量絕對值閾值來識別異常點。當時,則認為為壓力數據序列中的異常點,應加以剔除。由此可見,的取值
11、是非常關鍵的。取值過小,剔除效果不明顯,異常點對壓裝曲線的影響大,從而可能導致壓裝質量的誤判。取值過大,則有可能將反映壓裝過程的真實壓力數據剔除,造成壓裝曲線失真。圖5 壓力變化量分布增量均值法定義:對于壓力時序信號中的元素,求出其鄰域內所有元素壓力增量絕對值的均值,再乘以系數來確定閾值,當時,則認為為壓力時序信號中的異常點,應加以剔除。和用公式表示為:式中:為經驗取值系數,值的確定可以通過多次的試驗來獲得。信號中的異常點去除后,可用該異常點前面的數據加上增量均值替代,即:。經過對大量壓裝壓力數據的試驗分析,最終確定,可以得到最佳的剔除效果。4 實驗結果分析對上述車輪帶有干擾的壓裝壓力數據進行
12、測試,圖6為對壓力數據中干擾區(qū)域的檢測結果,型點為檢測到的異常點。可以看到,增量均值法對壓裝壓力數據中的異常點剔除效果很好,特別是那些變化幅度很大,影響到壓裝曲線判斷的異常點,得到了有效的消除。圖6壓裝壓力信號中異常點的檢測結果異常點剔除后,再對壓裝壓力數據進行簡單的滑動平均處理,異常點對壓裝曲線的影響便被基本消除,壓裝曲線得到了正確的修正。修正后上述車輪的壓裝曲線如圖7所示。圖7 處理后上述車輪的壓裝曲線5 結論從以上的分析可以看出,增量均值法對輪對壓裝壓力數據中的異常點剔除效果明顯。增量均值法是在萊茵達法的基礎上總結出來的一種新的剔除異常點的方法,其計算方法簡便,易于計算機編程。經過在輪對
13、壓裝過程中的實際應用,收到了較好的效果,消除了由于干擾造成的對壓裝質量的誤判。參考文獻:1 鄭東.鐵路貨車輪對壓裝曲線記錄儀的 研制D.成都:西南交通大學,2003.6.2 TBT 1463-2003,機車輪對組裝技術條件 S.3 朱明.數據挖掘M.合肥:中國科技大學 出版社,2002.4 詹艷艷,陳曉云,徐榮聰.基于時間序列模式表示的異常檢測算法J.計算機應用研究,2007,24(11):78-79.5 詹艷艷,徐榮聰.時間序列異常模式的k-均距異常因子檢測J.計算機工程與應用,2009,45(9):141-145.6 楊世杰.動態(tài)測試數據中壞點處理的一種新方法-絕對均值法及應用研究J.中國
14、測試技術,2006,32(1):48-49.7 何平.剔除測量數據中異常值的若干方 法J.航空計測技術,1995(01):19-22.8 薛年喜.MATLAB在數字信號處理中的 應用M.北京:清華大學出版社,2003.9 鄭斌祥,席裕庚,杜秀華.基于離群指數的時序數據離群挖掘J.自動化學報,2004,30(1):71-76.10 高品賢.測試信號分析處理方法與程序M.成都:西南交通大學出版社,1999.A new algorithm for removing outliers from press fitting curveXIAO Jun, LI Guanghai, HAN JianbinAbstract: In order to remove outliers from press signals acquired in press fitting process, obtain true press fitting curve, a new algorithm, incremental mean algorithm is presented in this paper. According to the traits of press signals, the algorithm can distinguish
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年行業(yè)職業(yè)技能考試試卷及答案
- 氣候災害鏈式反應-洞察及研究
- 2025年數字化轉型與管理模型考試試卷及答案
- 2025年食品衛(wèi)生檢驗員資格考試試題及答案
- 2025年社會行為與心理適應性的考試試題及答案
- 2025年數學建模大賽選手備考試卷及答案
- 2025年社交媒體營銷與傳播考試試題及答案
- 新農人電商培育-洞察及研究
- 2025年汽車工程專業(yè)執(zhí)業(yè)資格考試試卷及答案
- 2025年教師資格證面試試題及答案
- 2025至2030年中國豆角絲行業(yè)投資前景及策略咨詢報告
- 消防心理測試題或答案及答案
- 全國中級注冊安全工程師考試《其他安全》真題卷(2025年)
- 南開大學-商業(yè)健康保險與醫(yī)藥產業(yè)高質量協(xié)同發(fā)展-團體補充醫(yī)療保險改革新視角-2025年3月20日
- 弱電安防施工安全培訓
- 電梯維保半年工作總結
- 12《尋找生活中的標志》(教學設計)-2023-2024學年二年級上冊綜合實踐活動魯科版
- 七年級道法下冊 第二學期 期末綜合測試卷(人教海南版 2025年春)
- 《隱身復合材料》課件
- 架橋機常見安全隱患
- 學校保潔服務投標方案(技術標)
評論
0/150
提交評論