- 相關(guān)推薦
理工類開題報(bào)告范文
在現(xiàn)實(shí)生活中,我們使用報(bào)告的情況越來越多,其在寫作上有一定的技巧。你所見過的報(bào)告是什么樣的呢?下面是小編為大家整理的理工類開題報(bào)告范文,歡迎大家借鑒與參考,希望對大家有所幫助。
一、論文的研究內(nèi)容
論文的研究內(nèi)容包括兩個(gè)方面:一是研究新的高效的聚類算法;一是把已有的聚類算法或論文提出的新算法和入侵檢測技術(shù)相結(jié)合,從而提出一個(gè)好的入侵檢測模型。具體的研究內(nèi)容包括以下幾個(gè)點(diǎn):
第一、針對聚類算法的研究問題:
1、如何提高算法的可擴(kuò)展性
許多聚類算法在小于200個(gè)數(shù)據(jù)對象的小數(shù)據(jù)集上是高效率的,但是無法處理一個(gè)大規(guī)模數(shù)據(jù)庫里的海量對象。現(xiàn)有的聚類算法只有極少數(shù)適合處理大數(shù)據(jù)集,而且只能處理數(shù)值型數(shù)據(jù)對象,無法分析具有類屬性的數(shù)據(jù)對象。
2、如何處理離群點(diǎn)
在實(shí)際應(yīng)用中,估計(jì)數(shù)據(jù)集中的離群點(diǎn)可能是非常困難的,很多算法通常丟棄增長緩慢的簇,這樣的簇趨向于代表離群點(diǎn)。然而在某些應(yīng)用中,用戶可能對相對較小的簇比較感興趣,比如入侵檢測中,這些小的簇可能代表異常行為,那么我們需要考慮在對算法影響更小的前提下,如何更好的處理這些離群點(diǎn)。
3、研究適合具有類屬性數(shù)據(jù)的聚類算法的有效性
對聚類分析而言,有效性問題通?梢赞D(zhuǎn)換為最佳類別數(shù)k的決策。而目前有關(guān)聚類算法的有效性分析,大都集中在對數(shù)值數(shù)據(jù)的聚類方式分析上。對于具有類屬性的數(shù)據(jù)聚類,還沒有行之有效的分析方法。
第二、針對聚類算法在ids應(yīng)用中的研究問題:
1、如何結(jié)合聚類技術(shù)和入侵檢測技術(shù)取得更好的效果
很多的聚類算法都已經(jīng)和ids應(yīng)用環(huán)境結(jié)合起來了,很多研究者對前人提出的算法作出改進(jìn)后,應(yīng)用到ids系統(tǒng)中去,或者提出一個(gè)全新的算法來適應(yīng)ids的要求。隨著聚類技術(shù)的不斷發(fā)展,聚類技術(shù)在入侵檢測中的應(yīng)用將是一個(gè)很有前景的工作。我們需要把更好的聚類技術(shù)成果應(yīng)用到入侵檢測中。
2、利用聚類技術(shù)處理入侵檢測中的頻繁誤警
雖然入侵檢測是重要的安全措施,然而它常常觸發(fā)大量的誤警,使得安全管理員不堪重負(fù),事實(shí)上,大量的誤警是重復(fù)發(fā)生并且頻繁發(fā)生的,可以利用聚類技術(shù)來尋找導(dǎo)致ids產(chǎn)生大量誤警的本質(zhì)原因。
二、學(xué)位論文研究依據(jù)
學(xué)位論文的選題依據(jù)和研究意義,以及國內(nèi)外研究現(xiàn)狀和發(fā)展趨勢
聚類分析研究已經(jīng)有很長的歷史,其重要性及其與其他研究方向的交叉特性已經(jīng)得到了研究者的充分肯定。對聚類算法的研究必將推動相關(guān)學(xué)科向前發(fā)展。另外,聚類技術(shù)已經(jīng)活躍在廣泛的應(yīng)用領(lǐng)域。作為與信息安全專業(yè)的交叉學(xué)科,近年來,聚類算法在入侵檢測方面也得到大量的應(yīng)用。然而,聚類算法雖取得了長足的發(fā)展,但仍有一些未解決的問題。同時(shí),聚類算法在某些應(yīng)用領(lǐng)域還沒有充分的發(fā)揮作用,聚類技術(shù)和入侵檢測技術(shù)結(jié)合得還不夠完善。在這種背景下,我們認(rèn)為,論文的選題是非常有意義的。
本論文研究的內(nèi)容主要包括兩個(gè)方面:聚類算法的研究以及聚類算法在入侵檢測中的應(yīng)用。下面從兩個(gè)方面闡述國內(nèi)外這兩個(gè)方面的發(fā)展現(xiàn)狀和趨勢:
前人已經(jīng)提出很多聚類算法,然而沒有任何一種聚類算法可以普遍適用于揭示各種多維數(shù)據(jù)集所呈現(xiàn)出來的多種多樣的結(jié)構(gòu),根據(jù)數(shù)據(jù)在聚類中的積聚規(guī)則以及應(yīng)用這些規(guī)則的方法,可以將聚類算法分為以下幾種:
1.劃分聚類算法
劃分聚類算法需要預(yù)先指定聚類數(shù)目或聚類中心,通過反復(fù)迭代運(yùn)算,逐步降低目標(biāo)函數(shù)的誤差值,當(dāng)目標(biāo)函數(shù)收斂時(shí),得到最終的聚類結(jié)果,劃分聚類算法典型代表是k-means算法[1]和k-modoids算法。這些算法處理過程簡單,運(yùn)行效率好,但是存在對聚類數(shù)目的依賴性和退化性。迄今為止,許多聚類任務(wù)都選擇這兩個(gè)經(jīng)典算法,針對k-means及k-modoids的固有弱點(diǎn),也出現(xiàn)了的不少改進(jìn)版本。
2.層次聚類算法
又稱樹聚類算法,它使用數(shù)據(jù)的聯(lián)接規(guī)則,透過一種層次的架構(gòu)方式,反復(fù)將數(shù)據(jù)進(jìn)行分裂和聚合,以形成一個(gè)層次序列的聚類問題解。由于層次聚類算法的計(jì)算復(fù)雜性比較高,所以適合于小型數(shù)據(jù)集的聚類。20xx年,gelbard等人有提出一種新的層次聚合算法,稱為正二進(jìn)制方法。該方法把待分類數(shù)據(jù)以正的二進(jìn)制形式存儲在二維矩陣中,他們認(rèn)為,將原始數(shù)據(jù)轉(zhuǎn)換成正二進(jìn)制會改善聚類結(jié)果的正確率和聚類的魯棒性,對于層次聚類算法尤其如此。kumar等人[9]面向連續(xù)數(shù)據(jù)提出一種新的基于不可分辨粗聚合的層次聚類算法,既考慮了項(xiàng)的出現(xiàn)次序又考慮了集合內(nèi)容,該算法能有效挖掘連續(xù)數(shù)據(jù),并刻畫類簇的主要特性。
3.基于密度-網(wǎng)格的聚類算法
與傳統(tǒng)的聚類方法不同:基于密度的聚類算法,通過數(shù)據(jù)密度來發(fā)現(xiàn)任意形狀的類簇;基于網(wǎng)格的聚類算法,使用一個(gè)網(wǎng)格結(jié)構(gòu),圍繞模式組織由矩形塊劃分的值空間,基于塊的分布信息實(shí)現(xiàn)模式聚類,基于網(wǎng)格的聚類算法常常與其他方法相結(jié)合,特別是與基于密度的聚類方法相結(jié)合;诰W(wǎng)格和密度的聚類方法在以空間信息處理為代表的眾多領(lǐng)域有著廣泛的應(yīng)用。特別是伴隨著近來處理大規(guī)模數(shù)據(jù)集、可伸縮的聚類方法的開發(fā),它在空間數(shù)據(jù)挖掘研究子域日趨活躍。