基于關(guān)聯(lián)規(guī)則算法的高職英語(yǔ)教學(xué)中的分析研究論文
摘 要:本文重點(diǎn)討論數(shù)據(jù)挖掘算法在高職英語(yǔ)教學(xué)中的應(yīng)用和研究,文中以無(wú)錫科技職業(yè)學(xué)院為模型,采用關(guān)聯(lián)規(guī)則算法挖掘該校所屬學(xué)生在三個(gè)學(xué)期之內(nèi)的英語(yǔ)成績(jī)的分布和相關(guān)影響結(jié)果。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則算法;英語(yǔ)教學(xué)
1 引言
近年來(lái),隨著中國(guó)社會(huì)經(jīng)濟(jì)的飛速發(fā)展,市場(chǎng)經(jīng)濟(jì)體制的不斷完善,特別是加入WTO后,使中國(guó)企業(yè)有更多的機(jī)會(huì)在全球發(fā)達(dá)的市場(chǎng)中展示實(shí)力和發(fā)展自己的事業(yè),實(shí)現(xiàn)了跨國(guó)經(jīng)營(yíng)。國(guó)際大學(xué)英語(yǔ)人才在社會(huì)經(jīng)濟(jì)發(fā)展中的作用也因此越來(lái)越受到各類(lèi)企事業(yè)單位的重視。可是,市場(chǎng)對(duì)大學(xué)英語(yǔ)人才的需求是多元化的,它不僅需要傳統(tǒng)意義上的“學(xué)術(shù)型”人才,更需要“技術(shù)型”,“技能型”應(yīng)用人才。為此,我們必須探討符合時(shí)代發(fā)展要求的人才培養(yǎng)模式,否則高職大學(xué)英語(yǔ)就不能形成自己的特色,就無(wú)法建立起有別于普通高職“大學(xué)英語(yǔ)”的課程模式。“從而不會(huì)具有很強(qiáng)的生命力,也就沒(méi)有它發(fā)展的空間,甚至失去它作為一種高等教育類(lèi)型存在的意義。”
本文研究的重點(diǎn)是探討具有高職大學(xué)英語(yǔ)課程教學(xué)中關(guān)于數(shù)據(jù)挖掘算法在應(yīng)用課程目標(biāo)、課程內(nèi)容,師資隊(duì)伍、教學(xué)方法、教學(xué)評(píng)價(jià)中所做的工作,這些是體現(xiàn)高職大學(xué)英語(yǔ)課程特色的關(guān)鍵所在。
2 關(guān)聯(lián)規(guī)則挖掘的建構(gòu)
關(guān)聯(lián)規(guī)則挖掘是尋找數(shù)據(jù)項(xiàng)中的有趣聯(lián)系,決定哪些事情將一起發(fā)生。關(guān)聯(lián)規(guī)則挖掘研究是近幾年研究較多的數(shù)據(jù)挖掘方法,在數(shù)據(jù)挖掘各種方法中應(yīng)用的也最廣泛關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)可以分成兩個(gè)步驟:首先發(fā)現(xiàn)所有頻繁項(xiàng)集,然后用這些頻繁項(xiàng)集生成強(qiáng)關(guān)聯(lián)規(guī)則。Apriori算法是經(jīng)典的頻繁項(xiàng)目集生成算法,在數(shù)據(jù)挖掘界起著里程碑的`作用,它的基本思想是利用一個(gè)層次順序搜索的迭代方法來(lái)生成頻繁項(xiàng)集,即利用K-項(xiàng)集來(lái)生成(K+1)-項(xiàng)集,用候選項(xiàng)集Ck找頻繁項(xiàng)集Lk。這個(gè)方法要求多次掃描可能非常大的交易數(shù)據(jù)庫(kù)。而用于關(guān)聯(lián)規(guī)則挖掘的事物數(shù)據(jù)庫(kù)的規(guī)模通常是非常大的,這樣一來(lái),開(kāi)銷(xiāo)就非常大。而在有限的內(nèi)存容量下,系統(tǒng)I/O負(fù)載相當(dāng)大,每次掃描數(shù)據(jù)庫(kù)的時(shí)間就會(huì)很長(zhǎng),這樣,其效率就非常低。
關(guān)聯(lián)規(guī)則挖掘的任務(wù)就是在事務(wù)數(shù)據(jù)庫(kù)D中找出具有用戶(hù)給定的最小支持度和最小置信度的強(qiáng)關(guān)聯(lián)規(guī)則。強(qiáng)關(guān)聯(lián)規(guī)則對(duì)應(yīng)的項(xiàng)集必定是頻繁項(xiàng)集,而頻繁項(xiàng)集導(dǎo)出的關(guān)聯(lián)規(guī)則的置信度又可由頻繁項(xiàng)集和的支持率計(jì)算。于是,可以將關(guān)聯(lián)規(guī)則挖掘分解為以下兩個(gè)步驟:
步驟一:根據(jù)最小支持度找出D中所有的頻繁項(xiàng)集。
步驟二:根據(jù)頻繁項(xiàng)目集和最小置信度產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。
在上述兩個(gè)步驟中,步驟一的任務(wù)是迅速高效地找出D中全部的頻繁項(xiàng)集,關(guān)聯(lián)規(guī)則挖掘的整體性能由該步驟決定。因此,目前所有的關(guān)聯(lián)規(guī)則挖掘算法都集中在步驟一的研究上。步驟二是比較容易實(shí)現(xiàn)的,首先對(duì)于每個(gè)頻繁項(xiàng)集l,產(chǎn)生l的所有非空子集。然后對(duì)于每個(gè)l的非空子集s,如果,則輸出規(guī)則“s=>(l-s)”。
關(guān)聯(lián)算法如下:
輸入:交易數(shù)據(jù)庫(kù)D;最小支持度min_sup
輸出:交易數(shù)據(jù)庫(kù)D的頻繁項(xiàng)集L
1)L1={頻繁1項(xiàng)集};
2)for(k=2;Lk-1≠;k++) {
3) Ck=Apriori-gen(Lk-1,min_sup);//新的候選項(xiàng)目集
4) for 所有事務(wù)t∈D {
5) Ct=subset(Ck,t);//t中所包含的候選
6) for 所有候選c∈Ct
7) c.count++;
8) }
9) Lk={c∈Ck│c.count≥minsup}
10) }
11)return L=∪kLk
3 挖掘結(jié)果
下表1是學(xué)院2007級(jí)學(xué)生入學(xué)以來(lái)三次大學(xué)英語(yǔ)的成績(jī),在數(shù)據(jù)挖掘階段,先用前述的算法掃描數(shù)據(jù)庫(kù),得到最小支持度閾值min_sup的全體頻繁項(xiàng)集,再由頻繁項(xiàng)集導(dǎo)出規(guī)則知識(shí),最后,對(duì)挖掘結(jié)果加以解釋并轉(zhuǎn)換成易于理解的顯式知識(shí)。
表1 學(xué)生英語(yǔ)成績(jī)樣本
xh
k1
k2
k3
100072351
86
85
75
100072352
88
82
69
100072353
81
86
79
100072354
84
85
77
100072355
78
85
83
100072356
82
87
84
100072357
65
83
89
實(shí)例的運(yùn)行結(jié)果與分析:假定取事務(wù)數(shù)為10。要對(duì)表中的優(yōu)秀課程進(jìn)行關(guān)聯(lián)規(guī)則挖掘,需要給出支持度和置信度。假定最小支持度為30%,置信度為50%。由上述分析得知,計(jì)算最終頻繁項(xiàng)集的各非空子集的置信度,刪除小于最小置信度閾值的記錄,最終產(chǎn)生關(guān)聯(lián)規(guī)則:
(1) k1,k2同時(shí)優(yōu)秀時(shí),k3有大于67%的優(yōu)秀的可能;
(2) k1,k3同時(shí)優(yōu)秀時(shí),k2有大于100%的優(yōu)秀的可能;
(3) k2,k3同時(shí)優(yōu)秀時(shí),k1有大于100%的優(yōu)秀的可能;
(4) k1優(yōu)秀時(shí),k2,k3有大于67%同時(shí)優(yōu)秀的可能;
(5) k3優(yōu)秀時(shí),k1,k2有大于80%同時(shí)優(yōu)秀的可能。
參考文獻(xiàn):
[1]邵峰晶、于忠清著.數(shù)據(jù)挖掘原理與算法[M].中國(guó)水利水電出版社,2008.8
[2]Robert Grossman.The Terabyte Challenge Disyte Challenge Discoverying Informationin Distributed and Massive Data[J]. American Association forArtificial Intelligence.CaliL 1991.
[3]林宇等著.數(shù)據(jù)倉(cāng)庫(kù)原理與實(shí)踐[M].人民郵電出版社,2008.1
【基于關(guān)聯(lián)規(guī)則算法的高職英語(yǔ)教學(xué)中的分析研究論文】相關(guān)文章:
基于遺傳算法的優(yōu)化設(shè)計(jì)論文04-22
《中醫(yī)婦科學(xué)》證素診斷中關(guān)聯(lián)規(guī)則的運(yùn)用論文01-29
高職英語(yǔ)教學(xué)中記憶標(biāo)識(shí)作用論文07-23
基于微信平臺(tái)的高職英語(yǔ)教學(xué)設(shè)計(jì)探討論文07-19
關(guān)于高職英語(yǔ)教學(xué)中遺忘規(guī)律研究的論文07-23
高職英語(yǔ)教學(xué)中培養(yǎng)學(xué)生的關(guān)鍵能力論文06-29
CCD測(cè)量系統(tǒng)中基于自適應(yīng)相關(guān)算法的動(dòng)態(tài)目標(biāo)跟蹤的論文06-16