日期:2014-11-14 14:05 點(diǎn)擊:
一、第二冊單詞詞頻統(tǒng)計(jì)情況
第二冊總共96課,每課都是1篇短文,每24課一個(gè)單元。第一單元每篇課文的篇幅大約是100個(gè)詞,第二單元每篇課文大約是140個(gè)詞,第三單元每篇課文大約是160個(gè)詞,第四單元每篇課文大約是180個(gè)詞。
小編把第二冊的全部96篇課文匯集到一個(gè)文檔里,包含每篇課文的標(biāo)題,經(jīng)ROST軟件初次統(tǒng)計(jì)分析之后,結(jié)果是:單詞總量為14535個(gè),不同的單詞數(shù)為2407個(gè),去除22個(gè)停用單詞(stopword,主要是指在搜索引擎中為了提高搜索速度、減輕網(wǎng)頁空間壓力而忽略的單詞,這類詞往往使用頻率很高,去除之之后對(duì)于文檔的意義和理解影響又不大)后不同的單詞數(shù)為2385個(gè);其中,縮略形式也忽略不計(jì)的,如can’t、He’s、You’ll、We’re等。
因?yàn)檐浖旧淼木窒扌裕ū热绮环执笮?、不區(qū)分同一單詞的不同形式等),這2385個(gè)單詞其實(shí)還需要進(jìn)一步的篩選。比如,這些詞中有不少人名或機(jī)構(gòu)名稱,都可以忽略;還有一些單詞,其實(shí)是同一單詞的不同形式,軟件把這些詞都算作不同的單詞。為此,小編又手工對(duì)這些單詞進(jìn)行了歸并篩選,歸并篩選的幾條原則是:
1、人名、地名、機(jī)構(gòu)名恢復(fù)首字母大寫,并且歸為一類;
2、同一動(dòng)詞的不同形式歸并為一個(gè)單詞,但會(huì)加備注,把該動(dòng)詞在第二冊里出現(xiàn)的各種形式都羅列出來,如go、goes、went、going、gone;
3、名詞的單數(shù)和復(fù)數(shù)形式都?xì)w并為一個(gè)單數(shù)形式;
4、如果幾個(gè)詞根相同但因?yàn)樾问讲煌~性或者意義不同的單詞則保留其不同形式的單詞,如amused(覺得好笑的)和amusing(令人發(fā)笑的);
5、形容詞和副詞的比較級(jí)和最高級(jí)都不做歸并,算作不同的單詞;
6、be動(dòng)詞的各種形式考慮到其用法差異和頻率,也不做歸并;
7、通過加-ly構(gòu)成的副詞,與其形容詞形式算作一個(gè)單詞,但如果加了-ly之后,意思發(fā)生改變的,則同時(shí)保留其形容詞和副詞形式,算作兩個(gè)不同的單詞,如simple(簡單的)和simply(僅僅)。
按照以上原則,把這2385個(gè)單詞進(jìn)行歸并篩選之后,單詞總數(shù)為1962個(gè),請看以下圖表:
思源教育(原上海交大思源進(jìn)修學(xué)院,簡稱思源教育)成立于1996年,自建校以來,秉承交大校訓(xùn),依托名校師資,提供專業(yè)的托班輔導(dǎo)、青少年英語輔導(dǎo)、小學(xué)輔導(dǎo)、初中輔導(dǎo)、高中輔導(dǎo)、高考高復(fù)、三校生高復(fù)、藝考生文化課等,學(xué)生遍及全市各區(qū),至今已幫助六萬多余名學(xué)子取得優(yōu)異成績,成功考入理想的各級(jí)院校!20余年來思源已成為“中考教學(xué)研究中心”、“中學(xué)個(gè)性化學(xué)習(xí)教育基地”、“快速學(xué)習(xí)法”實(shí)驗(yàn)學(xué)校。
021-64680311 思源教育徐匯校區(qū)
(詳情請點(diǎn)擊) 徐匯區(qū)南丹東路238號(hào)2層62932552/62932882 思源中高考學(xué)習(xí)中心
(詳情請點(diǎn)擊) 徐匯區(qū)華山路1988號(hào)匯銀大廈北樓6樓619室32035781/62581699 徐匯三校生高復(fù)校區(qū)
(詳情請點(diǎn)擊) 徐匯區(qū)廣元西路12號(hào)(工商銀行隔壁)上海思源教育微信平臺(tái)
上海思源教育三校生高復(fù)平臺(tái)
Copyright ? siyuanedu.com 上海徐匯區(qū)思源教育培訓(xùn)中心 滬ICP備11008344號(hào)