Python 分析 35 年的考研英语真题词汇,解读孑立的考研大军!163_…

翻开网易新闻 查看精彩图像

翻开网易新闻 查看精彩图像

作者 | 阿广
责编 | 郭芮
咱们逐渐长大,从一初步的初生牛犊不怕虎到逐渐惧怕孑立,从一初步的单打独斗到逐渐合群躲避孑立。不巧的是,考研就是一个孑立修炼的作业,没有任何人可以去 你,所以二十出头的咱们,从“牛*吊炸天,我要改动全世界”逐步蜕变成“我要习气这个世界,我要习气孑立”。曩昔老是赶赴一场又一场热烈,在觥筹交错间,推杯换盏时,说一些违心的话,做一些违心的事,逐渐失掉自我。期望,酒阑人散后,剩下的只需空无落寞;期望,灯火衰退处,留下是考研最夸姣的回想。

翻开网易新闻 查看精彩图像

数据介绍
这篇文章计算的目标为1980年以来英语试卷所包括的词汇,并对其进行了分析和总结。

翻开网易新闻 查看精彩图像

翻开网易新闻 查看精彩图像

完成进程
1、加载基础词汇
bw = open(‘data/basic_words.txt’)basicwords = []for eachline in bw: basicwords.append(sw.simplify_word(re.split(“[^a-za-z]”, eachline)[0].lower())) #print re.split(“[^a-za-z]”, eachline)[0]print(len(list(set(basicwords))))basicwords = list(set(basicwords))
2、加载超纲词汇
notindagang = np.zeros(33)chaogangword = {}for j in range(33): for k in wy.eywords[j]: if k not in dw.dagangwords and k not in bw.basicwords: #notindagang[j] += 1 if chaogangword.has_key(k): chaogangword[k] += 1 else: chaogangword[k] = 1for j in range(33): for k in wy.eywords[j]: if k not in dw.dagangwords and k not in bw.basicwords: if chaogangword[k] <= 2: notindagang[j] += 1chaogangword = sorted(chaogangword.iteritems(), key = lambda e:e[1], reverse = true)print(‘chaogangword =’,chaogangword)pnotindagang = [float(x) / len(wy.eywords[i]) for i,x in enumerate(notindagang)]
3、词汇分析
def simplify_word(a): #假定现已可以判别是名词,动词,描述词,副词,连词 if enumerate.is_noun(a) or enumerate.is_verb(a) or enumerate.is_adjective(a) or enumerate.is_adverb(a) or enumerate.is_connective(a): return a try:#查验是不是为动词,假定是则回来 enumerate.is_verb(enumerate.verb.present(a)) return enumerate.verb.present(a) except:#否则持续查看 pass #查验是不是是名词 if enumerate.is_noun(enumerate.noun.singular(a)): return enumerate.noun.singular(a) otherwordlist.append(a) #print a return a
4、加载大纲词汇
dagang = open('data/5495大纲词汇.txt')dagangwords = []for eachline in dagang:

dagangwords.append(sw.simplify_word(re.split("[^a-za-z]", eachline)[0].lower())) #print re.split("[^a-za-z]", eachline)[0]print(len(list(set(dagangwords))))dagangwords = list(set(dagangwords))

5、考研英语真题单词数据可视化
x33 = 1980*np.ones(33)+range(33)x32 = 1981*np.ones(32)+range(32)plt.figure('wordeachyear')plt.plot(x33,wy.eywords_volume,'r--o',alpha = 0.5)plt.grid(true)plt.show()plt.figure('notindagang')plt.plot(x33,cgw.notindagang,'o-', alpha = 0.5)plt.grid(true)plt.show()plt.figure('wn')plt.plot(wy.eywords_volume,cgw.pnotindagang,'bo')plt.show()plt.figure('pchaogang')plt.plot(x33,cgw.pnotindagang,'o-', alpha = 0.5)plt.grid(true)plt.show()plt.figure('notinpast')plt.bar(x33,nip.words_not_in_the_past, color = 'green', alpha = 0.5)plt.grid(true)plt.show()plt.figure('wordsappearlasttime')plt.plot(x32, walt.es, 'b--o', alpha = 0.5)plt.grid(true)plt.show()plt.figure('pwordsappearlasttime')#plt.axes([1980, 2013 , 0.35 ,0.6])plt.plot(x32, walt.esr1, 'r-o')plt.plot(x32, walt.esr2, 'b--o', alpha = 0.4)plt.plot(x32, walt.esr3, 'y--o', alpha = 0.4)plt.grid(true)plt.show()

翻开网易新闻 查看精彩图像

考研英语真题词汇计算成果
1、第i+1年呈现的从1980~i年间从未呈现过的单词:

翻开网易新闻 查看精彩图像

2、第一年真题中呈现的单词数:

翻开网易新闻 查看精彩图像

3、每一年都呈现的单词:
and, have, other, most, last, all, year, way, hi, like, because, your, new, know, english, chinese, if, you, they, this, give, people, he, not, many, question, from, into, such, work, over, would, make, translation, up, in, no, then, an, will, some, section, we, with, these, it, there, which, by, so, one, when, do, those, can, four, be, that, must, of, say, should, than, a, become, at, write, who, on, the, only, to, but, about, or, for
4、相邻年份考研真题词汇重复数:

翻开网易新闻 查看精彩图像

5、相邻年份考研真题词汇重复率:

翻开网易新闻 查看精彩图像

6、核算35年来真题词汇超纲率:

翻开网易新闻 查看精彩图像

7、拟合:

翻开网易新闻 查看精彩图像

翻开网易新闻 查看精彩图像

翻开网易新闻 查看精彩图像

写在最终
韶光如光阴似箭,世事如沧海桑田。转眼间,咱们也迎来了继高考以来第次抉择命运的战争——考研。
“考研是孑立的,孑立两个字拆开,有孩童,有瓜果,有小犬,有蚊蝇,足以撑起一个那年盛夏傍晚的巷子口,情面味十足。稚儿擎瓜柳蓬下,细犬逐蝶深巷中。人世富贵多笑语,唯我空闲两鬓清风。孩童、生果、猫、狗、飞蝇当然热烈,可都与你无关,这就叫孑立,这就叫考研。”
我问了我考研同学的成果了,只说了一句:“来,再开一局”……用四个字描述考完研后的自个:“重在参加”。我现已用了四年的时刻证明晰自个不是读书的这块料,但学校没有扔掉我,给了我最终三天,让我证明晰我自个,的确不是读书这块料。考研就像参加超级女人,能坚持到最终的都是纯爷们!考研英语,单词几乎是研考生心里永久的痛,本年又考倒了一大片,何须老是拿外国话来为难自个的同胞呢?考研的都是勇士,考上去的是上士,考下去的是下士,还站着的是兵士,考躺下的是勇士!
注:以上均为段子,期望每一位考研人本周六周日过过过!
作者:阿广,这篇文章首发于自个大众号「视学算法」。「视学算法」是专心于大数据、人工智能和算法的学习平台,也是一个保送中科院软件研讨所直博生的自留地。人生苦短,我愿做您最忠诚的技能撑持火伴!一同用代码改动世界!声明:这篇文章为作者投稿,版权归作者一切。
热 文 推 荐
美团回答大规划裁员;ofo 戴威要为欠钱担任;高通需求禁售 iphone x 系列 | 极客头条
惊了!ai 人才需要两年暴升 35 倍,均匀月薪 30k!
不止操作体系,智能手机才更需要开源!
刚发布!python 一二线城市月薪 15k 起!12 月再夺言语第一
程序员真的都不爱炫富吗?
elastic:beyond search!
会玩! 比特币欺诈办法晋级, 从要钱到要命!
特斯拉加速“国产化”,上海工厂一期缔造曝光

翻开网易新闻 查看精彩图像

print_r(‘点个赞吧!’);var_dump(‘点个赞吧!’);nslog(@”点个赞吧!”);system.out.println(“点个赞吧!”);console.log(“点个赞吧!”);print(“点个赞吧!”);printf(“点个赞吧!\n”);cout << “点个赞吧!” << endl;console.writeline(“点个赞吧!”);fmt.println(“点个赞吧!”);response.write(“点个赞吧!”);alert(“点个赞吧!”)echo “点个赞吧!”

翻开网易新闻 查看精彩图像

评论