标签: 2021英语高考甲卷

今年高考英语AI得分134复旦武大校友这项研究有点意思

在2018-2021年的10套真题测试中,AI的分数都在125分以上,最高纪录为138.5分,听力和阅读理解还拿过

它的参数量只有GPT-3的16分之一,平均成绩却比GPT-3高出15分。

其背后的秘诀名叫重构预训练(reStructured Pre-training),是作者提出的一种新学习范式。

具体来看,就是把、YouTube等平台的信息重新提取重构,再喂给AI进行训练,由此让AI具有更强的泛化能力。

作者认为,这个世界上有价值的信息无处不在,而目前的AI系统并没有充分利用数据中的信息。

比如像,Github,里面包含了各种可以供模型学习的信号:实体,关系,文本摘要,文本主题等。这些信号之前由于技术瓶颈都没有被考虑。

所以,作者在本文中提出了一种方法,可以用神经网络统一地存储和访问包含各种类型信息的数据。

他们以信号为单位、结构化地表示数据,这很类似于数据科学里我们常常将数据构造成表或JSON格式,然后通过专门的语言(如SQL)来检索所需的信息。

比如在“莫扎特生于萨尔茨堡”这句话中,“莫扎特”、“萨尔茨堡”就是信号。

然后,就需要在各种平台上挖掘数据、提取信号,作者把这个过程比作了从矿山里寻宝。

接下来,利用prompt方法,就能将这些来自不同地方的信号统一成一种形式。

这样一来,该研究就能从10个数据源中,统一26种不同类型的信号,让模型获得很强的泛化能力。

结果表明,在多个数据集中,RST-T、RST-A零样本学习的表现,都优于GPT-3的少样本学习性能。

他们表示,现在很多工作方法走的都是汉化GPT-3的思路,在评估的应用场景上也是跟随OpenAI、DeepMind。

基于对当下AI模型发展的观察,作者认为可以开辟出一条新的赛道试试,所以就想到了用高考给AI练练手。

从测试结果可以看到,Qin绝对是学霸级别了,10套卷子成绩都高于T0pp和GPT-3。

他们觉得当下很多评价基准的任务都很单一,大多没有实用价值,和人类情况对比也比较困难。

而高考题目既涵盖了各种各样的知识点,还直接有人类分数来做比对,可以说是一箭双雕了。

如果从更深层次来看,作者认为,重构预训练或许会成为NLP的一种新范式,即把预训练/微调过程视为数据存储/访问过程。

但是基于当下对NLP发展的观察,他们认为或许之后可以以一种data-centric的方式来看待问题。

也就是,预训/精调、few-shot/zero-shot等概念的差异化会更加模糊,核心只关注一个点——

其中的核心思想是,技术发展方向总是顺着这样的——做更少的事实现更好、更通用的系统。

作者认为,NLP经历了特征工程、架构工程、目标工程、提示工程,当下正在朝着数据工程方向发展。

论文的通讯作者为卡内基梅隆大学语言技术研究所(LTI)的博士后研究员刘鹏飞。

他于2019年在复旦大学计算机系获得博士学位,师从邱锡鹏教授、黄萱菁教授。

博士期间,他包揽了各种计算机领域的奖学金,包括IBM博士奖学金、微软学者奖学金、腾讯人工智能奖学金、百度奖学金。

值得一提的是,刘鹏飞在和我们介绍这项工作时,直言“最初我们就没打算拿去投稿”。

我们决定把这篇论文当作一个故事来讲,并给“读者”一种看电影的体验。这也是为什么我们在第三页,设置了一个“观影模式“的全景图。就是为了带着大家去了解NLP发展的历史,以及我们所展望的未来是怎样的,让每一个研究者都能有一定的代入感,感受到自己去带领着预训练语言模型们(PLMs)通过矿山寻宝走向更好明天的一个过程。

No Comments

Categories: LOL投注网站

Tags:

秒杀语法填空(3)2021高考英语全国乙卷 单词语法一网打尽

今天是秒杀语法填空的第三弹,我们先用秒杀的方法做一遍,再从头分析一下句子结构,知其然,知其所以然!

(共10小题:每小题1.5分,满分15分)阅读下面短文,在空白处填入1个适当的单词或括号内单词的正确形式。

1.本句为主从复合句,主句主系表结构,主语为西安古城墙,是保存得最完整的城墙。

4.survive v.幸存;生存;存活;继续存在;幸免于难;艰难度过;比…活(或存在)的时间长。

3.第一个分句,挖空处给了一个动词,主语是it,这里一个是被动语态,被建造,而且是过去被建造因此是was built。

5.下一个空的挖空处后面跟了一个朝代,因为前面介绍古城墙被建造,推测后面肯定是时间状语,在朝代(时间段)前用in,在具体时间点用on,这里是用in。

6.第二个分句是现在完成时被动语态,它现在已经(被)完成修复了。这也是我们推测第一个空是被动语态一个题眼。也算是一个验证吧。

3.第二分句主谓宾补结构,你看可以到到人流移动,现在分词moving作伴随状语

6.see sb doing看到某人做某事,现在分词作宾语补足语,形容宾语的状态

1.主从复合句,主句为我们决定,后跟了一个省略了that的宾语从句作decide的宾语

3.after+动名词做时间状语,第一个空给了一个动词spend作提示,介词后跟名词性质的词,所以需要转换为动名词,叫谓语非谓语转换

7.第二部分what感叹句,省略了成分。从答题角度,我们看到后面的than其实就可以想到这里需要一个比较级,给的提示是good,比较级为better。

2.叙述时态为过去时,此处挖空给了提示动词hire,所以此处应该填写动词的过去式hired,动词时态转换

2.我们可以看到前半部分的谓语是系动词was,后面又出现了一个动词did,如果这里没有从句的话,就说明他们是并列谓语。

3.挖空处没有给提示也告诉我们这里需要填一个连词,前面说我租的那辆自行车又老又摇摇晃晃,后面却又说还能工作。这里面就是一个转折关系的并列连词,but。

2.挖空处all( )way,这里是一个习惯用语一路(强调距离),all the way,挖空处填的是定冠词the

4.at介词短语作地点状语,在哪里停下来了呢?在不同的门和瞭望搭处停下来了,这里挖空处给了一个名词,因为前面的门用了复数gates,那么这里也应该是复数形式watchtowers

5.不定式作目的状语,为什么停下来呢?为了拍照片,或者是只是为了看看当地人们是怎么过他们的一天的。

7.routine n.常规;正常顺序;生活乏味;无聊;(演出中的)一套动作,一系列笑话(等);例行程序。

No Comments

Categories: LOL投注网站

Tags:

2021年高考英语全国甲卷试卷分析

试卷难度适中,相对稳定,注重基础知识和语篇逻辑。坚持“方向是核心,平稳是关键”的原则,依据普通高中英语课程标准和高考评价体系,强调关键能力考查,稳步推进高考考试内容改革,充分发挥高考育人功能和积极导向作用。

听力:听力的录音材料既涵盖学生十分熟悉的日常话题,也包括一些具有挑战性的话题。

阅读理解:阅读理解部分,既有相对易读的文章,如黑犀牛的保护和繁育,也有较高难度的科普议论性文章,如人们对天才标准认知的变化等。在语篇语言难度方面,在坚持保留原语篇文本基本风格的前提下,尽力减少过多文化背景、生词、长难句等因素的影响,使文本行文流畅、表达清楚。

这是一篇说明文。文章介绍了通过衣物交换来处理旧衣服的方法——衣物交换派对,以及一 些具体的流程。

这是一篇记叙文。文章主要讲了 Burchill 住酒店时,给朋友携带的意大利香肠招来了海鸥, 海鸥在逃跑的过程中,造成了一些东西的损坏,Burchill 间接给酒店造成了损失。酒店把Burchill 列入了黑名单,Burchill 被终身禁止入住该酒店。Burchill 诚恳地写了道歉信,请求酒店重新考虑自己被终身禁止入住酒店的决定。最终,他的信起作用了。

应继续加强基础知识的复习,加强语法基础知识讲解,适当进行长难句的分析。作文方面,要注意整体的谋篇布局。适当增加话题作文的训练。

No Comments

Categories: LOL投注网站

Tags:

2022高考英语题难度如何?命题有哪些变化?一指标暴涨50%

2022年高考英语难度相比于往年有所增加,如果不是因为数学题目难度暴涨抢了英语的风头,英语题目难度的增加,还是非常让人瞩目的。

高考之后,各路英语大神就已经开始进行真题方面的分析。我看了一下英语大神廖唯伟的高考真题的词组短语报告,把已经发布的2022高考英语全国甲卷的报告和2021年的甲卷报告进行了对比,看到了一些变化趋势,可以跟大家分享。

2021年全国英语甲卷的难度值还是比较低的,整份卷子中出现的词组短语的数量仅有85处。有可能是因为难度比较低,造成考到140的学生的数量过多,今年大大增加了难度。在2022年的高考英语全国甲卷中,词组短语的数量暴增到129处,同比增长了了51%。

词组短语的数量就是一份卷子的难度指标,我们知道上海卷非常的难,还有以前的苏高考卷也非常的难。但是,这两个地区的高考单词大纲范围也是3500词,难度为什么会比其他地方更大呢?

原因就是每份卷子中词组短语的数量多。上海卷和苏卷每份卷子中出现的词组短语普遍高于150个/卷,有的年份甚至高于180个/卷。大部分考生只背单词,不背词组短语,所以遇到词组短语数量多的卷子,就会感觉束手无策,好像单词都读得懂,可是卷子就是看不懂。

从几年前除天津卷以外的考区取消单选题开始,很多地方的英语教学就开始淡化词组短语的教学,很多同学也误以为不考单选就不用背词组短语了,这是导致这过去的十年英语试卷难度很低,可是考生的分数仍然不出彩的重要原因。

但是,高考出卷的改革,又逐渐有增加词组短语掌握要求的趋势。比如在新高考新题型续写的评分标准中,几乎所有的标准都是降档标准,唯一的加档项就是能够灵活运用词组短语。

在词组短语的考查上,往年的试卷一般是单纯考词组短语的意思,你只要看懂卷子中出现的词组短语的意思,能够理解文章的大意,就可以解出答案。

比如在阅读的D篇中,字面意思和实际意思差别比较大的词组短语,就直接作为答案的选项,没有背过词组短语的同学根本看不懂选项的意思,也就选不到答案。

又如在7选5这个题型中,往年很少会有词组短语出现在这种题型里面,今年这一道题就出现了14处短语,其中还有三个短语,分别出现在选项答案和干扰项中。

再如在完形填空中第50题,选项中出现了词组短语作为干扰项,模棱两可的单词表达作为正确选项的这种组合方式。你必须要先看懂干扰项的词组短语的意思,才能够排除掉这些干扰项,然后才能选出那个看似模棱两可的正确答案。

最后值得一提的是,在今年的改错题中,纯语法类的送分题降至两分,剩下的8个选项都和词组短语相关,虽然题目的难度很低,可是没有背过词组短语的同学想要全部做对,确实很难。

因此,我们在未来的英语学习中要重视词组短语的积累。高中英语3500词能做到看到单词就知道意思只能给我们拿到基本的80~110分,想要拿到120、130,甚至是140这样的高分,就必须要加强记忆词组短语。

由3500个单词相互组合,形成的词组短语,在高考范围内可以考的,至少有1.5万个左右,高考的时候抽查其中的1%。你想要通过瞎猫碰到死耗子的方式,猜出词组短语的意思,几乎不太可能。

词组短语的整理方法,我们可以参考《高中英语1.5万考点》官方免费公开的指南。特别是准高一的学生,可以参照指南自行整理。通过整理和记忆词组短语,可以让我们的英语水平提升到一个很高的档次,面对词组短语比例较高的,难度比较大的卷子,我们就能够自如应付。

No Comments

Categories: LOL投注网站

Tags: