五大模型解高考數(shù)學(xué)：阿里通義千問、360智腦10題全錯(cuò)得0分；訊飛星火答對(duì)一半

搜狐科技 2023-06-08 21:16:43

一年一度高考季，高考試題是大眾關(guān)注的焦點(diǎn)，也成為了AI能力的試金石。AI大模型數(shù)學(xué)功底到底如何？比人類“聰明”嗎？搜狐科技使用五款A(yù)I大模型對(duì)2023高考上海數(shù)學(xué)試卷進(jìn)行了同題測(cè)試。

在測(cè)試中，搜狐科技選取了高考試卷前10道填空題，讓百度文心一言、阿里通義千問、科大訊飛星火認(rèn)知大模型、360智腦、ChatGPT進(jìn)行回答。

(資料圖)

測(cè)試結(jié)果顯示，這五款大模型在答數(shù)學(xué)題的能力上差異顯著。

最“聰明”的訊飛星火答對(duì)了5題，正確率50％。百度文心一言和ChatGPT“緊跟其后”，答對(duì)了4題，正確率為40％。

360智腦和通義千問則“全軍覆沒”，一道題也沒答對(duì)，交了白卷。

值得一提的是，昨天搜狐科技也用五款大語(yǔ)言模型產(chǎn)品，對(duì)高考作文全國(guó)卷（甲）進(jìn)行了測(cè)試，并邀請(qǐng)了5位語(yǔ)文名師打分。

打分結(jié)果顯示，ChatGPT高考作文得分最高，文心一言、訊飛星火得分稍低，但跟ChatGPT處于同一水平。360智腦和通義千問得分最低。

雖然語(yǔ)文作文題和數(shù)學(xué)計(jì)算題，對(duì)大模型能力考察的維度并不盡相同。但巧合的是，不擅長(zhǎng)寫作文的360智腦和通義千問，似乎也不擅長(zhǎng)做數(shù)學(xué)題。

通過這兩次高考題測(cè)試，也能從側(cè)面反應(yīng)出各家大模型的能力確實(shí)是“參差不齊”。如果ChatGPT、文心一言、訊飛星火是“學(xué)霸”，那么360智腦和通義千問則是妥妥的“學(xué)渣”。

附測(cè)試中使用的高考數(shù)學(xué)題題目：

1.不等式|x-2|<1的解集為__

2.a=(2,3)，b=(-1,2)，則a·b=__

3.首項(xiàng)為3，公比為2的等比數(shù)列的前六項(xiàng)和S6=__

4.tanA=3，tan2A=__

5.f(x)={2^xx>0;1，x≤0}的值域?yàn)開_

6.復(fù)數(shù)z=1-i，則|1+iz|=__

7.圓的方程x^2+y^2-4y-m=0的面積為π，則m=__

8.三角形的三邊長(zhǎng)為a=4，b=5，c=6，則sinA=__

9.某地一年四個(gè)季度的GDP(億元)，第一季度GDP為232，第四季度GDP為241，且四個(gè)季度的GDP逐季度增長(zhǎng)，中位數(shù)、平均數(shù)相等。則該地一年的GDP為__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0，正數(shù)k的最大值為__

責(zé)任編輯：

該作品系作者結(jié)合新聞時(shí)事、法律法規(guī)及互聯(lián)網(wǎng)相關(guān)知識(shí)整合，作品內(nèi)圖片源于網(wǎng)絡(luò)。僅供交流學(xué)習(xí)，若侵犯到您的權(quán)益，煩請(qǐng)聯(lián)系客服告知，我們核實(shí)后將立即刪除。標(biāo)簽：

最近更新

五大模型解高考數(shù)學(xué)：阿里通義千問、360智腦10題全錯(cuò)得0分；訊飛星火答對(duì)一半一年一度高考季，高考試題是大眾關(guān)注的焦點(diǎn)，也成為了AI能力的試金石。

快看：北京市通信管理局就網(wǎng)絡(luò)安全問題約談瑞斯康達(dá) 在充分核實(shí)、深入調(diào)查后，北京市通信管理局要求瑞斯康達(dá)公司充分認(rèn)識(shí)到

蘭石化什么時(shí)候單招2022年開始公布成績(jī) 全球快資訊 1、蘭石化什么時(shí)候單招最好的專業(yè)是石油化工專業(yè)。國(guó)家重點(diǎn)專業(yè)：煉油

舞臺(tái)綜藝，還要困在「選秀」敘事里多久？舞臺(tái)綜藝，還要困在「選秀」敘事里多久？

世界環(huán)境日 | 和龍林區(qū)基層法院開展“保護(hù)生物多樣性，共建萬(wàn)物和諧美麗世界”環(huán)境保護(hù)法治宣傳世界環(huán)境日|和龍林區(qū)基層法院開展“保護(hù)生物多樣性，共建萬(wàn)物和諧美...

“小物業(yè)”牽動(dòng)“大民生” 法官調(diào)判結(jié)合解決物業(yè)糾紛陸某是某小區(qū)業(yè)主，自2020年1月起至今，陸某從未繳納過物業(yè)服務(wù)費(fèi)，共

焦點(diǎn)播報(bào):劃撥土地使用權(quán)能出讓嗎劃撥土地使用權(quán)能出讓嗎通過劃撥方式獲取的土地使用權(quán)，是可以再轉(zhuǎn)讓的

專利普通許可合同范文怎么寫？天天快報(bào) 專利許可合同是指專利所有者在一定范圍內(nèi)許可他人使用該專利的合約，主

專利轉(zhuǎn)讓需要另交費(fèi)用嗎|環(huán)球微頭條 ?按規(guī)定，你轉(zhuǎn)讓專利的時(shí)候，需要按照轉(zhuǎn)讓的流程。在轉(zhuǎn)讓過程中，你需

世界快看：無限連帶責(zé)任的相關(guān)法律規(guī)定無限連帶責(zé)任的相關(guān)法律規(guī)定(1)連帶責(zé)任是一種多數(shù)主體責(zé)任，即與債權(quán)

環(huán)球速看：什么是合同詐騙罪的犯罪構(gòu)成什么是合同詐騙罪的犯罪構(gòu)成?[釋義]本罪是指以非法占有為目的，在簽訂

業(yè)主要求罷免業(yè)主委員會(huì)需要什么條件-天天觀焦點(diǎn) 業(yè)委會(huì)究竟是什么組織業(yè)委會(huì)全稱是業(yè)主委員會(huì)，是指由業(yè)主選舉產(chǎn)生，代

全球速訊：信用卡違約金減免（信用卡逾期減免政策是什么原因呢）簡(jiǎn)單來說就是自己在銀行要求的最后還款期限到來之時(shí)依舊沒有還款的。那

天天熱資訊！第三屆全國(guó)防范非法集資知識(shí)答題賽即將開始！等你來戰(zhàn)！近年來，非法集資案件持續(xù)高發(fā)，不法分子犯罪手法花樣，給老百姓的錢袋

“有警無險(xiǎn)”！意外來臨，他們?yōu)槟闵涎菖摹凹铀俣取?！|每日看點(diǎn) 6月7日，2023年高考全國(guó)統(tǒng)考正式開始，陜西省263156名考生在9085個(gè)考場(chǎng)

環(huán)球快資訊：安徽含山：科技活動(dòng)周活動(dòng)精彩紛呈 5月20日—31日，安徽省含山縣舉辦主題為“熱愛科學(xué)崇尚科學(xué)”的科技...

問計(jì)于民”助推交管工作_天天快看近日，內(nèi)蒙古公安廳交管局高速公路二支隊(duì)推出問計(jì)于民舉措，全面了解民

女方撤訴后男方多久可以起訴離婚？撤訴后可以協(xié)議離婚嗎？女方撤訴后男方多久可以起訴離婚?男方在女方撤訴后，隨時(shí)都可以起訴

法務(wù)公司做停息掛賬靠譜嗎？停息掛賬的好處和危害你知道嗎？|新消息法務(wù)公司做停息掛賬靠譜嗎找法務(wù)的話有些還是比較靠譜的。停息掛賬

焦點(diǎn)播報(bào):如何跟銀行協(xié)商停息掛賬話術(shù)有哪些？信用卡逾期怎么跟銀行協(xié)商解決？如何跟銀行協(xié)商停息掛賬話術(shù)有哪些停息掛賬協(xié)商話術(shù)技巧1 致電查詢

信用卡停息掛賬證明模板怎么寫？信用卡逾期怎么辦？_天天新消息信用卡停息掛賬證明模板怎么寫停息掛賬書面申請(qǐng)寫作范本如下：房貸

環(huán)球速訊：抖音上停息掛賬協(xié)商還款是真的嗎？停息掛賬手續(xù)費(fèi)高不高？抖音上停息掛賬協(xié)商還款是真的嗎不是抖音幫忙協(xié)商還款并不是真的,不

銀行信用卡逾期了能停息掛賬嗎？信用卡逾期如何申請(qǐng)停息掛賬？-環(huán)球快播報(bào) 銀行信用卡逾期了能停息掛賬嗎可以信用卡逾期是可以進(jìn)行停息掛賬的

停息掛賬最低多少錢可以申請(qǐng)？停息掛賬自己怎么去申請(qǐng)？|環(huán)球動(dòng)態(tài) 停息掛賬最低多少錢可以申請(qǐng)停息掛賬并沒有具體的欠款金額限制，但

長(zhǎng)沙正規(guī)停息掛賬公司怎么收費(fèi)？辦理停息掛賬需要手續(xù)費(fèi)嗎？長(zhǎng)沙正規(guī)停息掛賬公司怎么收費(fèi)專業(yè)的申請(qǐng)停息掛賬的公司主要通過向

天天新資訊：和銀行協(xié)商停息掛賬需要簽合同嗎？停息掛賬容易申請(qǐng)嗎？和銀行協(xié)商停息掛賬需要簽合同嗎信用卡停息掛賬要簽合同,需要準(zhǔn)備身

四川個(gè)人停息掛賬咨詢公司有哪些？停息掛賬是硬性規(guī)定嗎？即時(shí)看四川個(gè)人停息掛賬咨詢公司有哪些申請(qǐng)停息掛賬的好處：第一：罰息可

云南借款人停息掛賬咨詢電話多少？停息掛賬去哪里辦理？快訊云南借款人停息掛賬咨詢電話多少辦理信用卡停息掛賬，用戶只需要撥

網(wǎng)貸協(xié)商停息掛賬電話打哪個(gè)？銀行不給停息掛賬怎么辦？網(wǎng)貸協(xié)商停息掛賬電話打哪個(gè)網(wǎng)貸逾期協(xié)商還款打12378協(xié)商還款有用。

【天天報(bào)資訊】網(wǎng)貸辦理完停息掛賬后怎么還款？網(wǎng)貸停息掛賬的好處和危害有哪些？網(wǎng)貸辦理完停息掛賬后怎么還款申請(qǐng)網(wǎng)貸停息掛賬后，仍然需要每月按

15037178970

婚姻法

知識(shí)糾紛

律師最新回復(fù)

2022-08-30 09:48:22

律師回答區(qū)

高樓住宅玻璃炸裂應(yīng)該找誰(shuí)處理

回復(fù)：可以建議您先找一下物業(yè)，由物業(yè)處置
2022-11-14 09:48:30

律師回答區(qū)

退休職工漲工資最新消息退休人員漲工資注意事項(xiàng)有哪些？
2022-11-17 17:08:56

律師回答區(qū)

跳跳糖是毒品嗎？
2022-11-18 11:21:04

律師回答區(qū)

建筑勞務(wù)公司是什么意思
2022-11-18 12:16:14

律師回答區(qū)

民事權(quán)利包括哪些

久久一区二区三区精华液,国产区一区二区三区高清,男人的天堂在线观看欧美,日本精品三级一区二区视频

五大模型解高考數(shù)學(xué)：阿里通義千問、360智腦10題全錯(cuò)得0分；訊飛星火答對(duì)一半

最近更新

婚姻法

知識(shí)糾紛

律師最新回復(fù)

公司法

久久一区二区三区精华液,国产区一区二区三区高清,男人的天堂在线观看欧美,日本精品三级一区二区视频

五大模型解高考數(shù)學(xué)：阿里通義千問、360智腦10題全錯(cuò)得0分；訊飛星火答對(duì)一半

最近更新

婚姻法

知識(shí)糾紛

律師最新回復(fù)

公司法

五大模型解高考數(shù)學(xué)：阿里通義千問、360智腦10題全錯(cuò)得0分；訊飛星火答對(duì)一半