




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2024年統(tǒng)計(jì)學(xué)專業(yè)期末考試:數(shù)據(jù)分析計(jì)算題庫與深度學(xué)習(xí)案例數(shù)據(jù)分析計(jì)算題庫描述性統(tǒng)計(jì)1.某班級(jí)學(xué)生的數(shù)學(xué)成績?nèi)缦拢?5,78,82,90,68,75,88,92,70,85。計(jì)算該組數(shù)據(jù)的均值、中位數(shù)和標(biāo)準(zhǔn)差。均值:$(65+78+82+90+68+75+88+92+70+85)÷10=79.3$排序:65,68,70,75,78,82,85,88,90,92,中位數(shù)為$(78+82)÷2=80$標(biāo)準(zhǔn)差:先計(jì)算方差,各數(shù)據(jù)與均值之差的平方和除以數(shù)據(jù)個(gè)數(shù),再開方。方差為$[(6579.3)^2+(7879.3)^2+…+(8579.3)^2]÷10=88.01$,標(biāo)準(zhǔn)差為$sqrt{88.01}≈9.38$2.已知一組數(shù)據(jù)的均值為50,標(biāo)準(zhǔn)差為10,若每個(gè)數(shù)據(jù)都加上5,再乘以2,求新數(shù)據(jù)的均值和標(biāo)準(zhǔn)差。設(shè)原數(shù)據(jù)為$x_1,x_2,…,x_n$,均值$bar{x}=50$,標(biāo)準(zhǔn)差$S=10$。新數(shù)據(jù)$y_i=2(x_i+5)=2x_i+10$。新均值$bar{y}=2bar{x}+10=2×50+10=110$。新標(biāo)準(zhǔn)差$S_y=2S=2×10=20$概率分布1.已知隨機(jī)變量$X$服從參數(shù)為$lambda=3$的泊松分布,求$P(X=2)$。根據(jù)泊松分布概率公式$P(X=k)=frac{e^{lambda}lambda^k}{k!}$,這里$lambda=3$,$k=2$,則$P(X=2)=frac{e^{3}×3^2}{2!}=frac{9e^{3}}{2}≈0.224$2.設(shè)隨機(jī)變量$X$服從正態(tài)分布$N(2,4)$,求$P(0<X<4)$。先進(jìn)行標(biāo)準(zhǔn)化,$Z=frac{Xmu}{sigma}$,這里$mu=2$,$sigma=2$。$P(0<X<4)=P(frac{02}{2}<Z<frac{42}{2})=P(1<Z<1)$,查標(biāo)準(zhǔn)正態(tài)分布表得$P(1<Z<1)=varPhi(1)varPhi(1)=0.8413(10.8413)=0.6826$抽樣與估計(jì)1.從總體中抽取一個(gè)容量為50的簡單隨機(jī)樣本,樣本均值為30,樣本標(biāo)準(zhǔn)差為5。求總體均值的95%置信區(qū)間。由于樣本容量$n=50$較大,使用正態(tài)分布近似。$95%$置信區(qū)間對(duì)應(yīng)的$z$值為$z_{alpha/2}=1.96$。置信區(qū)間為$bar{x}pmz_{alpha/2}frac{S}{sqrt{n}}=30pm1.96×frac{5}{sqrt{50}}=30pm1.39$,即$(28.61,31.39)$2.已知總體方差為16,要使總體均值的90%置信區(qū)間長度不超過2,樣本容量至少應(yīng)為多少?$90%$置信區(qū)間對(duì)應(yīng)的$z$值為$z_{alpha/2}=1.645$,置信區(qū)間長度$L=2z_{alpha/2}frac{sigma}{sqrt{n}}$。已知$Lleq2$,$sigma=4$,則$2leq2×1.645×frac{4}{sqrt{n}}$,解得$ngeq(1.645×4)^2=43.29$,樣本容量至少為44假設(shè)檢驗(yàn)1.某廠生產(chǎn)的零件直徑服從正態(tài)分布$N(mu,0.04)$,現(xiàn)從該廠生產(chǎn)的零件中隨機(jī)抽取9個(gè),測得直徑的樣本均值為2.1厘米。已知該廠零件直徑的標(biāo)準(zhǔn)值為2厘米,在顯著性水平$alpha=0.05$下,檢驗(yàn)該廠生產(chǎn)的零件直徑是否符合標(biāo)準(zhǔn)。提出假設(shè)$H_0:mu=2$,$H_1:muneq2$。檢驗(yàn)統(tǒng)計(jì)量$Z=frac{bar{X}mu}{sigma/sqrt{n}}$,這里$bar{X}=2.1$,$mu=2$,$sigma=0.2$,$n=9$,則$Z=frac{2.12}{0.2/sqrt{9}}=1.5$。$95%$雙側(cè)檢驗(yàn)的臨界值為$pm1.96$,$|Z|=1.5<1.96$,接受$H_0$,認(rèn)為該廠生產(chǎn)的零件直徑符合標(biāo)準(zhǔn)2.有兩種品牌的電池,分別抽取10個(gè)進(jìn)行測試,得到品牌A的平均使用壽命為200小時(shí),標(biāo)準(zhǔn)差為10小時(shí);品牌B的平均使用壽命為180小時(shí),標(biāo)準(zhǔn)差為8小時(shí)。在顯著性水平$alpha=0.01$下,檢驗(yàn)兩種品牌電池的平均使用壽命是否有顯著差異。假設(shè)$H_0:mu_Amu_B=0$,$H_1:mu_Amu_Bneq0$。由于總體方差未知但可認(rèn)為相等,使用兩樣本$t$檢驗(yàn)。先計(jì)算合并方差$S_p^2=frac{(n_A1)S_A^2+(n_B1)S_B^2}{n_A+n_B2}=frac{(101)×10^2+(101)×8^2}{10+102}=82$。檢驗(yàn)統(tǒng)計(jì)量$t=frac{(bar{X}_Abar{X}_B)(mu_Amu_B)}{S_psqrt{frac{1}{n_A}+frac{1}{n_B}}}=frac{(200180)0}{sqrt{82}sqrt{frac{1}{10}+frac{1}{10}}}approx4.92$。自由度$df=n_A+n_B2=18$,$t_{0.005}(18)=2.878$,$|t|>2.878$,拒絕$H_0$,認(rèn)為兩種品牌電池的平均使用壽命有顯著差異深度學(xué)習(xí)案例圖像分類手寫數(shù)字識(shí)別1.數(shù)據(jù)準(zhǔn)備使用MNIST數(shù)據(jù)集,該數(shù)據(jù)集包含60000個(gè)訓(xùn)練樣本和10000個(gè)測試樣本,每個(gè)樣本是28×28像素的灰度圖像,標(biāo)簽為09的數(shù)字。使用Python的`torchvision`庫加載數(shù)據(jù)。```pythonimporttorchimporttorchvisionimporttorchvision.transformsastransformstransform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5,),(0.5,))])trainset=torchvision.datasets.MNIST(root='./data',train=True,download=True,transform=transform)trainloader=torch.utils.data.DataLoader(trainset,batch_size=64,shuffle=True)testset=torchvision.datasets.MNIST(root='./data',train=False,download=True,transform=transform)testloader=torch.utils.data.DataLoader(testset,batch_size=64,shuffle=False)```2.模型構(gòu)建構(gòu)建一個(gè)簡單的卷積神經(jīng)網(wǎng)絡(luò)(CNN)。```pythonimporttorch.nnasnnimporttorch.nn.functionalasFclassNet(nn.Module):def__init__(self):super(Net,self).__init__()self.conv1=nn.Conv2d(1,6,5)self.pool=nn.MaxPool2d(2,2)self.conv2=nn.Conv2d(6,16,5)self.fc1=nn.Linear(1644,120)self.fc2=nn.Linear(120,84)self.fc3=nn.Linear(84,10)defforward(self,x):x=self.pool(F.relu(self.conv1(x)))x=self.pool(F.relu(self.conv2(x)))x=x.view(1,1644)x=F.relu(self.fc1(x))x=F.relu(self.fc2(x))x=self.fc3(x)returnxnet=Net()```3.訓(xùn)練模型定義損失函數(shù)和優(yōu)化器,然后進(jìn)行訓(xùn)練。```pythonimporttorch.optimasoptimcriterion=nn.CrossEntropyLoss()optimizer=optim.SGD(net.parameters(),lr=0.001,momentum=0.9)forepochinrange(5):running_loss=0.0fori,datainenumerate(trainloader,0):inputs,labels=dataoptimizer.zero_grad()outputs=net(inputs)loss=criterion(outputs,labels)loss.backward()optimizer.step()running_loss+=loss.item()ifi%200==199:print(f'[{epoch+1},{i+1:5d}]loss:{running_loss/200:.3f}')running_loss=0.0```4.模型評(píng)估在測試集上評(píng)估模型的準(zhǔn)確率。```pythoncorrect=0total=0withtorch.no_grad():fordataintestloader:images,labels=dataoutputs=net(images)_,predicted=torch.max(outputs.data,1)total+=labels.size(0)correct+=(predicted==labels).sum().item()print(f'Accuracyofthenetworkonthe10000testimages:{100correct/total}%')```自然語言處理情感分析1.數(shù)據(jù)準(zhǔn)備使用IMDb影評(píng)數(shù)據(jù)集,該數(shù)據(jù)集包含50000條影評(píng),分為積極和消極兩類。使用`torchtext`庫處理文本數(shù)據(jù)。```pythonimporttorchfromtorchtext.legacyimportdata,datasetsTEXT=data.Field(tokenize='spacy',tokenizer_language='en_core_web_sm')LABEL=data.LabelField(dtype=torch.float)train_data,test_data=datasets.IMDB.splits(TEXT,LABEL)TEXT.build_vocab(train_data,max_size=25000,vectors="glove.6B.100d")LABEL.build_vocab(train_data)train_iterator,test_iterator=data.BucketIterator.splits((train_data,test_data),batch_size=64,device=torch.device('cuda'iftorch.cuda.is_available()else'cpu'))```2.模型構(gòu)建構(gòu)建一個(gè)簡單的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)。```pythonimporttorch.nnasnnclassRNN(nn.Module):def__init__(self,vocab_size,embedding_dim,hidden_dim,output_dim):super().__init__()self.embedding=nn.Embedding(vocab_size,embedding_dim)self.rnn=nn.RNN(embedding_dim,hidden_dim)self.fc=nn.Linear(hidden_dim,output_dim)defforward(self,text):embedded=self.embedding(text)output,hidden=self.rnn(embedded)hidden=hidden.squeeze(0)returnself.fc(hidden)INPUT_DIM=len(TEXT.vocab)EMBEDDING_DIM=100HIDDEN_DIM=256OUTPUT_DIM=1model=RNN(INPUT_DIM,EMBEDDING_DIM,HIDDEN_DIM,OUTPUT_DIM)```3.訓(xùn)練模型定義損失函數(shù)和優(yōu)化器,然后進(jìn)行訓(xùn)練。```pythonimporttorch.optimasoptimcriterion=nn.BCEWithLogitsLoss()optimizer=optim.Adam(model.parameters())device=torch.device('cuda'iftorch.cuda.is_available()else'cpu')model=model.to(device)criterion=crite
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 體育傳媒與信息AI應(yīng)用行業(yè)深度調(diào)研及發(fā)展項(xiàng)目商業(yè)計(jì)劃書
- 休閑車文化電影制作與推廣創(chuàng)新創(chuàng)業(yè)項(xiàng)目商業(yè)計(jì)劃書
- 黃梅戲唱腔學(xué)習(xí)行業(yè)深度調(diào)研及發(fā)展項(xiàng)目商業(yè)計(jì)劃書
- 傳統(tǒng)文化傳承行業(yè)深度調(diào)研及發(fā)展項(xiàng)目商業(yè)計(jì)劃書
- 建筑機(jī)械設(shè)備檢試驗(yàn)計(jì)劃
- 中圖版八年級(jí)上冊(cè)地理課程計(jì)劃
- 生態(tài)農(nóng)業(yè)示范園區(qū)場地?zé)o償租賃協(xié)議
- 商業(yè)綜合體物業(yè)租賃及綜合管理服務(wù)協(xié)議
- 六年級(jí)下冊(cè)科學(xué)課堂互動(dòng)計(jì)劃
- 銅仁學(xué)院《先秦漢魏文學(xué)研究》2023-2024學(xué)年第一學(xué)期期末試卷
- 極化曲線研究論文
- 幼兒園大班班本課程《再見幼兒園》
- 興趣與能力的培養(yǎng)的課程設(shè)計(jì)
- 為什么天空是藍(lán)色的
- 集團(tuán)分權(quán)管理手冊(cè)
- 設(shè)計(jì)報(bào)價(jià)單模板
- 自動(dòng)控制原理:數(shù)學(xué)模型 PPT
- 星期音樂會(huì)智慧樹知到課后章節(jié)答案2023年下同濟(jì)大學(xué)
- 幼兒園課件小小銀行家
- 離婚登記申請(qǐng)受理回執(zhí)單
- 2022-2023學(xué)年廣東省廣州市花都區(qū)四年級(jí)數(shù)學(xué)第二學(xué)期期末考試模擬試題含解析
評(píng)論
0/150
提交評(píng)論