



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、“親近生活,美化生活”2010 統計創新大賽參賽指南競賽說明寶潔公司、中國概率統計學會和北京大學概率統計系,共同邀請中國高校和研究所的統計相關專業研究學者和在校學生,參加“親近生活,美化生活” 2010 統計創新大賽。寶潔公司將和中國概率統計學會專家組成競賽評審委員會,制定評獎規則,評價參賽者提交的技術方案。獲獎的技術方案將獲得現金獎勵。本指南將給出寶潔尋求解決方案的技術課題,并提供參加大賽的確認表模版。研究課題寶潔公司根據實際工作中統計建模方面的困難總結提煉出如下兩個關于統計建模方法及統計模型評價的課題課題 1:背景及統計的作用:洗衣粉是通過其中的化學成分溶于水后改變水溶液的物理化學性質來實
2、現去污的作用的,因此通過測量洗衣產品溶于水后的溶液的一些屬性就可以了解產品去污的功效。如果能建立溶液屬性和產品功效之間的模型,就可以找出能夠最大化產品功效的溶液的屬性,根據這些屬性和化工技術知識我們就可以找出最優的配方。試驗:為了研究洗衣粉溶液的物理屬性對去污功效的影響,我們分別測量了96 個不同產品溶液的物理屬性和它們的去污效果的數據已有的數據:1.現有 96 個產品的物理屬性及功效數據,從中隨機選取了10 個產品作為驗證模型預測精度的數據,請用剩下的86 組數據來建立模型2.每一個產品的21 個屬性作為輸入變量(PP1 PP21)3.產品在 18 種污漬上的功效作為輸出變量(O1 O18)
3、課題1數據.xls要求:1. 請根據現有數據擬合出一個統計模型,模型能夠基于產品的屬性數據對產品的功效做出比較可靠的預測2. 考慮所有輸入變量的線性項,根據模型的需要選擇它們的平方項及交互作用項;3. 對此數據用多種不同的方法進行分析;4. 選擇合適的能夠反映模型預測能力的評價準則(可以根據需要提出新的準則),并根據準則選出最優的建模方法和最優模型;5. 提供數據說明擬合出的模型的預測能力。注意: 某些產品的某些屬性有缺失數據,但用來驗證模型的10 組數據里沒有缺失值。模型評價標準:比較隨機抽取的10 個產品的真實數據與模型預測值的區別,計算MSE( Mean Square Error),并根
4、據 MSE 來計算出每一參賽者的綜合得分。具體計算方法如下:1.參賽者建立的每一種污漬的模型都會根據相應的MSE 在所有參賽者中的排名來獲得相應的分數。如果排名第一,得10 分,排名第二,得8 分,以此類推,排名第五,得2 分,第六名及之后不得分;2. 將每一參賽者在所有模型上的得分取平均,作為參賽者的綜合得分。課題 2背景及統計的作用:一個洗衣粉產品的清潔能力好壞受很多因素的影響,例如:1. 配方中的每一成分的多少2. 洗衣的方法及環境條件(洗衣時間的長短,洗衣用水的情況等)如果能通過統計建模的方法建立一個用配方及洗衣條件來預測產品功效的模型,就可以1 了解產品中每一成分,及洗衣的方法、條件
5、等因素對產品清潔能力的影響;2 在給出產品的配方時對產品在一定條件下的清潔能力做出比較可靠的預測;3 在一定的條件下,優化產品的配方。試驗:根據目標,我們設計了一個250 個不同處理組合(Treatment)的試驗:1. 設計時考慮的因素有產品的配方中每一成分的量及洗衣條件,每一因素有三個水平;2. 用設計所得的每一個配方的產品去洗滌一些衣物,根據洗滌后衣物的清潔程度計算出每一配方的清潔能力(試驗中衣物的初始臟度可能會有一些波動,所以擬合模型時需要考慮到它的影響);3. 每四個配方作為一組來進行試驗(這樣就產生了一個區組的效應需要在建模時考慮);4. 250 個處理之外我們還測試了 16 個額
6、外的配方用來驗證模型預測的準確性。已有的數據:250 個不同處理組合(Treatment)的試驗數據輸入變量包括:1. 配方中的 20 種成分 (C1 C20)2.洗衣方法及洗衣環境參數4 個 (P1 P4)3. 區組 (block)4. 衣物初始的臟度 (Baseline1Baseline5,分別對應 5 種污漬 )輸出變量為:產品在5 種不同種類污漬上的清潔功效(Cleaning1Cleaning5)課題2數據.XLS要求:1. 對此數據選用不同的統計方法進行分析,建立一個用產品配方來預測產品清潔能力模型;2. 需要考慮的效應為所有變量的線性項,C1 C20、 P1 P4 的平方項及交互作
7、用項;3.將對應每一污漬初始的臟度(Baseline1Baseline5)作為協變量放入模型,例如對Cleaning1建模時,需將Baseline1作為協變量加入模型,依此類推;4. 試用多種不同的模型選擇方法對數據進行分析;5. 選擇合適的能夠反映模型預測能力的評價準則(可以根據需要提出新的準則),并根據所選準則找出最優模型;6. 提供數據說明擬合出的模型的預測能力。注意:如果同時考慮所有的線性項、平方項和交互作用項的話,所有要估計的參數的個數遠大于處理組合的個數 (250)。模型評價標準:比較 16 個驗證性試驗的實際數據與模型預測值的區別,計算MSE(Mean Square Error)
8、,并根據MSE 來計算出每一參賽者的綜合得分。具體計算方法如下:1.參賽者建立的每一種污漬的模型都會根據相應的MSE 在所有參賽者中的排名來獲得相應的分數。如果排名第一,得10 分,排名第二,得8 分,以此類推,排名第五,得2 分,第六名及之后不得分。2. 將每一參賽者在所有模型上的得分取平均,作為參賽者的綜合得分。研究成果提交研究結束后參賽者應提交一份研究報告和一個預測程序。研究報告須包含以下幾個方面:方法的原理方法的評價及優勢方法的算法實現方法來源與參考文獻可以提交中文的研究報告,獲獎方案可能被要求提供英文版本的報告。為了便于模型的評價,請參賽者在提交研究報告的同時提供一個預測程序,需滿足
9、如下條件能夠讀取規定格式的Excel 數據,并根據參賽者選出的最優模型對Excel 數據中所提供的輸入變量對產品功效做出預測,并將預測結果按照一個規定的模版輸出到一個新的Excel 文件中編程語言請從R, C,或 Fortran 中選取兩個課題的預測程序的數據輸入及輸出格式模版分別如下課題1格式模版 .xls課題2格式模版 .xls競賽評判標準根據所有參賽方案得分的總排名,得分最高的方案將獲得金獎,得分第二到第五的方案將獲得銀獎。排名前十二的方案將接受專家組的評審,并根據統計建模方法的創新性和科學性評選出方法創新獎一名( 12 個備選方案將根據兩個課題的參賽方案數等比例分配到每一課題,每一課題至少有三個方案入選)本競賽要求參賽者遞交的方案不含保密信息。參賽者應確保遞交的方案屬于原創,無仿冒或侵害他人知識產權的行為。獎勵金獎( 1 名) RMB 8000銀獎( 4 名) RMB 3000方法創新獎( 1 名) RMB 5000入圍獎寶潔產品大禮包獲得銀獎以上及方法創新獎的方案,參賽者將有機會獲得推薦參加寶潔校園招聘,在同等條件下優先錄取為全職員工或暑期實習生。參賽截止期限參賽者須于2010 年 4 月 15 日前填寫下頁的參賽確認表,并與2010 年 5 月 15 日前提交最終
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《大象的耳朵》課件
- 搶險隊人員培訓管理制度
- 潔具陶瓷倉庫管理制度
- ASPNET 20企業網站項目實戰任務3 網站架構
- 人教版六年級數學下冊期末預測卷【含答案】
- 食藥所制作講課件
- 翻轉課堂在小學音樂教學中的運用
- 2025年江蘇省蘇州市中考語文最后一卷(含答案)
- 二度壓瘡的護理措施講課件
- 微團課答辯題目及答案
- 小學語文《爬山虎的腳》教案 篇
- 紅樓夢45回,46回課件
- 張元鵬《微觀經濟學》(中級教程)筆記和課后習題詳解
- 映秀灣水電廠一次系統課程設計
- 武學大師孫存周(手稿)
- 碳排放管理師考試復習題庫
- 普通話測試中常見的語音錯誤與缺陷
- 中信集團員工手冊全冊
- 叉車自檢報告(柴油叉車)
- 【教案】高三化學二輪復習++限定條件下同分異構體的書寫++教學設計
- 地磅無人值守智能稱重系統方案
評論
0/150
提交評論