大數據分析與可視化 課件 統計函數應用1.0_第1頁
大數據分析與可視化 課件 統計函數應用1.0_第2頁
大數據分析與可視化 課件 統計函數應用1.0_第3頁
大數據分析與可視化 課件 統計函數應用1.0_第4頁
大數據分析與可視化 課件 統計函數應用1.0_第5頁
已閱讀5頁,還剩15頁未讀 繼續免費閱讀

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

大數據分析平臺

統計函數應用統計函數的介紹01統計函數的應用場景目錄CONTENTS02統計函數是指統計數據表函數,用于對數據區域進行統計分析。常見的統計函數有:平均差值MeanDeviation函數絕對中位差值MedianAbsoluteDeviation(MAD)函數統計函數P10、P90列中最大值和最小值之間的間距Range函數返回參數的平均值Avg(Arg1,...)函數計算值的和Sum(Arg1,...)函數計算參數列中的非空值數Count(Arg1)函數計算參數列中唯一非空值的數量UniqueCount(Arg1)函數計算最小值Min(Arg1,...)函數計算最大值Max(Arg1,...)函數

統計函數介紹統計函數的介紹01統計函數的應用場景目錄CONTENTS02計算平均差值MeanDeviation函數表達式:MeanDeviation([銷售數量])計算絕對中位差值MedianAbsoluteDeviation(MAD)函數說明:如果指定了一個參數,則結果為所有行的絕對中位差值。如果指定了多個參數,則結果為每個行的絕對中位差值。表達式:MedianAbsoluteDeviation([銷售數量])統計函數函數:P10:是指某個值,在該值處,10%的數據值等于或小于該值。函數:P90:是指某個值,在該值處,90%的數據值等于或小于該值。表達式:P10([銷售數量])as[P10],P90([銷售數量])as[P90]列中最大值和最小值之間的間距Range函數表達式:Range([銷售數量])情景舉例:下面圖形表示各產品幾個月內的最大銷售差量。返回參數的平均值Avg(Arg1,...)函數說明:參數和結果是實數類型。如果指定了一個參數,則結果為所有行的平均值。如果指定了多個參數,則結果為每個行的平均值。Null參數被忽略并且不能平均。示例:Avg([Column])

Avg(2,-3,4)->1

Avg(null)->(Empty)計算值的和Sum(Arg1,...)函數說明:如果指定了一個參數,則結果為整個列的和。如果指定了多個參數,則結果為每個行的和。示例:Sum(1.5,-2,3)->2.5

Sum(null)->(Empty)應用場景:計算不同年份的累積銷售額計算參數列中的非空值數Count(Arg1)函數說明:在未指定參數時,計算總行數。示例:Count([Column])應用場景:計算在該表中不同區域中財務賬戶出現的次數計算參數列中唯一非空值的數量UniqueCount(Arg1)函數示例:UniqueCount([Column])應用場景:計算每個區域中財務賬戶的個數,不重復計算多次出現的財務賬戶。計算參數的中位數Median(Arg1)函數說明:如果指定了一個參數,則結果為所有行的中值。如果指定了多個參數,則結果為每個行的中值。某一分布的中位數是指,對此分布進行排序后出現在列表中間的值。如果值的數目為偶數,中位數就是兩個中間值的平均值。示例:Median([Column])

Median(2,-3,4)應用場景:計算不同銷售品牌的中位數(對所取的列進行排序取中間的值,如果為偶數行,則取中間兩行的平均值)計算最小值Min(Arg1,...)函數說明:如果指定了一個參數,則結果為整個列的最小值。如果指定了多個參數,

則結果為每個行的最小值。參數和結果是實數類型。Null參數被忽略。

示例:Min([Column])

Min(1.5,-2,3)->-2應用場景:計算該表所列數據根據維度劃分的最小值計算最大值Max(Arg1,...)函數

說明:如果指定了一個參數,則結果為整個列的最大值。如果指定了多個參數,

則結果為每個行的最大值。參數和結果是實數類型。Null參數被忽略。

示例:Max([Column])Max(1.5,-2,3)->3應用場景:計算該表所列數據根據維度劃分的最大值。計算標準偏差StdDev(Arg1)函數

計算標準誤差StdErr(Arg1)函數

標準誤差(StdErr)是已計算的平均值的標準偏差。其計算方法是估計的標準偏差除以樣本容量的平方根。示例:StdErr([Column])應用場景:計算品牌銷售額標準誤差。調用TERR引擎執行腳本函數:TERR_BinaryTERR_BooleanTERR_DateTimeTERR_IntegerTERR_RealTERR_StringTERR_TimeSpan調用DataCloudEnterpriseRuntimeforR引擎并返回指定數據類型的輸出。第一個參數是腳本,后續參數是該腳本的參數。返回列的行數必須與輸入的行數相同。除該腳本以外,至少需要一個參數。輸入內容將放置在名為input1、input2...inputN的變量中,輸出內容必須放置在一個名為output的變量中。示例:TERR_Real(""output<-input1*100+input2"",[RecordNo],[Sales])TERR_String(""output<-input1"",[StringColumn])調用TERR引擎執行腳本函數:TERRAggregation_BinaryTERRAggregation_BooleanTERRAggregation_DateTimeTERRAggregation_IntegerTERRAggregation_RealTERRAggregation_StringTERRAggregation_TimeSpan調用TIBCOEnterpriseRuntimeforR引擎并返回指定數據類型的輸出。第一個參數是腳本,后續參數是該腳本的參數。該腳本應返回一個聚合值。除該腳本以外,至少需要一個參數。輸入內容將放置在名為input1、input2...inputN的變量中,輸出內容必須放

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論