




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第python數據分析之單因素分析線性擬合及地理編碼目錄一、單因素分析線性擬合二、實現地理編碼
一、單因素分析線性擬合
功能:線性擬合,單因素分析,對散點圖進行線性擬合,并放大散點圖的局部位置輸入:某個xlsx文件,包含患者密度(人/10萬人)和人口密度(人/平方千米)兩列輸出:對這兩列數據進行線性擬合,繪制散點
實現代碼:
importpandasaspd
frompylabimportmpl
fromscipyimportoptimize
importnumpyasnp
importmatplotlib.pyplotasplt
deff_1(x,A,B):
returnA*x+B
defdraw_cure(file):
data1=pd.read_excel(file)
data1=pd.DataFrame(data1)
hz=list(data1['患者密度(人/10萬人)'])
rk=list(data1['人口密度(人/平方千米)'])
hz_gy=[]
rk_gy=[]
foriinhz:
hz_gy.append((i-min(hz))/(max(hz)-min(hz)))
foriinrk:
rk_gy.append((i-min(rk))/(max(rk)-min(rk)))
n=['玄武區','秦淮區','建鄴區','鼓樓區','浦口區','棲霞區','雨花臺區','江寧區','六合區','溧水區','高淳區',
'錫山區','惠山區','濱湖區','梁溪區','新吳區','江陰市','宜興市',
'鼓樓區','云龍區','賈汪區','泉山區','銅山區','豐縣','沛縣','睢寧縣','新沂市','邳州市',
'天寧區','鐘樓區','新北區','武進區','金壇區','溧陽市',
'虎丘區','吳中區','相城區','姑蘇區','吳江區','常熟市','張家港市','昆山市','太倉市',
'崇川區','港閘區','通州區','如東縣','啟東市','如皋市','海門市','海安市',
'連云區','海州區','贛榆區','東海縣','灌云縣','灌南縣',
'淮安區','淮陰區','清江浦區','洪澤區','漣水縣','盱眙縣','金湖縣',
'亭湖區','鹽都區','大豐區','響水縣','濱??h','阜寧縣','射陽縣','建湖縣','東臺市',
'廣陵區','邗江區','江都區','寶應縣','儀征市','高郵市',
'京口區','潤州區','丹徒區','丹陽市','揚中市','句容市',
'海陵區','高港區','姜堰區','興化市','靖江市','泰興市',
'宿城區','宿豫區','沭陽縣','泗陽縣','泗洪縣']
mpl.rcParams['font.sans-serif']=['FangSong']
plt.figure(figsize=(16,8),dpi=98)
p1=plt.subplot(121)
p2=plt.subplot(122)
p1.scatter(rk_gy,hz_gy,c='r')
p2.scatter(rk_gy,hz_gy,c='r')
p1.axis([0.0,1.01,0.0,1.01])
p1.set_ylabel("患者密度(人/10萬人)",fontsize=13)
p1.set_xlabel("人口密度(人/平方千米)",fontsize=13)
p1.set_title("人口密度—患者密度相關性",fontsize=13)
fori,txtinenumerate(n):
p1.annotate(txt,(rk_gy[i],hz_gy[i]))
A1,B1=optimize.curve_fit(f_1,rk_gy,hz_gy)[0]
x1=np.arange(0,1,0.01)
y1=A1*x1+B1
p1.plot(x1,y1,"blue",label='一次擬合直線')
x2=np.arange(0,1,0.01)
y2=x2
p1.plot(x2,y2,'g--',label='y=x')
p1.legend(loc='upperleft',fontsize=13)
##plotthebox
tx0=0;tx1=0.1;ty0=0;ty1=0.2
sx=[tx0,tx1,tx1,tx0,tx0]
sy=[ty0,ty0,ty1,ty1,ty0]
p1.plot(sx,sy,"purple")
p2.axis([0,0.1,0,0.2])
p2.set_ylabel("患者密度(人/10萬人)",fontsize=13)
p2.set_xlabel("人口密度(人/平方千米)",fontsize=13)
p2.set_title("人口密度—患者密度相關性",fontsize=13)
fori,txtinenumerate(n):
p2.annotate(txt,(rk_gy[i],hz_gy[i]))
p2.plot(x1,y1,"blue",label='一次擬合直線')
p2.plot(x2,y2,'g--',label='y=x')
p2.legend(loc='upperleft',fontsize=13)
plt.show()
if__name__=='__main__':
draw_cure("F:\醫學大數據課題\論文終稿修改\scientificreport\返修\市區縣相關分析_2231.xls")
實現效果:
二、實現地理編碼
輸入:中文地址信息,例如安徽為縣天城鎮都督村沖里18號輸出:經緯度坐標,例如107.3479975498958130.50483335424108功能:根據中文地址信息獲取經緯度坐標
實現代碼:
importjson
fromurllib.requestimporturlopen,quote
importxlrd
defreadXLS(XLS_FILE,sheet0):
rb=xlrd.open_workbook(XLS_FILE)
rs=rb.sheets()[sheet0]
returnrs
defgetlnglat(adress):
url='/geocoding/v3/address='
output='json'
ak='fdi11GHN3GYVQdzVnUPuLSScYBVxYDFK'
add=quote(adress)#使用quote進行編碼為了防止中文亂碼
#add=adress
url2=url+add+'output='+output+'ak='+ak
req=urlopen(url2)
res=req.read().decode()
temp=json.loads(res)
returntemp
defgetlatlon(sd_rs):
nrows_sd_rs=sd_rs.nrows
foriinrange(4,nrows_sd_rs):
#foriinrange(4,7):
row=sd_rs.row_values(i)
print(i,i/nrows_sd_rs)
b=(row[11]+row[12]+row[9]).replace('#','號')#第三列的地址
print(b)
try:
lng=getlnglat(b)['result']['location']['lng']
#獲取經度并寫入
lat=getlnglat(b)['result']['location']['lat']
#獲取緯度并寫入
exceptKeyErrorase:
lng=''
lat=''
f_err=open('f_err.txt','a')
f_err.write(str(i)+'\t')
f_err.close()
print(e)
print(lng,lat)
f_latlon=open('f_latlon.txt','a')
f_latlon.write(row[0]+'\t'+b+'\t'+str(lng)+'\t'+str(lat)+'\n')
f_latlon.close()
if__nam
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 血液透析專業理論與實踐考核要點解析
- 安全生產三卡是指
- 生產安全事故調查處理報告
- 綠色金融估值體系-洞察及研究
- 第二十個全國安全生產月
- 基礎樁植樁法試樁施工技術方案探討
- 建筑類安全生產許可證延期
- 2025企業安全生產檔案
- 安全生產事故隱患是指
- 消防安全制度一
- 2025至2030中國燕窩行業市場運行分析及競爭格局與投資方向報告
- 2025年河北省中考語文試卷真題及答案詳解(精校打印版)
- 口服靶向藥講課件
- 12024-2025學年暑假安全教育主題班會課件
- 肝膽外科醫學科普
- 能源轉型與碳市場機制協同的路徑優化研究
- 工程投資人合同協議
- 包席合同協議
- 資產評估風險管理制度
- 中醫醫療技術手冊2013普及版
- 2023年副主任醫師(副高)-內科學(副高)考試歷年高頻考點參考題庫附帶專家答案
評論
0/150
提交評論