Pandas在數(shù)據(jù)科學(xué)中發(fā)揮著重要作用,它可幫助我們建立數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析師的基礎(chǔ)技能。
創(chuàng)新互聯(lián)公司專注于寶清企業(yè)網(wǎng)站建設(shè),成都響應(yīng)式網(wǎng)站建設(shè)公司,商城網(wǎng)站開發(fā)。寶清網(wǎng)站建設(shè)公司,為寶清等地區(qū)提供建站服務(wù)。全流程按需搭建網(wǎng)站,專業(yè)設(shè)計,全程項(xiàng)目跟蹤,創(chuàng)新互聯(lián)公司專業(yè)和態(tài)度為您提供的服務(wù)
數(shù)據(jù)是當(dāng)今世界不可或缺的一部分。它可以幫助我們預(yù)測各種事件,并為我們的生活指明方向。Pandas幫助我們控制和操縱這些數(shù)據(jù)。Pandas提供了基本的數(shù)據(jù)結(jié)構(gòu),如Series,DataFrame和Panel,可用來處理數(shù)據(jù)集和時間序列。它是免費(fèi)使用的開放源代碼庫,使其成為世界上使用最廣泛的數(shù)據(jù)科學(xué)庫之一。
Pandas擁有執(zhí)行各種任務(wù)的能力。無論是執(zhí)行諸如查找數(shù)據(jù)的均值,中位數(shù)和眾數(shù)之類的任務(wù),還是根據(jù)我們的意愿處理大型CSV文件并處理內(nèi)容的任務(wù),Pandas都能做到。簡而言之,要掌握數(shù)據(jù)科學(xué),必須精通Pandas。
如何安裝Pandas:
使用Anaconda安裝Pandas,這是在系統(tǒng)上獲取Pandas的最簡單方法,建議新手和沒有經(jīng)驗(yàn)的用戶使用。例如NumPy和SciPy。下載安裝程序后,只需執(zhí)行簡單的設(shè)置過程即可。結(jié)束后,就可以輕松訪問Pandas庫。
1、點(diǎn)擊開始欄,搜索cmd并打開。
2、找到安裝的Python路徑。
3、進(jìn)入文件路徑。在輸入cd+空格+文件路徑,進(jìn)入文件路徑下進(jìn)行安裝。
4、輸入命令pipinstallpandas執(zhí)行安裝。返回panel的數(shù)據(jù)類型。
Pandas是python第三方庫,提供高性能易用數(shù)據(jù)類型和分析工具
import pandas as pd
Pandas基于Numpy實(shí)現(xiàn),常與Numpy和Matplotlib一同使用
兩個數(shù)據(jù)類型:Series,DataFrame
基于上述數(shù)據(jù)類型的各類操作(基本操作、運(yùn)算操作、特征類操作、關(guān)聯(lián)類操作)
Series類型可以由如下類型創(chuàng)建:
1.python列表,index與列表元素個數(shù)一致
2.標(biāo)量值,index表達(dá)Series類型的尺寸
3.python字典,鍵值對中的‘鍵’是索引,index從字典中進(jìn)行選擇操作
4.ndarray,索引和數(shù)據(jù)都可以通過ndarray類型創(chuàng)建
5.其他函數(shù),range()函數(shù)等
Series類型的基本操作
Series類型包括index和value兩部分
Series類型的操作類似ndarray類型
Series類型的操作類似python字典類型
Series類型的操作類似ndarray類型:
1.索引方法相同,采用[]
2.numpy中運(yùn)算和操作可用于series類型
3.可以通過自定義索引的列表進(jìn)行切片
4.可以通過自動索引進(jìn)行切片,如果存在自定義索引,則一同被切片
Series類型的操作類似python字典類型:
1.通過自定義索引訪問
2.保留字in操作
3.使用.get()方法
Series是一維帶‘標(biāo)簽’數(shù)組
index_0?? ---data_a
Series基本操作類似ndarray和字典,根據(jù)索引對齊
DataFrame類型可以由如下類型創(chuàng)建:
1.二維ndarray對象
2.由一維ndarray、列表、字典、元組或Series構(gòu)成的字典
3.Series類型
4.其他的DataFrame類型
重新索引
.reindex(index=None,columns=None,...)的參數(shù)
index,columns??????????? 新的行列自定義索引
fill_value?????????????????????? 重新索引中,用于填充缺失位置的值
method?????????????????????? 填充方法,ffill當(dāng)前值向前填充,bfill向后填充
limit???????????????????????????? 最大填充量
copy???????????????????????????? 默認(rèn)true,生成新的對象,false時,新舊相等不復(fù)制
索引類型的常用方法
.append(idx)?????????? 鏈接另一個index對象,產(chǎn)生新的index對象
.diff(idx)??????????????????? 計算差集,產(chǎn)生新的index對象
.intersection(idx)??????? 計算交集
.union(idx)?????????????????? 計算并集
.delete(loc)??????????????? 刪除loc位置處的元素
.insert(loc,e)?????????????? 在loc位置增加一個元素e
算術(shù)運(yùn)算法則
算術(shù)運(yùn)算根據(jù)行列索引,補(bǔ)齊后運(yùn)算,運(yùn)算默認(rèn)產(chǎn)生浮點(diǎn)數(shù)
補(bǔ)齊時缺項(xiàng)填充NaN(空值)
二維和一維、一維和零維間為廣播運(yùn)算
采用+ - * /符號進(jìn)行的二元運(yùn)算產(chǎn)生新的對象
方法形式運(yùn)算
.add(d,**argws)??? 類型間加法運(yùn)算,可選參數(shù)
.sub(d,**argws)? ? 類型間減法運(yùn)算,可選參數(shù)
.mul(d,**argws)? ? 類型間乘法運(yùn)算,可選參數(shù)
.div(d,**argws)? ? 類型間除法運(yùn)算,可選參數(shù)
比較運(yùn)算法則
比較運(yùn)算只能比較相同索引的元素,不進(jìn)行補(bǔ)齊
二維和一維、一維和零維間為廣播運(yùn)算
采用? ? =? =? ==? !=等符號進(jìn)行的二元運(yùn)算產(chǎn)生布爾對象
.sort_values()方法在指定軸上根據(jù)數(shù)值進(jìn)行排序,默認(rèn)升序
Series.sort_values(axis=0,ascending=True)
DataFrame.sort_values(by,axis=0,ascending=True)
by:axis軸上的某個索引或索引列表
適用于Series和DataFrame類型
.sum()?????????? 計算數(shù)據(jù)的總和,按0軸計算,下同
.count()???????? 非NaN值的數(shù)量
.mean()? .median()?? 計算數(shù)據(jù)的算術(shù)平均值,算術(shù)中位數(shù)
.var()?? .std()????? 計算數(shù)據(jù)的方差、標(biāo)準(zhǔn)差
.min()???? .max()???? 計算數(shù)據(jù)的最小值、最大值
.describe()???????? 針對0軸(各列)的統(tǒng)計匯總
適用于Series
.argmin()??? .argmax()??? 計算數(shù)據(jù)最大值、最小值所在位置的索引位置(自動索引)
.idxmin()???? .idxmax() ?? 計算數(shù)據(jù)最大值、最小值所在位置的索引(自定義索引)
適用于Series和DataFrame類型,累計計算
.cumsun()????????????????? 依次給出前1、2、...、n個數(shù)的和
.cumprod()? ? ? ? ? ? ? ?? 依次給出前1、2、...、n個數(shù)的積
.cummax()? ? ? ? ? ? ? ??? 依次給出前1、2、...、n個數(shù)的最大值
.cummin()?????????????????? 依次給出前1、2、....、n個數(shù)的最小值
適用于Series和DataFrame類型,滾動計算(窗口計算)
.rolling(w).sum()??????????????? 依次計算相鄰w個元素的和
.rolling(w).mean()? ? ? ? ? ? ?? 依次計算相鄰w個元素的算術(shù)平均值
.rolling(w).var()? ? ? ? ? ? ? ? ? ? 依次計算相鄰w個元素的方差
.rolling(w).std()? ? ? ? ? ? ? ???? 依次計算相鄰w個元素的標(biāo)準(zhǔn)差
.rolling(w).min() ? .max()? ? ? ? ? ? ? ? 依次計算相鄰w個元素的最小值和最大值
兩個事物,表示為x和y,如何判斷它們之間的存在相關(guān)性?
相關(guān)性
1.x增大,y增大,兩個變量正相關(guān)
2.x增大,y減小,兩個變量負(fù)相關(guān)
3.x增大,y無視,兩個變量不相關(guān)
相關(guān)分析函數(shù)
適用于Series和DataFrame類型
.cov()??????????????? 計算協(xié)方差矩陣
.corr()???????????????? 計算相關(guān)系數(shù)矩陣,Pearson、Spearman、Kendall等系數(shù)
分享題目:go語言pandas庫 golang pandas
瀏覽路徑:http://m.newbst.com/article2/doghooc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站內(nèi)鏈、企業(yè)建站、網(wǎng)站改版、微信小程序、網(wǎng)站營銷、網(wǎng)站收錄
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)