久久久久久久av_日韩在线中文_看一级毛片视频_日本精品二区_成人深夜福利视频_武道仙尊动漫在线观看

R語言dplyr包之高效數據處理函數(filter、group_b

這篇文章主要介紹了R語言dplyr包之高效數據處理函數(filter、group_by、mutate、summarise)的相關知識,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋

R語言dplyr包的數據整理、分析函數用法文章連載NO.01

在日常數據處理過程中難免會遇到些難處理的,選取更適合的函數分割、篩選、合并等實在是大快人心!

利用dplyr包中的函數更高效的數據清洗、數據分析,及為后續數據建模創造環境;本篇涉及到的函數為filter、filter_all()、filter_if()、filter_at()、mutate、group_by、select、summarise。

1、數據篩選函數:

#可使用filter()函數篩選/查找特定條件的行或者樣本
#filter(.data=,condition_1,condition_2)#將返回相匹配的數據

#同時可以多條件匹配multiple condition,當采用多條件匹配時可直接condition1,condition2或者condition1&condition2
#其他邏輯表達還有:==,>,>=等,&,|,!,xor(),is.na,between,near

#filter延展的相關函數filter_all()、filter_if()、filter_at()

#以iris數據集為例:


filter(.data=iris,Sepal.Length>3,Sepal.Width<3.5)
 
filter(.data=iris,Sepal.Length>3,Species=="virginica")

輸出情況:                                                                          輸出情況: 

#要使用filter_all()、filter_if()、filter_at()需要先去掉Species列(非數值型列) 


iris_data<-iris%>% select(-Species)

#篩選所有屬性小于6的行 


iris_data%>% filter_all(all_vars(.<6))

部分輸出情況: 

 

#篩選任意一個屬性大于3的行


iris_data%>% filter_all(any_vars(.>3))

#篩選以sep開頭的屬性任一大于3的行


iris_data%>% filter_at(vars(starts_with("Sep")), any_vars(. >3))

#R中自帶數據集mtcars,篩選任意一個屬性大于150的行


filter_all(mtcars, any_vars(. > 150))

#篩選以d開頭的屬性任一可被2整除的行


filter_at(mtcars, vars(starts_with("d")), any_vars((. %% 2) == 0))

2、數據分組、匯總函數group_by、summarise

其他延展函數 group_by_all、group_by_if、group_by_at(將在后續文章中解析)

 group_by函數按照某個變量分組,對于數據集本身并不會發生什么變化,只有在與mutate(), arrange() 和 summarise() 函數結合應用的時候會體現出它的優越性,將會對這些 tbl 類數據執行分組操作 (R語言泛型函數的優越性).


mtcars_cyl <- mtcars %>% group_by(cyl)
 
mtcars_cyl %>% summarise(
disp = mean(disp),
hp = mean(hp)
)


mtcars_vs_am <- mtcars %>% group_by(vs, am)
 
mtcars_vs <- mtcars_vs_am %>% summarise(n = n())

3、新增列函數mutate,在數據集的基礎上新增列,不對原數據作更改

可用的相關參數、邏輯:

• +, - 等等
• log()
• lead(), lag()
• dense_rank(), min_rank(), percent_rank(), row_number(), cume_dist(), ntile()
• cumsum(), cummean(), cummin(), cummax(), cumany(), cumall()
• na_if(), coalesce()
• if_else(), recode(), case_when()

相關延展函數:transmute、mutate_all、mutate_if、mutate_at(后期文章分享)


mtcars %>% as_tibble() %>% mutate(
cyl2 = cyl*3,
cyl4 = cyl2+2
)

到此這篇關于R語言dplyr包之高效數據處理函數(filter、group_by、mutate、summarise)詳解的文章就介紹到這了,更多相關R語言dplyr包數據處理函數內容請搜索html5模板網以前的文章希望大家以后多多支持html5模板網!

【網站聲明】本站部分內容來源于互聯網,旨在幫助大家更快的解決問題,如果有圖片或者內容侵犯了您的權益,請聯系我們刪除處理,感謝您的支持!

相關文檔推薦

主站蜘蛛池模板: 免费激情| 99国产精品久久久久老师 | 精品视频一区二区 | 国产日韩欧美在线 | 免费日韩av网站 | 九九久久精品 | 久久精品小视频 | 国产精品麻 | 国产精品久久久久久久久 | 欧美一级片 | 精品久久久久久亚洲综合网站 | 天天干天天干 | 欧美a级成人淫片免费看 | 久操亚洲 | 99久久婷婷国产综合精品首页 | 亚洲视频www | 中文字幕1区 | 色视频欧美 | 久久精品一区 | yiren22综合网成人 | 国内精品久久久久久 | 91久久国产精品 | 99精彩视频| 久在线| 精品欧美久久 | 91秦先生艺校小琴 | 亚洲人成在线播放 | 国产日韩精品一区二区 | 国产欧美精品一区二区三区 | 国产精品免费高清 | 久久久久久免费毛片精品 | 日韩国产一区二区三区 | 国产一区二区在线视频 | 精品国产一区二区在线 | 国产一区二区不卡 | 欧美美乳| 国产成人精品免费视频大全最热 | 一级欧美黄色片 | 天天干狠狠干 | 日韩午夜电影在线观看 | 中文字幕av网址 |