久久久久久久av_日韩在线中文_看一级毛片视频_日本精品二区_成人深夜福利视频_武道仙尊动漫在线观看

  • <small id='ZDe2z'></small><noframes id='ZDe2z'>

    <i id='ZDe2z'><tr id='ZDe2z'><dt id='ZDe2z'><q id='ZDe2z'><span id='ZDe2z'><b id='ZDe2z'><form id='ZDe2z'><ins id='ZDe2z'></ins><ul id='ZDe2z'></ul><sub id='ZDe2z'></sub></form><legend id='ZDe2z'></legend><bdo id='ZDe2z'><pre id='ZDe2z'><center id='ZDe2z'></center></pre></bdo></b><th id='ZDe2z'></th></span></q></dt></tr></i><div class="qwawimqqmiuu" id='ZDe2z'><tfoot id='ZDe2z'></tfoot><dl id='ZDe2z'><fieldset id='ZDe2z'></fieldset></dl></div>

    1. <tfoot id='ZDe2z'></tfoot>
      <legend id='ZDe2z'><style id='ZDe2z'><dir id='ZDe2z'><q id='ZDe2z'></q></dir></style></legend>

        • <bdo id='ZDe2z'></bdo><ul id='ZDe2z'></ul>

        在spark sql中轉換兩個數據幀

        Transforming two dataframes in spark sql(在spark sql中轉換兩個數據幀)
            <tbody id='shLLP'></tbody>

            • <i id='shLLP'><tr id='shLLP'><dt id='shLLP'><q id='shLLP'><span id='shLLP'><b id='shLLP'><form id='shLLP'><ins id='shLLP'></ins><ul id='shLLP'></ul><sub id='shLLP'></sub></form><legend id='shLLP'></legend><bdo id='shLLP'><pre id='shLLP'><center id='shLLP'></center></pre></bdo></b><th id='shLLP'></th></span></q></dt></tr></i><div class="qwawimqqmiuu" id='shLLP'><tfoot id='shLLP'></tfoot><dl id='shLLP'><fieldset id='shLLP'></fieldset></dl></div>
              <tfoot id='shLLP'></tfoot>
              <legend id='shLLP'><style id='shLLP'><dir id='shLLP'><q id='shLLP'></q></dir></style></legend>

              <small id='shLLP'></small><noframes id='shLLP'>

                  <bdo id='shLLP'></bdo><ul id='shLLP'></ul>
                  本文介紹了在spark sql中轉換兩個數據幀的處理方法,對大家解決問題具有一定的參考價值,需要的朋友們下面隨著小編來一起學習吧!

                  問題描述

                  我在 spark scala 中有兩個數據框注冊為表.從這兩個表

                  I am having two dataframes in spark scala registered as tables. From these two tables

                  表 1:

                     +-----+--------+
                     |id   |values  |
                     +-----+-----   +
                     |   0 |  v1    |
                     |   0 |  v2    |
                     |   1 |  v3    |
                     |   1 |  v1    |
                     +-----+-----   +
                  

                  表 2:

                     +-----+----+--- +----+
                     |id   |v1  |v2  | v3
                     +-----+-------- +----+
                     |   0 |  a1|  b1| -  |
                     |   1 |  a2|  - | c2 |
                  
                     +-----+---------+----+   
                  

                  我想用上面兩個表生成一個新表.

                  I want to generate a new table using the above two tables.

                  表 3:

                     +-----+--------+--------+
                     |id   |values  | field  |
                     +-----+--------+--------+
                     |   0 |  v1    | a1     |
                     |   0 |  v2    | b1     |
                     |   1 |  v3    | c2     |
                     |   1 |  v1    | a2     |
                     +-----+--------+--------+
                  

                  這里 v1 的形式是

                  Here v1 is of the form

                   v1: struct (nullable = true)
                      |    |-- level1: string (nullable = true)
                      |    |-- level2: string (nullable = true)
                      |    |-- level3: string (nullable = true)
                      |    |-- level4: string (nullable = true)
                      |    |-- level5: string (nullable = true)
                  

                  我在 scala 中使用 spark sql.

                  I am using spark sql in scala .

                  是否可以通過在數據幀上編寫一些 sql 查詢或使用一些 spark 函數來完成所需的操作.

                  Is it possible to do the desired thing by writing some sql query or using some spark functions on dataframes.

                  推薦答案

                  這是您可以使用的示例代碼,它將生成此輸出:

                  Here is the sample code that you can use , that will generate this output :

                  代碼如下:

                  val df1=sc.parallelize(Seq((0,"v1"),(0,"v2"),(1,"v3"),(1,"v1"))).toDF("id","values")
                  val df2=sc.parallelize(Seq((0,"a1","b1","-"),(1,"a2","-","b2"))).toDF("id","v1","v2","v3")
                  val joinedDF=df1.join(df2,"id")
                  val resultDF=joinedDF.rdd.map{row=>
                  val id=row.getAs[Int]("id")
                  val values=row.getAs[String]("values")
                  val feilds=row.getAs[String](values)
                  (id,values,feilds)
                  }.toDF("id","values","feilds")
                  

                  在控制臺上測試時:

                  scala> val df1=sc.parallelize(Seq((0,"v1"),(0,"v2"),(1,"v3"),(1,"v1"))).toDF("id","values")
                  df1: org.apache.spark.sql.DataFrame = [id: int, values: string]
                  
                  scala> df1.show
                  +---+------+
                  | id|values|
                  +---+------+
                  |  0|    v1|
                  |  0|    v2|
                  |  1|    v3|
                  |  1|    v1|
                  +---+------+
                  
                  
                  scala> val df2=sc.parallelize(Seq((0,"a1","b1","-"),(1,"a2","-","b2"))).toDF("id","v1","v2","v3")
                  df2: org.apache.spark.sql.DataFrame = [id: int, v1: string ... 2 more fields]
                  
                  scala> df2.show
                  +---+---+---+---+
                  | id| v1| v2| v3|
                  +---+---+---+---+
                  |  0| a1| b1|  -|
                  |  1| a2|  -| b2|
                  +---+---+---+---+
                  
                  
                  scala> val joinedDF=df1.join(df2,"id")
                  joinedDF: org.apache.spark.sql.DataFrame = [id: int, values: string ... 3 more fields]
                  
                  scala> joinedDF.show
                  +---+------+---+---+---+                                                        
                  | id|values| v1| v2| v3|
                  +---+------+---+---+---+
                  |  1|    v3| a2|  -| b2|
                  |  1|    v1| a2|  -| b2|
                  |  0|    v1| a1| b1|  -|
                  |  0|    v2| a1| b1|  -|
                  +---+------+---+---+---+
                  
                  
                  scala> val resultDF=joinedDF.rdd.map{row=>
                       | val id=row.getAs[Int]("id")
                       | val values=row.getAs[String]("values")
                       | val feilds=row.getAs[String](values)
                       | (id,values,feilds)
                       | }.toDF("id","values","feilds")
                  resultDF: org.apache.spark.sql.DataFrame = [id: int, values: string ... 1 more field]
                  
                  scala> 
                  
                  scala> resultDF.show
                  +---+------+------+                                                             
                  | id|values|feilds|
                  +---+------+------+
                  |  1|    v3|    b2|
                  |  1|    v1|    a2|
                  |  0|    v1|    a1|
                  |  0|    v2|    b1|
                  +---+------+------+
                  

                  我希望這可能是您的問題.謝謝!

                  I hope this might your problem. Thanks!

                  這篇關于在spark sql中轉換兩個數據幀的文章就介紹到這了,希望我們推薦的答案對大家有所幫助,也希望大家多多支持html5模板網!

                  【網站聲明】本站部分內容來源于互聯網,旨在幫助大家更快的解決問題,如果有圖片或者內容侵犯了您的權益,請聯系我們刪除處理,感謝您的支持!

                  相關文檔推薦

                  How to use windowing functions efficiently to decide next N number of rows based on N number of previous values(如何有效地使用窗口函數根據 N 個先前值來決定接下來的 N 個行)
                  reuse the result of a select expression in the quot;GROUP BYquot; clause?(在“GROUP BY中重用選擇表達式的結果;條款?)
                  Does ignore option of Pyspark DataFrameWriter jdbc function ignore entire transaction or just offending rows?(Pyspark DataFrameWriter jdbc 函數的 ignore 選項是忽略整個事務還是只是有問題的行?) - IT屋-程序員軟件開發技
                  Error while using INSERT INTO table ON DUPLICATE KEY, using a for loop array(使用 INSERT INTO table ON DUPLICATE KEY 時出錯,使用 for 循環數組)
                  pyspark mysql jdbc load An error occurred while calling o23.load No suitable driver(pyspark mysql jdbc load 調用 o23.load 時發生錯誤 沒有合適的驅動程序)
                  How to integrate Apache Spark with MySQL for reading database tables as a spark dataframe?(如何將 Apache Spark 與 MySQL 集成以將數據庫表作為 Spark 數據幀讀取?)
                      • <bdo id='rZjtB'></bdo><ul id='rZjtB'></ul>
                        <tfoot id='rZjtB'></tfoot>
                        • <i id='rZjtB'><tr id='rZjtB'><dt id='rZjtB'><q id='rZjtB'><span id='rZjtB'><b id='rZjtB'><form id='rZjtB'><ins id='rZjtB'></ins><ul id='rZjtB'></ul><sub id='rZjtB'></sub></form><legend id='rZjtB'></legend><bdo id='rZjtB'><pre id='rZjtB'><center id='rZjtB'></center></pre></bdo></b><th id='rZjtB'></th></span></q></dt></tr></i><div class="qwawimqqmiuu" id='rZjtB'><tfoot id='rZjtB'></tfoot><dl id='rZjtB'><fieldset id='rZjtB'></fieldset></dl></div>

                            <small id='rZjtB'></small><noframes id='rZjtB'>

                              <tbody id='rZjtB'></tbody>

                            <legend id='rZjtB'><style id='rZjtB'><dir id='rZjtB'><q id='rZjtB'></q></dir></style></legend>
                          1. 主站蜘蛛池模板: 一级亚洲| 日韩精品久久一区二区三区 | 狠狠综合网 | 男女网站在线观看 | 一区二区三区免费 | 国产精品99久久久久 | 一级片免费视频 | 日本欧美视频 | 日韩成人一区 | 午夜寂寞福利视频 | 伊人久久免费视频 | 日韩在线视频一区 | 一区二区在线看 | 亚洲一区二区三区在线播放 | 国产精品免费一区二区三区四区 | 日韩欧美国产精品一区二区 | av官网在线| 免费精品| 欧美11一13sex性hd | 成人av在线播放 | 国产成人精品视频在线观看 | 日本一区二区高清视频 | 福利视频大全 | 国产一级片免费视频 | 九一视频在线播放 | 日本韩国欧美在线观看 | 国产高清在线精品一区二区三区 | 在线观看中文字幕 | 狠狠操av | 91久色 | 国产日韩欧美精品 | 国产成人精品a视频一区www | 国产农村妇女精品一二区 | 黑人粗黑大躁护士 | 影音先锋欧美资源 | 国产中文字幕网 | 欧美一级三级在线观看 | 免费黄色网址视频 | 成人黄色a | 欧美黄视频| 久久一 |