久久久久久久av_日韩在线中文_看一级毛片视频_日本精品二区_成人深夜福利视频_武道仙尊动漫在线观看

<ul id="woyco"></ul>

<ul id="woyco"></ul>

<tfoot id="woyco"></tfoot>

<fieldset id="woyco"></fieldset>

PySpark - 在數據框中求和一列并將結果返回為 in

2023-01-01 Python問題 html5模板網

PySpark - Sum a column in dataframe and return results as int(PySpark - 在數據框中求和一列并將結果返回為 int)

本文介紹了PySpark - 在數據框中求和一列并將結果返回為 int的處理方法，對大家解決問題具有一定的參考價值，需要的朋友們下面隨著小編來一起學習吧！

問題描述

我有一個帶有一列數字的 pyspark 數據框.我需要對該列求和，然后將結果返回為 python 變量中的 int.

I have a pyspark dataframe with a column of numbers. I need to sum that column and then have the result return as an int in a python variable.

df = spark.createDataFrame([("A", 20), ("B", 30), ("D", 80)],["Letter", "Number"])

我執行以下操作來對列求和.

I do the following to sum the column.

df.groupBy().sum()

但我得到了一個數據框.

But I get a dataframe back.

+-----------+
|sum(Number)|
+-----------+
|        130|
+-----------+

我會將 130 作為存儲在變量中的 int 返回，以便在程序中的其他位置使用.

I would 130 returned as an int stored in a variable to be used else where in the program.

result = 130

推薦答案

最簡單的方法真的:

df.groupBy().sum().collect()

但是操作很慢:避免groupByKey，你應該使用RDD和reduceByKey:

But it is very slow operation: Avoid groupByKey, you should use RDD and reduceByKey:

df.rdd.map(lambda x: (1,x[1])).reduceByKey(lambda x,y: x + y).collect()[0][1]

我嘗試了更大的數據集并測量了處理時間:

I tried on a bigger dataset and i measured the processing time:

RDD 和 ReduceByKey:2.23 秒

RDD and ReduceByKey : 2.23 s

GroupByKey:30.5 秒

GroupByKey: 30.5 s

這篇關于PySpark - 在數據框中求和一列并將結果返回為 int的文章就介紹到這了，希望我們推薦的答案對大家有所幫助，也希望大家多多支持html5模板網！

【網站聲明】本站部分內容來源于互聯網,旨在幫助大家更快的解決問題，如果有圖片或者內容侵犯了您的權益，請聯系我們刪除處理，感謝您的支持！

上一篇：對對象列表的屬性求和/平均下一篇：使用 sum() 連接元組

相關文檔推薦

列表字典中的總和值

Sum values in a dict of lists(列表字典中的總和值)

如何在 Python 中對文本文件中的數字求和

How to sum numbers from a text file in Python(如何在 Python 中對文本文件中的數字求和)

什么是類似于 sum() 的減法函數，用于減去列表中

What is a subtraction function that is similar to sum() for subtracting items in list?(什么是類似于 sum() 的減法函數，用于減去列表中的項目?)

Python 等價于 sum() 使用 xor()

Python equivalent of sum() using xor()(Python 等價于 sum() 使用 xor())

python中的求和矩陣列

sum matrix columns in python(python中的求和矩陣列)

N個列表元素的總和python

sum of N lists element-wise python(N個列表元素的總和python)

欄目導航

前端問題解決 Java問題 php問題 Python問題 C#/.NET問題 C/C++問題移動開發問題數據庫問題

最新文章

熱門文章

熱門標簽

css3 html5 canvas 域名頁域名停放地板扁平在線客服動畫特效按鈕切換動畫模板 360 angular jquery svg 游戲模板物流網站博客攝影導航小說源碼郵件群發蘋果cms 微擎微贊微商訂單系統小程序電影源碼微信程序帝國cms 養生網挖礦網 java視頻視頻打賞 thinkphp 蜘蛛池 discuz模板淘寶客音樂分發系統 o2o 微擎視頻教程商城掃碼點餐零售系統進銷存系統 bootstrap 商城模板商務合作廣告設計驗證碼門戶 ar OElove 漫畫網全景視頻區塊鏈虛擬幣你畫我猜卡券微小區交友小游戲 3d 刷單小米資源 ai

主站蜘蛛池模板：男人av网| 国产精品自拍视频 | 国产午夜精品一区二区三区嫩草 | 99国产精品久久久久久久 | 欧美一区二区三区大片 | 欧洲精品视频一区 | 国产a视频| 久久久久国产 | 性高朝久久久久久久3小时 av一区二区三区四区 | 国内自拍视频在线观看 | 亚洲在线一区二区三区 | 在线激情视频 | 欧美激情在线一区二区三区 | 国内精品一区二区三区 | 视频在线h | 国产成人一区二区三区 | 国产男女视频 | 久久精品国产久精国产 | 中文精品一区二区 | 亚洲精品视 | 在线免费观看一区二区 | 国产一区二区欧美 | aaaa网站| 日韩欧美三区 | 精品国产一区二区三区四区在线 | 精品国产视频 | 精品国产乱码久久久久久闺蜜 | 亚洲精品久久久久久一区二区 | 日韩视频在线播放 | 亚洲一区中文 | 99热电影| 日韩有码一区 | 精品国产1区2区3区在线国产视频 | 国产精品久久在线 | 欧美一区二区三区视频在线播放 | 一区二区三区精品在线视频 | 久久蜜桃资源一区二区老牛 | 91视频在线观看 | 久久av一区二区 | 日韩电影免费在线观看中文字幕 | 欧美日韩久久精品 |

<abbr id="yykyi"><th id="yykyi"></th></abbr>

<option id="yykyi"><code id="yykyi"></code></option>