使用Dataframe分析出租車的 GPS信息

大小: 7.12MB

文件類型: .zip

金幣: 2

下載: 0 次

發布日期: 2023-09-23
語言: 其他
標簽: spark??dataframe??python??

高速下載

資源簡介

現有某地區出租車 GPS 定位數據 taxi.csv 數據一共分為 4 列，每一列含義如下表所示：編號（id）緯度（lat）經度（lon）時間戳（time）根據上述條件，結合課堂上學習的“DataFrame的常用操作”相關知識，編寫代碼實現如下要求： 1、查詢編號為 5 的出租車的 GPS 數據的前 10 行。 2、統計出租車的總數有多少。分別統計每輛出租車的 GPS 點記錄有多少條。

資源截圖

小圖大圖

代碼片段和文件信息

from?pyspark.shell?import?sc
from?pyspark.sql.types?import?*
#
rdd?=sc.textFile（“xxxx/taxi.csv“）
rdd1?=?rdd.map（lambda?line:line.split（““））.map（lambda?x:tuple（x））
schema?=?StructType（[StructField（“id“StringType（）True）StructField（“lat“StringType（）True）StructField（“lon“StringType（）True）StructField（“time“StringType（）True）]）
df?=?rdd1.toDF（schema）

#?df.filter（“id==5“）.show（10）
df=?df.withColumn（“id“?df[“id“].cast（IntegerType（）））
df1?=df.select（“id“）.distinct（）.count（）
#?print（df1）
df2=df.groupBy（“id“）.count（）
df3?=?df2.orderBy（“id“）
df3.show（df1）
#?df.show（）

?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件????26476814??2019-05-15?02:46??taxi.csv
?????文件?????????589??2019-05-16?00:54??taxi.py

上一篇：姿態解算8--成功測距.rar
下一篇：電子線路線性部分非線性部分第四版謝嘉奎答案

xxxx18一60岁hd中国/日韩女同互慰一区二区/西西人体扒开双腿无遮挡/日韩欧美黄色一级片 - 色护士精品影院www

使用Dataframe分析出租車的 GPS信息

資源簡介

資源截圖

代碼片段和文件信息

評論

相關資源