Spark 2.4.0主要变更

原文:https://spark.apache.org/releases/spark-release-2-4-0.html

概述

2.4.0是2.x的第五个版本, 这个版本更好得整合了为深度学习设计的的Barrier Execution Mode;增加了30多个处理复杂数据类型的的高阶内置函数;增强了k8s的集成; 支持了Scala2.12;支持了Avro作为数据源; 支持图片数据源;更灵活的流式数据提取;去除了2GB块大小的限制;增强Pandas UDF;还解决了其他1100个问题.

Core and Spark SQL

主要特征

API

其他

Table of Contents