iis服务器助手广告
返回顶部
首页 > 资讯 > 精选 >Spark中MLlib和ML库的区别是什么
  • 772
分享到

Spark中MLlib和ML库的区别是什么

2023-06-19 10:06:28 772人浏览 安东尼
摘要

这篇文章给大家介绍spark中MLlib和ML库的区别是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。机器学习库(MLlib)MLlib是Spark的机器学习(ML)库。其目标是使实际的机器学习可扩展和容易。在高层

这篇文章给大家介绍spark中MLlib和ML库的区别是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。

机器学习库(MLlib)

MLlib是Spark的机器学习(ML)库。其目标是使实际的机器学习可扩展和容易。在高层次上,它提供了如下工具

  • ML算法:通用学习算法,如分类,回归,聚类和协同过滤

  • 特征提取,特征提取,转换,降维和选择

  • 管道:用于构建,评估和调整ML管道的工具

  • 持久性:保存和加载算法,模型和管道

  • 实用程序:线性代数,统计,数据处理等

公告:基于DataFrame的API是主要的API

MLlib基于RDD的API现在处于维护模式。

从Spark 2.0开始,包中的基于RDD的api spark.mllib已进入维护模式。Spark的主要机器学习API现在是包中的基于DataFrame的API spark.ml

有什么影响?

  • MLlib将仍然支持基于RDD的API spark.mllib并修复错误。

  • MLlib不会将新功能添加到基于RDD的API。

  • 在Spark 2.x版本中,MLlib将向基于DataFrame的API添加功能,以便与基于RDD的API达成功能对等。

  • 达到功能对等(大致估计为Spark 2.2)后,基于RDD的API将被弃用。

  • 基于RDD的API预计将在Spark 3.0中被删除。

为什么MLlib切换到基于DataFrame的API?

  • DataFrames提供比RDD更友好的API。DataFrame的许多优点包括Spark数据源,sql / DataFrame查询,Tungsten和Catalyst优化以及跨语言的统一API。

  • MLlib的基于DataFrame的API提供跨ML算法和跨多种语言的统一API。

  • 数据框便于实际的ML管线,特别是功能转换。

什么是“Spark ML”?

  • “Spark ML”不是一个正式的名字,偶尔用于指代基于MLlib DataFrame的API。这主要是由于org.apache.spark.ml基于DataFrame的API所使用的Scala包名以及我们最初用来强调管道概念的“Spark ML Pipelines”术语。

MLlib是否被弃用?

  • 编号MLlib包括基于RDD的API和基于DataFrame的API。基于RDD的API现在处于维护模式。

依赖

MLlib使用线性代数包Breeze,它依赖于 netlib-java进行优化的数值处理。如果本机库在运行时不可用,您将看到一条警告消息,而将使用纯JVM实现。

由于运行时专有二进制文件的授权问题,netlib-java默认情况下,我们不包含本地代理。要配置netlib-java/ Breeze以使用系统优化的二进制文件,请包括 com.GitHub.fommil.netlib:all:1.1.2(或者构建Spark -Pnetlib-lgpl)作为项目的依赖项,并阅读netlib-java文档以获取平台的其他安装说明。

要在python中使用MLlib,您将需要NumPy 1.4或更高版本。

关于Spark中MLlib和ML库的区别是什么就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

--结束END--

本文标题: Spark中MLlib和ML库的区别是什么

本文链接: https://www.lsjlt.com/news/295589.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Spark中MLlib和ML库的区别是什么
    这篇文章给大家介绍Spark中MLlib和ML库的区别是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。机器学习库(MLlib)MLlib是Spark的机器学习(ML)库。其目标是使实际的机器学习可扩展和容易。在高层...
    99+
    2023-06-19
  • hadoop和spark的区别是什么
    这篇文章主要讲解了“hadoop和spark的区别是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“hadoop和spark的区别是什么”吧!主要是从四个方面对Hadoop和spark进行...
    99+
    2023-06-02
  • Hadoop和Spark有什么区别
    这篇文章将为大家详细讲解有关Hadoop和Spark有什么区别,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。解决问题的层面不一样首先,Hadoop和Apache Spark两者都是大数据框架,但是各自存在...
    99+
    2023-06-28
  • Spark中的窄依赖和宽依赖有什么区别
    在Spark中,窄依赖和宽依赖是指不同的RDD之间的依赖关系。它们的区别在于如何执行操作和进行数据分区。 窄依赖(Narrow ...
    99+
    2024-03-04
    Spark
  • 什么是Spark中的数据分区
    Spark中的数据分区是将数据划分成多个部分的过程。数据分区可以提高Spark作业的并行度,使得Spark集群中的多个节点可以同时处...
    99+
    2024-03-05
    Spark
  • python模块和库的区别是什么
    Python的模块和库是两个不同的概念。 模块(Module):模块是一个包含Python代码的文件,通常包含了函数、类和变量的...
    99+
    2024-03-02
    python
  • MYSQL中#和$的区别是什么
    小编给大家分享一下MYSQL中#和$的区别是什么,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!他们之间的区别用最直接的话来说就是...
    99+
    2024-04-02
  • MySQL中“:=”和“=”的区别是什么
    小编给大家分享一下MySQL中“:=”和“=”的区别是什么,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!=只有在set和upda...
    99+
    2024-04-02
  • Servlet中/和/*的区别是什么
    这篇文章主要讲解了“Servlet中/和demo:这个urlPatterns是合法的。只不过它属于精确匹配,也就是说别看它中间有*,仍旧有且仅能匹配/api/*/demo这个请求路径匹配顺序有时候一个URL会被多个urlPatterns所匹...
    99+
    2023-06-20
  • 数据库中join和union的区别是什么
    Join和Union是数据库中常用的两种操作,它们有不同的作用和用法。 Join: Join是用于将两个或多个表中的...
    99+
    2024-03-04
    数据库
  • Mybatis中#和$的区别是什么
    这篇文章主要介绍“Mybatis中#和$的区别是什么”,在日常操作中,相信很多人在Mybatis中#和$的区别是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Mybatis中#和$的区别是什么”的疑惑有所...
    99+
    2023-06-22
  • oracle中{}和${}区别是什么
    这篇文章主要介绍“oracle中{}和${}区别是什么”,在日常操作中,相信很多人在oracle中{}和${}区别是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”orac...
    99+
    2024-04-02
  • 在Spark中,什么是数据分区
    数据分区是将数据集划分成多个较小的分区,以便并行处理和分布式计算。在Spark中,数据分区是在RDD(弹性分布式数据集)中进行的,默...
    99+
    2024-03-05
    Spark
  • 数据库中数组和链表的区别是什么
    本篇文章为大家展示了数据库中数组和链表的区别是什么,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。数组和链表的区别  从逻辑结构上来看,数组必须实现定于固定的长度,不...
    99+
    2024-04-02
  • 云服务器和数据库的区别和联系与区别是什么
    云服务器和数据库都是常用的网络存储和数据备份解决方案,但它们在一些方面存在一些明显的区别。 云服务器是一种虚拟化服务器,用户只需访问服务器的一个或多个磁盘空间,而无需访问物理计算机或存储设备。它们通常用于数据备份,因为它们提供了一个更高效...
    99+
    2023-10-27
    区别 服务器 数据库
  • SQL Server和MySQL数据库的区别是什么
    SQL Server和MySQL数据库的区别是什么,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。 1,优点分析:MYSQL短小精悍,...
    99+
    2024-04-02
  • ./ 和 sh 的区别是什么
    ./ 和 sh 的区别是什么?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。./ 和 sh的使用区别使用“./”执行脚本,对应的xxx.sh脚本必须要有执行权限;使用“sh”...
    99+
    2023-06-09
  • php中TCP和UDP的区别是什么
    这篇文章主要介绍了php中TCP和UDP的区别是什么,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。1、使用区别(1)TCP面向连接,UDP是无连接的,即发送数据之前不需要建立...
    99+
    2023-06-15
  • jquery中parent()和parents()的区别是什么
    jquery中parent()和parents()的区别是什么?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。jquery是什么jquery是一个简洁而快速的Ja...
    99+
    2023-06-14
  • java中this和super的区别是什么
    java中this和super的区别是什么?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。Java是什么Java是一门面向对象编程语言,可以编写桌面应用程序、We...
    99+
    2023-06-14
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作