Python读取csv文件做K-means分析详情

2024-04-02 19:04:59 504人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

目录1.运行环境及数据2.基于时间序列的分析2D2.1 2000行数据结果展示2.2 6950行数据结果展示2.3 300M,约105万行数据结果展示 3.经纬度高程三维坐

1.运行环境及数据

python3.7、PyCharm CommUnity Edition 2021.1.1，win10系统。

使用的库：matplotlib、numpy、sklearn、pandas等

数据：CSV文件，包含时间，经纬度，高程等数据

2.基于时间序列的分析2D

读取时间列和高程做一下分析：

代码如下：

from PIL import Image
import matplotlib.pyplot as plt
import numpy as np
from sklearn.cluster import KMeans, MiniBatchKMeans
import pandas as pd
 
if __name__ == "__main__":
    data = pd.read_csv(r"H:\CSDN_Test_Data\UseYourTestData.csv")
    x, y = data['Time (sec)'], data['Height (m HAE)']
    n = len(x)
    x = np.array(x)
    x = x.reshape(n, 1)#reshape 为一列
    y = np.array(y)
    y = y.reshape(n, 1)#reshape 为一列
    data = np.hstack((x, y)) #水平合并为两列
    k = 8  # 设置颜色聚类的类别个数（我们分别设置8，16，32，64，128进行对比）
    cluster = KMeans(n_clusters=k)  # 构造聚类器
    C = cluster.fit_predict(data)
    # C_Image = cluster.fit_predict(data)
    print("训练总耗时为：%s(s)" % (Trainingtime).seconds)
    plt.figure()
    plt.scatter(data[:, 0], data[:, 1], marker='o', s=2, c=C)
    plt.show()

结果展示：

2.1 2000行数据结果展示

2.2 6950行数据结果展示

2.3 300M,约105万行数据结果展示

CPU立马90%以上了。大约1-2分钟，也比较快了。

markersize有些大了，将markersize改小一些显示，设置为0.1，点太多还是不明显。

3.经纬度高程三维坐标分类显示3D-空间点聚类

修改代码，读取相应的列修改为X,Y,Z坐标：如下：

from PIL import Image
import matplotlib.pyplot as plt
import numpy as np
from sklearn.cluster import KMeans, MiniBatchKMeans
import pandas as pd
from mpl_toolkits.mplot3d import Axes3D
 
if __name__ == "__main__":
    data = pd.read_csv(r"H:\CSDN_Test_Data\UseYourTestData.csv")
    x, y,z = data['Longitude (deg)'],data['Latitude (deg)'],  data['Height (m HAE)']
    n = len(x)
    x = np.array(x)
    x = x.reshape(n, 1)#reshape 为一列
    y = np.array(y)
    y = y.reshape(n, 1)#reshape 为一列
    z = np.array(z)
    z = z.reshape(n, 1)  # reshape 为一列
    data = np.hstack((x, y, z)) #水平合并为两列
    k = 8  # 设置颜色聚类的类别个数（我们分别设置8，16，32，64，128进行对比）
    cluster = KMeans(n_clusters=k)  # 构造聚类器
    C = cluster.fit_predict(data)
 
    # C_Image = cluster.fit_predict(data)
    print("训练总耗时为：%s(s)" % (Trainingtime).seconds)
    fig = plt.figure()
    ax = Axes3D(fig)
 
    ax.scatter(data[:, 0], data[:, 1],data[:, 2], s=1, c=C)
    # 绘制图例
    ax.legend(loc='best')
    # 添加坐标轴
    ax.set_zlabel('Z Label', fontdict={'size': 15, 'color': 'red'})
    ax.set_ylabel('Y Label', fontdict={'size': 15, 'color': 'red'})
    ax.set_xlabel('X Label', fontdict={'size': 15, 'color': 'red'})
    plt.show()

3.1 2000行数据结果显示

由于经度在纬度方向上在17m范围类，所以立体效果较差，可以换其他数据测试。

3.2 300M的CSV数据计算显示效果

105万行数据显示结果：

到此这篇关于python读取csv文件做K-means分析详情的文章就介绍到这了,更多相关Python读取csv文件内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Python读取csv文件做K-means分析详情

本文链接: https://www.lsjlt.com/news/144415.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Python读取csv文件做K-means分析详情

目录1.运行环境及数据2.基于时间序列的分析2D2.1 2000行数据结果展示2.2 6950行数据结果展示2.3 300M,约105万行数据结果展示 3.经纬度高程三维坐...

99+

2022-11-13
Python取读csv文件做dbscan分析

目录1.读取csv数据做dbscan分析2.输出结果显示3.计算效率1.读取csv数据做dbscan分析读取csv文件中相应的列，然后进行转化，处理为本算法需要的格式，然后进行db...

99+

2022-11-10
Python怎么取读csv文件做dbscan分析

本篇内容介绍了“Python怎么取读csv文件做dbscan分析”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！1.读取csv数据做dbsca...

99+

2023-06-30
在python中读取和写入CSV文件详情

目录前言1.导入CSV库2.对CSV文件进行读写2.1 用列表形式写入CSV文件2.2 用列表形式读取CSV文件2.3 用字典形式写入csv文件2.4 用字典形式读取csv文件结语前...

99+

2022-11-11
python数据分析之文件读取详解

目录前言：一·Numpy库中操作文件二·Pandas库中操作文件三·补充总结前言：如果你使用的是Anaconda中的Jupyter，则不需要下载Pands和Numpy库；如果你使用...

99+

2022-11-12
详解Python读取和写入操作CSV文件的方法

目录什么是 CSV 文件？内置 CSV 库解析 CSV 文件读取 CSV 文件csv将 CSV 文件读入字典csv可选的 Python CSV reader参数使用 csv 写入文件...

99+

2022-11-13
使用python的pandas读取excel文件中的数据详情

目录一、读取Excel文件二、DataFrame对象的结构三、用values方式获取数据1.基本方法2.获取指定数据的写法3.示例四、用loc和iloc方式获取数据1.基本写法2.示...

99+

2022-11-11
Mybatis sql与xml文件读取方法详细分析

在执行一个自定义sql语句时，dao对应的代理对象时如何找到sql，也就是dao的代理对象和sql之间的关联关系是如何建立的。 ...

99+

2023-01-28

Mybatis sql文件读取 Mybatis xml文件读取
Python数据分析基础之文件的读取

目录一·Numpy库中操作文件1.操作csv文件2.在pycharm中操作csv文件3.其他情况(.npy类型文件)二·Pandas库中操作文件1.操作csv文件2.从剪贴板上复制数...

99+

2022-11-12
java读取大文件内容到Elasticsearch分析（手把手教你java处理超大csv文件）

现在需要快速分析一个2g的csv文件；基于掌握的知识，使用java按行读取文件，批量导入数据到Elasticsearch，然后利用es强大的聚合能力分析数据，1个小时搞定！ package com.example.demo; ...

99+

2014-09-14

java读取大文件内容到Elasticsearch分析（手把手教你java处理超大csv文件）
SpringBoot加载读取配置文件过程详细分析

目录配置文件的读取顺序多坏境的配置文件个性化配置自定义配置文件名称和路径加载yml文件springboot默认读取的配置文件名字是：“application.proper...

99+

2023-01-28

SpringBoot加载配置文件 SpringBoot读取配置文件
Python遍历目录下文件、读取、千万条数据合并详情

目录一、使用Python进行文件和文件夹的判断二、使用Python完整的获取所有文件及文件夹并读取相应的文件三、使用Python合并数据append的使用一、使用Python进行文件...

99+

2022-11-12
python open读取文件内容时的mode模式实例分析

今天小编给大家分享一下python open读取文件内容时的mode模式实例分析的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来...

99+

2023-06-30
Python遍历目录下文件、读取、千万条数据合并实例分析

这篇文章给大家介绍Python遍历目录下文件、读取、千万条数据合并实例分析，内容非常详细，感兴趣的小伙伴们可以参考借鉴，希望对大家能有所帮助。一、使用Python进行文件和文件夹的判断递归：主要目的就是遍历文件夹和文件对文件夹和文件进行属...

99+

2023-06-26