iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python数据分析之将爬取的数据保存为csv格式
  • 284
分享到

python数据分析之将爬取的数据保存为csv格式

2024-04-02 19:04:59 284人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

目录csv文件python的csv模块从csv文件读取内容写入csv文件运用实例数据准备将数据存为字典的形式存储到csv文件总结csv文件 一种用逗号分割来实现存储表格数据的文本文件

csv文件

一种用逗号分割来实现存储表格数据的文本文件。

Python的csv模块

python遍历代码:

arr = [12, 5, 33, 4, 1]
#遍历输出1
for i in range(0, len(arr)):
    item = arr[i]
    print(item)

#遍历输出2
for item in arr:
    print(item)

#遍历输出3
string_arr = ["hi", "hello", "你好", "aloha"]
for item in string_arr:
    print("本次循环 item 变量的值", item)

从csv文件读取内容

用DictReader对象的创建方法以及通过filenames属性获取csv表格的表头。

import csv
#打开csv
fo = open("info.csv")
#打开csv文件的文件对象作为参数来创建dictreader类的对象,存在reader变量中
reader = csv.DictReader(fo)
#调用reader对象的filednames属性,获取csv文件表格的开头
headers = reader.fieldnames
#关闭文件
fo.close()
#打印
print(headers)

获取表格实际内容。

fo = open("info.csv")
reader = csv.DictReader(fo)
#创建列表,存储读到的行
row_list = []
#遍历
for row in reader:
    row_list.append(row)
fo.close()
#打印
print(row_list[0])
#遍历row_list
for d in row_list:
    #d是字典,直接打印key为年龄值即可
    print(d["年龄"])
#打印

写入csv文件

python提供了DictWriter方法,可以讲表格数据以字典的形式存储到csv文件中。

import csv
#打开一个文件,假设是info.csv,写入所以是w
#newline='',写入时需要指定
fo = open("info2.csv", "w", newline='')
#将表头存储到一个列表里
header = ["姓名", "年龄", "部门"]
#创建一个DictWriter对象,第二个参数就是上面创建的表头
writer = csv.DictWriter(fo, header)
writer.writeheader()
#写入一行记录,以字典的形式,key需要与表头对应
writer.writerow({"姓名": "小明", "年龄":"28", "部门": "行政部"})
#关闭文件
fo.close()

运行后,相应的文件夹下会出现一个对应的csv文件。

也可以使用writer.writerows(row_list)来写入多个。

运用实例

数据准备

1、打开网页,读取内容,并创建相应的BeautifulSoup对象

2、找到包含新闻的div元素列表

3、从2中抽取标题

4、从2中抽取时间

from bs4 import BeautifulSoup
def create_doc_from_filename(filename):
    fo = open(filename, "r", encoding='utf-8')
    html_content = fo.read()
    fo.close
    doc = BeautifulSoup(html_content)
    return doc

(记得要pip install bs4)

#输入参数是BeautifulSoup对象,返回包含新闻的div元素列表
def find_index_labels(doc):
    index_labels = doc.find_all("div", class_ = "indexs")
    return index_labels
#实现新闻标题的抽取函数
def get_title(label_object):
    #从刚才的参数传入的标签对象中过滤出所有的target = _blank的a标签
    a_labels = label_object.find_all("a", target = "_blank")
    #取得第一个标签对象
    my_label = a_labels[0]
    #将标签的文字内容作为返回值返回
    return my_label.get_text()
#实现获取新闻发布时间的函数
def get_pub_time(label_object):
    #找到class = comment-link的span标签
    spans = label_object.find_all("span", class_ = "comment-link")
    #取第一个
    span = spans[0]
    #返回标题属性
    return span["title"]
#获取新闻标题与列表
#调用create_doc_from_filename函数
doc = create_doc_from_filename("jiandan.html")
#传入BeautifulSoup对象,将返回的div列表存储在index_labels中
index_labels = find_index_labels(doc)
for label_object in index_labels:
    title = get_title(label_object)
    pub_time = get_pub_time(label_object)
    print("标题", title)
    print("发布时间", pub_time)

将数据存为字典的形式

#获取新闻标题与列表
#调用create_doc_from_filename函数
doc = create_doc_from_filename("jiandan.html")
#传入BeautifulSoup对象,将返回的div列表存储在index_labels中
index_labels = find_index_labels(doc)
news_dict_list = []
for label_object in index_labels:
    title = get_title(label_object)
    pub_time = get_pub_time(label_object)
    news = {"标题": title, "发布时间": pub_time}
    news_dict_list.append(news)
print(news_dict_list)

存储到csv文件

#创建csv
fo = open("news.csv", "w", newline='', encoding='utf-8')
#表头
header = ["标题", "发布时间"]
writer = csv.DictWriter(fo, header)
#写入表头
writer.writeheader()
#将上一步的字典写入csv文件中
writer.writerows(news_dict_list)
fo.close()

总结

到此这篇关于python数据分析之将爬取的数据保存为csv格式的文章就介绍到这了,更多相关python爬取数据保存csv格式内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: python数据分析之将爬取的数据保存为csv格式

本文链接: https://www.lsjlt.com/news/151225.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python数据分析之将爬取的数据保存为csv格式
    目录csv文件python的csv模块从csv文件读取内容写入csv文件运用实例数据准备将数据存为字典的形式存储到csv文件总结csv文件 一种用逗号分割来实现存储表格数据的文本文件...
    99+
    2024-04-02
  • python爬虫——保存数据为.csv文件
    CSV(Comma Separated Values)格式是电子表格和数据库中最常见的输入、输出文件格式 爬虫保存数据为.csv文件步骤:  导包 import csv 创建或打开文件,设置文件形式 csvfile = open('文件名....
    99+
    2023-10-21
    python 开发语言 数据分析 爬虫
  • python爬取网页数据到保存到csv
    目录任务需求:爬取网址:网址页面:代码实现结果:代码实现: 完整代码:总结任务需求: 爬取一个网址,将网址的数据保存到csv中。 爬取网址: https://www.iqi...
    99+
    2024-04-02
  • 将爬取的数据保存到mysql中
    为了把数据保存到mysql费了很多周折,早上再来折腾,终于折腾好了 安装数据库 1、pip install pymysql(根据版本来装) 2、创建数据       打开终端 键入mysql -u root -p  回车输入密码     ...
    99+
    2023-01-30
    数据 将爬取 mysql
  • python怎么爬取数据保存到数据库
    要将爬取的数据保存到数据库,可以使用Python的数据库模块(如SQLite、MySQL、MongoDB等)将数据插入到数据库中。以...
    99+
    2023-09-08
    python 数据库
  • C++中如何将数据保存为CSV文件
    目录C++将数据保存为CSV文件如何存储CSV文件C++将数据保存为CSV文件 因为最近涉及到保存模型推理结果的输出文件,所以学一学如何将数据保存为CSV文件,比如保存检测框box的...
    99+
    2022-11-16
    C++ CSV文件 数据保存为CSV文件 C++ 数据保存
  • Python全面解析json数据并保存为csv文件
    目录解析json数据并保存为csv文件完整代码将json任意行文件转为csv文件并保存将json格式的前3000条数据存入csv解析json数据并保存为csv文件 首先导入两个包: ...
    99+
    2024-04-02
  • python数据如何保存为npy和npz格式并读取
    这篇“python数据如何保存为npy和npz格式并读取”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“python数据如何保...
    99+
    2023-07-02
  • Python数据分析入门之数据读取与存储
    目录一、图示二、csv文件三、数据库交互一、图示 二、csv文件 1.读取csv文件read_csv(file_path or buf,usecols,encoding):fil...
    99+
    2024-04-02
  • python-将excel表格中的数据转化为json数据格式
    前言 excel表格中的数据,转化为json格式,再用程序去处理json数据,是常见的数据处理方式。这样可以实现按照需求去做数据处理。 需要用到的软件 除了python环境外,主要用到读取excel文...
    99+
    2023-09-02
    python excel json
  • python 数据保存为npy和npz格式并读取的完整代码
    目录python 数据保存为npy格式python 数据保存为npz格式python 数据保存为npy格式 补充:numpy.save("./文件名", 数组名)...
    99+
    2024-04-02
  • Python爬虫如何获取数据并保存到数据库中
    本篇内容主要讲解“Python爬虫如何获取数据并保存到数据库中”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python爬虫如何获取数据并保存到数据库中”吧!1.简介介绍-网络爬虫(又称为网页蜘...
    99+
    2023-07-02
  • Python 读取数据并保存为txt文件的方式
     首先是读取文件,这里使用了pandas库 import pandas as pddata_train = pd.read_csv("train_dataset.csv", encoding='utf-8',sep='|')train_co...
    99+
    2023-09-27
    python 开发语言
  • Python爬虫之爬取2020女团选秀数据的示例分析
    这篇文章主要介绍Python爬虫之爬取2020女团选秀数据的示例分析,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!一、先看结果1.1创造营2020撑腰榜前三甲创造营2020撑腰榜前三名分别是 希林娜依·高、陈卓璇 、...
    99+
    2023-06-14
  • C#将DataGridView中的数据保存到CSV和Excel中
    一、保存到CSV public static bool dataGridViewToCSV(DataGridView dataGridView) { ...
    99+
    2024-04-02
  • Python数据分析之Python和Selenium爬取BOSS直聘岗位
    目录一、数据爬取的代码二、获取到的数据如图所示三、数据分析的代码四、学历分析五、工作经验分析六、14个热门城市的各区县招聘薪资情况七、各城市各区县的薪资情况八、技能栈一、数据爬取的代...
    99+
    2024-04-02
  • Pandas保存csv数据的三种方式详解
    目录方法一方法二方法三补充方法一 import os import pandas as pd path = 'data/train/' img_label_list=[] test...
    99+
    2024-04-02
  • Python爬虫与数据分析之爬虫技能:u
    专栏目录: Python爬虫与数据分析之python教学视频、python源码分享,python Python爬虫与数据分析之基础教程:Python的语法、字典、元组、列表 Python爬虫与数据分析之进阶教程:文件操作、lambda表达...
    99+
    2023-01-31
    爬虫 技能 数据
  • C#怎么将DataGridView中的数据保存到CSV和Excel中
    这篇文章主要介绍“C#怎么将DataGridView中的数据保存到CSV和Excel中”,在日常操作中,相信很多人在C#怎么将DataGridView中的数据保存到CSV和Excel中问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作...
    99+
    2023-06-30
  • Python爬取天气数据及可视化分析
    正文 大家好,我是Python人工智能技术天气预报我们每天都会关注,我们可以根据未来的天气增减衣物、安排出行,每天的气温、风速风向、相对湿度、空气质量等成为关注的焦点。得到温湿度度变化曲线、空气质量图、风向雷达图等结果,为获得未来天气信息提...
    99+
    2023-05-14
    Python 天气数据 可视化分析
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作