Python遍历文件夹寻找目标文件读取txt文件数据

2023-12-08 03:49:11

python中想要读取多个文件的数据时，首先便是要获取目标文件的路径名称。而遍历文件夹寻找目标文件可通过os或pathlib库实现，pathlib相对来说代码更为精炼，本文将使用pathlib实现文件夹遍历，并以txt文件为例寻找目标文件，读取数据。

文件夹遍历

首先导入库函数，遍历指定文件夹下所有指定类型的文件（txt为例）

from pathlib import Path  # 导入库def find_all_files(files_path):"""遍历指定文件夹所有指定类型文件"""p = Path(files_path)files_names = []  # 存储文件路径名称for file in p.rglob('*.txt'):  # 寻找所有txt文件files_names.append(str(file))  # 以字符串形式保存return files_names files_path = 'E:/Desktop/GitHub'  # 文件夹
files_names = find_all_files(files_path)  # 获取所有文件路径名称

寻找目标文件

在上述所有txt文件中寻找符合条件的目标文件，比如命名符合一定规则的文件

def object_files(files_names, key_word):"""找出目标文件"""files = []  # 存储符合条件的目标文件路径名称for i in files_names:  # 遍历所有文件if key_word in i:  # key_word表示文件命名中存在的关键词 可根据关键词筛选文件files.append(i)  # 若文件名称中存在关键词 则将其保存在列表中return files  # 返回目标文件路径名称# 例如每次实验数据都保存一个文件夹，第一个样本数据命名为'obj_1'
# 则可通过设置'obj_1'关键词找出第一个样本的多次实验数据
files_path = 'E:/Desktop/GitHub'  # 文件夹
key_word = 'obj_1'  # 关键词
files_names = find_all_files(files_path)  # 所有文件路径名称
object_files_names = object_files(files_names, key_word)  # 目标文件路径名称

找出所有目标文件名称，则可以遍历实现读取其中的数据，不用一个个手动输入

读取txt文件数据

txt文件中第一行通常是数据名称，可通过itertllos.islice跳过前n行，不读取前n行数据

import numpy as np
from itertools import islicedef load_dataset(filename):"""导入txt文件数据"""dataset = []  # 保存读取的数据with open(filename, 'r') as file_obj:  # 打开文件for line in islice(file_obj, 2, None): # 跳过前2行数据if not line:  # 如果存在空白行则执行下一次循环，跳过空白行continueline_arr = []  # 用于存储每一行的数据# 将每一行数据按照空格分开 若是逗号则为line.split(',')for i, data in enumerate(line.split()):if i < 10:  # 数据截止在第10列 i表示第几个数据data_value = data.strip()  # 删除数字两边的空格line_arr.append(str(data_value))  # 若文件中有字符，则需字符串格式保存 dataset.append(line_arr)  # 将每一行数据保存dataset.pop(-1)  # 若最后一行数据不完全，则可删除dataset = np.array(dataset)  # 列表转换为数组# 若文件中存在不需要的数据，则可进行删减；或者需要一些数据处理等操作dataset = np.delete(dataset,[0,1,3], axis=1)  # 删除不需要的列dataset = dataset.astype(float)  # 将字符串转换为浮点数dataset[:, 4:7] = dataset[:, 4:7] * np.pi / 180  # 角度换算弧度 return datasetif __name__ == '__main__':files_path = 'E:/Desktop/GitHub'  # 文件夹key_word = 'obj_1'  # 关键词files_names = find_all_files(files_path)  # 所有文件路径名称object_files_names = object_files(files_names, key_word)  # 目标文件路径名称dataset = []  # 用于存储数据for filename in object_files_names:  data_one = load_dataset(filename)  # 遍历目标文件，读取数据dataset.append(data_one)  # 将所有文件的数据保存在dataset列表中

作者水平有限，文中若有错误望大家指出，共同学习，共同进步

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > tomcat部署时项目文件夹消失
下一篇 > 使用python将文件夹中的图片批量旋转(扩充数据集)

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

Python遍历文件夹 寻找目标文件 读取txt文件数据

文件夹遍历

寻找目标文件

读取txt文件数据

相关文章

Python遍历文件夹寻找目标文件读取txt文件数据