【Python文件处理】递归批处理文件夹子目录内所有txt数据,泡泡网笔记本_编程语言

文件名：【Python文件处理】递归批处理文件夹子目录内所有txt数据,泡泡网笔记本【Python文件处理】递归批处理文件夹子目录内所有txt数据

因为有个需求，需要处理文件夹内所有txt文件，将txt里面的数据筛选，重新存储。

虽然手工可以做，但想到了python一直主张的是自动化测试，就想试着写一个自动化处理数据的程序。

一.分析数据格式

需要处理的数据是txt格式存储的。下图中一行中的数据依次是，帧、时间、编号、特征点编号、特征点名字、特征点世界坐标x,y,z，特征点屏幕坐标x,y，一共32个特征点，最后6个数据是头部姿态的位置x,y,z和偏转角度x,y,z。一行共计233个字段。

需要完成的工作是，把特征点的编号，世界坐标，屏幕坐标分别写入2个csv文件中。

因为后面需要用到svm分类器，在数据挖掘软件weka中进行分类。

二.Python文件读取操作

　　需要做的是Python中txt文件读取操作，然后利用split()函数将每行的字符串分割成元组，然后利用下标讲我们需要保留的数据写入到新的txt中。

常见的Python文件读取txt的方法有3种：

　　方法一：

1 f = open("foo.txt") # 返回一个文件对象 2 line = f.readline() # 调用文件的 readline()方法 3 while line: 4 print line, # 后面跟 ',' 将忽略换行符 5 # print(line, end = '')　　　# 在 Python 3中使用 6 line = f.readline() 7 8 f.close()

　　方法二：

1 for line in open("foo.txt"): 2 print line

　　方法三：

1 f = open("c:\\1.txt","r") 2 lines = f.readlines()#读取全部内容 3 for line in lines 4 print line

因为需要处理的数据最后一行不完整，所以，我们只处理到倒数第二行。用readlines()读取到的是一个List，每行是一个元素。所以可以用len()方法统计有多少行，处理的时候处理到倒数第二行停止。

完成我们的需求：

1 def readFile(filepath): 2 f1 = open(filepath, "r") #打开传进来的路径 3 f_world = open("WorldData", "w") 4 f_image = open("ImageData", "w") 5 lines = f1.readlines() #读取所有行 6 lines_count = len(lines) 　#统计行数 7 for n in range(0, lines_count-1): 8 line = lines[n] 9 line_object = line.split('\t')10 11 i = 512 13 worldposition = ""14 imageposition = ""15 while i <= 223: 　　　　#取值16 id = line_object[i - 2]17 world_x = line_object[i]18 world_y = line_object[i + 1]19 world_z = line_object[i + 2]20 worldposition = id + " " + world_x + world_y + world_z21 # print worldposition22 f_world.write(worldposition)23 24 image_x = line_object[i + 3]25 image_y = line_object[i + 4]26 imageposition = id + " " + image_x + image_y27 f_image.write(imageposition)28 29 i += 730 i -= 131 headposition = line_object[i - 1] + line_object[i] + line_object[i + 1]32 headrotate = line_object[i + 2] + line_object[i + 3] + line_object[i + 4]33 head = headposition + headrotate + "\n"34 35 print head36 f_world.write(head) # 写入文件操作37 f_image.write(head)38 f1.close()39 f_image.close()40 f_world.close()

三.递归遍历文件夹下多个txt文件

　　因为需要处理的数据不止一个，用自动化的思想来解决这个问题，需要依次遍历文件夹下多个txt文件。

代码如下：

1 def eachFile(filepath): 2 pathDir = os.listdir(filepath) #获取当前路径下的文件名，返回List 3 for s in pathDir: 4 newDir=os.path.join(filepath,s) #将文件命加入到当前文件路径后面 5 if os.path.isfile(newDir) : #如果是文件 6 if os.path.splitext(newDir)[1]==".txt": #判断是否是txt 7 readFile(newDir) #读文件 8 pass 9 else:10 eachFile(newDir) #如果不是文件，递归这个文件夹的路径

四.对处理得到的文件进行命名

　　需求是，处理完一个txt，如abc.txt，然后生成的文件，命名为World_abc.txt和Image_abc.txt，并将生成的文件保存在和源文件同样的目录下面。

　　思路是，对路径就行分割，使用

　　　　os.path.split(filepath)

返回的是一个2个元素的元祖，第一个元素是文件夹路径，第二个是文件名。

1 nowDir = os.path.split(filepath)[0] #获取路径中的父文件夹路径2 fileName = os.path.split(filepath)[1] #获取路径中文件名3 WorldDataDir = os.path.join(nowDir, "WorldData_" + fileName) #对新生成的文件进行命名的过程4 ImageDataDir = os.path.join(nowDir, "ImageData_" + fileName)5 6 f_world = open(WorldDataDir, "w")7 f_image = open(ImageDataDir, "w")

处理完之后就哗哗哗生成一大堆了。

完整代码：

1 # -*- coding: utf-8 2 #读文件 3 import os 4 5 #处理文件数量 6 count=0 7 8 def readFile(filepath): 9 f1 = open(filepath, "r")10 nowDir = os.path.split(filepath)[0] #获取路径中的父文件夹路径11 fileName = os.path.split(filepath)[1] #获取路径中文件名12 WorldDataDir = os.path.join(nowDir, "WorldData_" + fileName) #对新生成的文件进行命名的过程13 ImageDataDir = os.path.join(nowDir, "ImageData_" + fileName)14 15 f_world = open(WorldDataDir, "w")16 f_image = open(ImageDataDir, "w")17 lines = f1.readlines()18 lines_count = len(lines)19 for n in range(0, lines_count-1):20 line = lines[n]21 line_object = line.split('\t')22 23 i = 524 25 worldposition = ""26 imageposition = ""27 while i <= 223:28 id = line_object[i - 2]29 world_x = line_object[i]30 world_y = line_object[i + 1]31 world_z = line_object[i + 2]32 worldposition = id + " " + world_x + world_y + world_z33 # print worldposition34 f_world.write(worldposition)35 36 image_x = line_object[i + 3]37 image_y = line_object[i + 4]38 imageposition = id + " " + image_x + image_y39 f_image.write(imageposition)40 41 i += 742 i -= 143 headposition = line_object[i - 1] + line_object[i] + line_object[i + 1]44 headrotate = line_object[i + 2] + line_object[i + 3] + line_object[i + 4]45 head = headposition + headrotate + "\n"46 47 print head48 f_world.write(head)49 f_image.write(head)50 f_world.write("world")51 f_image.write("image")52 f1.close()53 f_image.close()54 f_world.close()55 56 global count57 count+=158 59 def eachFile(filepath):60 pathDir = os.listdir(filepath) #获取当前路径下的文件名，返回List61 for s in pathDir:62 newDir=os.path.join(filepath,s) #将文件命加入到当前文件路径后面63 if os.path.isfile(newDir) : #如果是文件64 if os.path.splitext(newDir)[1]==".txt": #判断是否是txt65 readFile(newDir) #读文件66 pass67 else:68 eachFile(newDir) #如果不是文件，递归这个文件夹的路径69 70 71 eachFile("D:\Python\SVM_Data")72 print "共处理"+bytes(count)+"个txt" View Code 补充：

代码中添加了一个globle count变量，记录处理的txt数目，因为python语言是弱类型的语言，在函数中，想要改变全局遍历的值。

1 count=02 def xxx():3 global count #声明这里的count是全局变量count4 count+=1

最后输出count数量的时候

1 print "共处理"+count+"个txt" #报错，字符类型和值类型不能这样输出2 3 print "共处理"+bytes(count)+"个txt" #使用bytes方法，将值类型转换成字符类型

python OS模块的官方文档：

10.1. os.path — Common pathname manipulations — Python 2.7.13 documentation

https://docs.python.org/2.7/library/os.path.html

转载于:https://www.cnblogs.com/SeekHit/p/6245283.html

【Python文件处理】递归批处理文件夹子目录内所有txt数据,泡泡网笔记本

【QT--使用百度地图API显示地图并绘制路线】,魅族m6固件下载

【QT5-程序控制电源-RS232-SCPI协议-上位机-基础样例【1】】,phiaton（qt上位机源码）

【Python CheckiO 题解】Text Editor,诺基亚手机系列

【Python 必会技巧】对字典按照键（key）或者值（value）排序,飞利浦mix

【Python 训练营】N_13 遍历字符串,叫兽tv

【Python】 list dict str,x9.gs

【Python】OpenCV安装,泡泡网（python opencv安装教程）

【Python】PySpark,昂达v812（昂达v801s四核版说明书）

【Python】Scrapy的安装与使用,s9500（python scrapy安装）

【Python】【Torch】神经网络中各层输出的特征图可视化详解和示例,reicat

【Python】从入门到上头—Python基础（2）,pcpop网（《python从入门到精通》）

« 2026年2月 »
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28