python里面的xlrd模块详解以及样例-白红宇

python里面的xlrd模块详解以及样例

阅读量：5051 次

发布时间：2019-06-12

本文共 4326 字，大约阅读时间需要 14 分钟。

什么是xlrd模块？

　　♦python操作excel主要用到xlrd和xlwt这两个库，即xlrd是读excel，xlwt是写excel的库。

　　♦python读取excel中单元格的内容返回的有5种类型:

　　　　ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error

相关方法介绍

Book(class) 由xlrd.open_work("example.xls")返回nsheets:                      sheets数sheet_names:                  sheet名称列表sheets:                       sheet列表sheet_by_index(sheetx):       按序号提取sheetsheet_by_name(sheet_name):    按名称提取sheetSheet(class) 由Book object相关方法返回name: 　　　　　　　　　　　　　　　　　　　　　　　　sheet名nrows:                                          行数ncols:                                          列数cell(rowx,colx):                                第rows行colx列的单元格cell_type(rowx,colx):                           数据类型cell_value(rows,colx):                          数值col(colx):                                      第colx列所有单元格组成的列表col_slice(colx,start_rowx=0,end_rowx=None):     第colx列指定单元格组成的列表col_types(colx,start_rowx=0,end_rowx=None):     第colx列指定单元格数值类型组成的列表col_values(colx,start_rowx=0,end_rowx=None):    第colx列指定单元格数值组成的列表row同样有col的各项操作，此处略去Cell(class) 由Sheet object(s)相关方法返回ctype:    一个int型变量，对应不同的数值类型value:    单元格的值

方法以及返回值介绍

一、安装xlrd模块

　　♦ 到python官网下载模块安装，前提是已经安装了python 环境。

　　♦或者在cmd窗口 pip3 install xlrd

二、使用介绍

　　1、常用单元格中的数据类型

　　2、导入模块

import xlrd

　　3、打开Excel文件读取数据

data = xlrd.open_workbook(filename)#文件名以及路径，如果路径或者文件名有中文给前面加一个r拜师原生字符。

　　4、常用的函数

♦ excel中最重要的方法就是book和sheet的操作

　　 1）获取book中一个工作表

table = data.sheets()[0]          #通过索引顺序获取table = data.sheet_by_index(sheet_indx)) #通过索引顺序获取table = data.sheet_by_name(sheet_name)#通过名称获取以上三个函数都会返回一个xlrd.sheet.Sheet()对象names = data.sheet_names()    #返回book中所有工作表的名字data.sheet_loaded(sheet_name or indx)   # 检查某个sheet是否导入完毕

如：

2）行的操作

nrows = table.nrows  #获取该sheet中的有效行数table.row(rowx)  #返回由该行中所有的单元格对象组成的列表table.row_slice(rowx)  #返回由该列中所有的单元格对象组成的列表table.row_types(rowx, start_colx=0, end_colx=None)    #返回由该行中所有单元格的数据类型组成的列表table.row_values(rowx, start_colx=0, end_colx=None)   #返回由该行中所有单元格的数据组成的列表table.row_len(rowx) #返回该列的有效单元格长度

3）列(colnum)的操作

ncols = table.ncols   #获取列表的有效列数table.col(colx, start_rowx=0, end_rowx=None)  #返回由该列中所有的单元格对象组成的列表table.col_slice(colx, start_rowx=0, end_rowx=None)  #返回由该列中所有的单元格对象组成的列表table.col_types(colx, start_rowx=0, end_rowx=None)    #返回由该列中所有单元格的数据类型组成的列表table.col_values(colx, start_rowx=0, end_rowx=None)   #返回由该列中所有单元格的数据组成的列表

如：

4）单元格的操作

table.cell(rowx,colx)   #返回单元格对象table.cell_type(rowx,colx)    #返回单元格中的数据类型table.cell_value(rowx,colx)   #返回单元格中的数据table.cell_xf_index(rowx, colx)   # 暂时还没有搞懂

♦单元格：单元格是表格中行与列的交叉部分，它是组成表格的最小单位，可拆分或者合并。单个数据的输入和修改都是在单元格中进行的

如：

注意：注意作用域问题，之前获取的sheet之后，都在获取到这个sheet值后，在进行，行和列以及单元格的操作。

问题现象：

问题一：

　　♦1、使用open()函数、xlrd.open_workbook()函数打开文件，文件名若包含中文，会报错找不到这个文件或目录。

　　♦2、获取sheet时若包含中文，也会报错。

#打开文件file = open(filename,'rb')#打开excel文件workbook = xlrd.open_workbook(filename)#获取sheetsheet = workbook.sheet_by_name(sheetname)

解决方案：

　　♦对参数进行转码即可。如：

filename = filename.decode('utf-8')

　　♦也试过unicode函数，不过，在ride中运行时出现了报错，所以不赞成使用。

filename = unicode(filename,'utf-8')

问题二;

　　问题描述： python读取excel中单元格内容为日期时，字段里明明是日期，可读取后显示的却是浮点数。

　　♦python读取excel中单元格的内容返回的有5种类型:

　　　　ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error

1.判断类型演示： >>> sheet2.cell(2,2).ctype  #1990/2/223>>> sheet2.cell(2,1).ctype  #182>>> sheet2.cell(2,0).ctype  #测试1>>> sheet2.cell(2,4).ctype  #空值（这里是合并单元格的原因）0 2。解决浮点数问题，正确取值方式：>>> sheet2.cell(2,2).value  #1990/2/2233656.0>>> xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode)(1992, 2, 22, 0, 0, 0)>>> date_value =xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode)>>> date_value(1992, 2, 22, 0, 0, 0)>>> date(*date_value[:3])datetime.date(1992, 2, 22)>>> date(*date_value[:3]).strftime('%Y/%m/%d') '1992/02/22'

即可以做下简单处理，判断ctype是否等于3，如果等于3，则用时间格式处理：

if (sheet.cell(row,col).ctype == 3):    date_value = xlrd.xldate_as_tuple(sheet.cell_value(rows,3),book.datemode)    date_tmp = date(*date_value[:3]).strftime('%Y/%m/%d')

问题三：

　　问题描述：读取合并单元格内容中内容sheet2.cell(2,4).ctype返回的值是0，说明这个单元格的值是空值，这就是这个包不完善的地方，如果是合并单元格那么应该合并的单元格内容一样，但是它只是合并的第一个单元格有值，其它为空。

　　解决办法：通过获取merge_cells返回的row和col低位的索引来判断哪些是合并单元格，然后做后续取值操作。

　　　　读取文件的时候需要将formatting_info参数设置为True，默认是False，所以上面获取合并的单元格数组为空，

　　　　详细查看该链接：