博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python里面的xlrd模块详解以及样例
阅读量:5051 次
发布时间:2019-06-12

本文共 4326 字,大约阅读时间需要 14 分钟。

什么是xlrd模块?

  ♦python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。

  ♦python读取excel中单元格的内容返回的有5种类型:

    ctype :  0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error

相关方法介绍

Book(class) 由xlrd.open_work("example.xls")返回nsheets:                      sheets数sheet_names:                  sheet名称列表sheets:                       sheet列表sheet_by_index(sheetx):       按序号提取sheetsheet_by_name(sheet_name):    按名称提取sheetSheet(class) 由Book object相关方法返回name:                         sheet名nrows:                                          行数ncols:                                          列数cell(rowx,colx):                                第rows行colx列的单元格cell_type(rowx,colx):                           数据类型cell_value(rows,colx):                          数值col(colx):                                      第colx列所有单元格组成的列表col_slice(colx,start_rowx=0,end_rowx=None):     第colx列指定单元格组成的列表col_types(colx,start_rowx=0,end_rowx=None):     第colx列指定单元格数值类型组成的列表col_values(colx,start_rowx=0,end_rowx=None):    第colx列指定单元格数值组成的列表row同样有col的各项操作,此处略去Cell(class) 由Sheet object(s)相关方法返回ctype:    一个int型变量,对应不同的数值类型value:    单元格的值
方法以及返回值介绍

 

一、安装xlrd模块

  ♦ 到python官网下载模块安装,前提是已经安装了python 环境。

  ♦或者在cmd窗口  pip3 install  xlrd

二、使用介绍

  1、常用单元格中的数据类型

  2、导入模块

import xlrd

  3、打开Excel文件读取数据

data = xlrd.open_workbook(filename)#文件名以及路径,如果路径或者文件名有中文给前面加一个r拜师原生字符。

 

  4、常用的函数

       ♦ excel中最重要的方法就是book和sheet的操作

      1)获取book中一个工作表

table = data.sheets()[0]          #通过索引顺序获取table = data.sheet_by_index(sheet_indx)) #通过索引顺序获取table = data.sheet_by_name(sheet_name)#通过名称获取以上三个函数都会返回一个xlrd.sheet.Sheet()对象names = data.sheet_names()    #返回book中所有工作表的名字data.sheet_loaded(sheet_name or indx)   # 检查某个sheet是否导入完毕

如:

   2)行的操作

nrows = table.nrows  #获取该sheet中的有效行数table.row(rowx)  #返回由该行中所有的单元格对象组成的列表table.row_slice(rowx)  #返回由该列中所有的单元格对象组成的列表table.row_types(rowx, start_colx=0, end_colx=None)    #返回由该行中所有单元格的数据类型组成的列表table.row_values(rowx, start_colx=0, end_colx=None)   #返回由该行中所有单元格的数据组成的列表table.row_len(rowx) #返回该列的有效单元格长度

 3)列(colnum)的操作

ncols = table.ncols   #获取列表的有效列数table.col(colx, start_rowx=0, end_rowx=None)  #返回由该列中所有的单元格对象组成的列表table.col_slice(colx, start_rowx=0, end_rowx=None)  #返回由该列中所有的单元格对象组成的列表table.col_types(colx, start_rowx=0, end_rowx=None)    #返回由该列中所有单元格的数据类型组成的列表table.col_values(colx, start_rowx=0, end_rowx=None)   #返回由该列中所有单元格的数据组成的列表

如:

 

      4)单元格的操作  

table.cell(rowx,colx)   #返回单元格对象table.cell_type(rowx,colx)    #返回单元格中的数据类型table.cell_value(rowx,colx)   #返回单元格中的数据table.cell_xf_index(rowx, colx)   # 暂时还没有搞懂

♦单元格:单元格是表格中行与列的交叉部分,它是组成表格的最小单位,可拆分或者合并。单个数据的输入和修改都是在单元格中进行的

如:

注意:注意作用域问题,之前获取的sheet之后,都在获取到这个sheet值后,在进行,行和列以及单元格的操作。

 

问题现象: 

问题一:

  ♦1、使用open()函数、xlrd.open_workbook()函数打开文件,文件名若包含中文,会报错找不到这个文件或目录。 

  ♦2、获取sheet时若包含中文,也会报错。

#打开文件file = open(filename,'rb')#打开excel文件workbook = xlrd.open_workbook(filename)#获取sheetsheet = workbook.sheet_by_name(sheetname)

解决方案:

  ♦对参数进行转码即可。如:

filename = filename.decode('utf-8')

  ♦也试过unicode函数,不过,在ride中运行时出现了报错,所以不赞成使用。

filename = unicode(filename,'utf-8')

 问题二;

  问题描述:  python读取excel中单元格内容为日期时,字段里明明是日期,可读取后显示的却是浮点数。

  ♦python读取excel中单元格的内容返回的有5种类型:

    ctype :  0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error

 

1.判断类型演示: >>> sheet2.cell(2,2).ctype  #1990/2/223>>> sheet2.cell(2,1).ctype  #182>>> sheet2.cell(2,0).ctype  #测试1>>> sheet2.cell(2,4).ctype  #空值(这里是合并单元格的原因)0 2。解决浮点数问题,正确取值方式:>>> sheet2.cell(2,2).value  #1990/2/2233656.0>>> xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode)(1992, 2, 22, 0, 0, 0)>>> date_value =xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode)>>> date_value(1992, 2, 22, 0, 0, 0)>>> date(*date_value[:3])datetime.date(1992, 2, 22)>>> date(*date_value[:3]).strftime('%Y/%m/%d') '1992/02/22'

即可以做下简单处理,判断ctype是否等于3,如果等于3,则用时间格式处理:

if (sheet.cell(row,col).ctype == 3):    date_value = xlrd.xldate_as_tuple(sheet.cell_value(rows,3),book.datemode)    date_tmp = date(*date_value[:3]).strftime('%Y/%m/%d')

问题三:

  问题描述:读取合并单元格内容中内容sheet2.cell(2,4).ctype返回的值是0,说明这个单元格的值是空值,这就是这个包不完善的地方,如果是合并单元格那么应该合并的单元格内容一样,但是它只是合并的第一个单元格有值,其它为空。

  解决办法:通过获取merge_cells返回的row和col低位的索引来判断哪些是合并单元格,然后做后续取值操作。

    读取文件的时候需要将formatting_info参数设置为True,默认是False,所以上面获取合并的单元格数组为空,

    详细查看该链接:

 

 

2.为什么使用xlrd模块?

  ♦在UI自动化或者接口自动化中数据维护是一个核心,所以此模块非常实用。

 

3.怎样使用xlrd模块?

  :

  :https://www.cnblogs.com/insane-Mr-Li/p/9093212.html

  

  

 

转载于:https://www.cnblogs.com/iamjianghao/p/10764415.html

你可能感兴趣的文章
Docker简介(1)
查看>>
Linux 脚本
查看>>
HDUOJ---1213How Many Tables
查看>>
php 中self,this的区别和实地操作
查看>>
代码混淆遇到的问题
查看>>
Hibernate的条件查询的几种方式
查看>>
idea没有绑远程地址,如何提交到github的空项目
查看>>
PermGen space错误解决方法
查看>>
4. Retrieving a mapper(检索映射器)
查看>>
Office 2010 打开文件后所有的格式成了时间的解决方法
查看>>
2017-11-24 嵌入式笔记
查看>>
Win10 IoT C#开发 2 - 创建基于XAML的UI程序 及 应用的三种部署方法
查看>>
ADO.Net 之 数据库连接池(二)
查看>>
jdbc 处理Clob
查看>>
整理归纳 Oracle DBA 应该知道的一些东西
查看>>
空控制器的处理
查看>>
封装自己的yQuery
查看>>
GridView 行单击或双击事件绑定
查看>>
C#和vb.net代码相互转换
查看>>
Leetcode-5050 Binary Search Tree to Greater Sum Tree(从二叉搜索树到更大和树)
查看>>