大数跨境
0
0

python的openpyxl模块操作excel

python的openpyxl模块操作excel 橙子好甜
2024-08-09
2

安装

pip install openpyxl

读取Excel文档

加载文档

通过调用方法 load_workbook(filename) 进行文件读取,该方法中还有一个 read_only 参数用于设置文件打开方式,默认为可读可写,该方法最终将返回一个 workbook 的数据对象

import openpyxl
# 文件必须是xlsx格式,如果是其他格式在执行前可利用win32辅助转化
wb = openpyxl.load_workbook(r'C:\Users\min.wang\Desktop\光明.xlsx')
print(wb)



获取工作表

每一个 Excel 表格中都会有很多张 sheet 工作表,在对表格操作前需要先选定一张工作表

# 获取所有工作表名(返回一个列表)
# sheets = wb.get_sheet_names() #该方法报deprecationwarning
sheets = wb.sheetnames
print(sheets)

# 获取某一特定的工作表
# sheet = wb.get_sheet_by_name('Sheet2') #该方法报deprecationwarning
sheet = wb["Sheet1"]
print(sheet)

# 获取工作表的表名
sheet_name = sheet.title
print(sheet_name)

# 一般来说,表格大多数用到的是打开时显示的工作表,这时可以用active来获取当前工作表
sheet = wb.active
print(sheet)

获取单元格

对 Excel 表格的操作最终都落于对单元格的操作,获取单元格有两种获取方法:sheet[列行名]和 sheet.cell(row,column)

# 通过sheet[列行名]获取
a = sheet['A2']

# 通过sheet.cell(row,column)获取
b = sheet.cell(1, 2) # 即sheet['B1']

# 获取单元格内容
print(a.value,a)
print(b.value,b)

# 获取单元格所在列和行
print('a is '+str((a.column,a.row)))

需要注意的是,sheet.cell(row,column)中参数分别是行和列,且必须为整数,如果列为英文字母,可以利用 openpyxl.utils 中的 column_index_from_string (char)进行字母数字的转化。顺便一说,同理也可以利用 get_column_letter(number) 进行数字字母间的转化

from openpyxl.utils import get_column_letter, column_index_from_string

# 对列进行字母/数字转化
c_num = column_index_from_string('B') # c_num = 2
c_char = get_column_letter(5) # c_char = 'E‘
print(c_num,c_char)

获取行和列


在处理 Excel 表格有时可能需要对表格进行遍历查找,openpyxl 中便提供了一个行和列的生成器 (sheet.rows和sheet.columns) ,这两个生成器里面是每一行(或列)的数据,每一行(或列)又由一个 tuple 包裹,借此可以很方便地完成对行和列的遍历

# 对行进行遍历,
for row in sheet.rows:
for cell in row:
print(cell.value)

# 对列进行遍历,
for column in sheet.columns:
for cell in column:
if cell.value :
print(cell.value)
print("")

学习时还发现也可以通过 list(sheet.rows)index 对某一行或列进行遍历,而在此值得注意的是,由于sheet.rows(或sheet.columns)是生成器类型,是不能直接调用的,需将其转化为一个 list 类型,然后再通过索引遍历

# 对第一行进行遍历
for cell in list(sheet.rows)[0]:
print(cell.value)

同时,也可以通过使用 sheet[行列值:行列值] 来对给定单元格范围进行遍历

# 对某一单元格范围进行遍历
for spaces in sheet['A1':'B2']:
for cell in spaces:
print(cell.value)

获取行数、列数

另外,有时候我们还可能需要确定表格的大小,即获取表格行和列的最大值,可以用 max_row max_column 来获取

# 获得最大列和最大行
print(sheet.max_row)
print(sheet.max_column)

读取实例

import openpyxl
# 文件必须是xlsx格式,如果是其他格式在执行前可利用win32辅助转化
wb = openpyxl.load_workbook(r'C:\Users\min.wang\Desktop\光明.xlsx')
print(wb)

# 获取所有工作表名(返回一个列表)
# sheets = wb.get_sheet_names() #该方法报deprecationwarning
sheets = wb.sheetnames
print(sheets)

# 获取某一特定的工作表
# sheet = wb.get_sheet_by_name('Sheet2') #该方法报deprecationwarning
sheet = wb["Sheet1"]
print(sheet)

# 获取工作表的表名
sheet_name = sheet.title
print(sheet_name)

# 一般来说,表格大多数用到的是打开时显示的工作表,这时可以用active来获取当前工作表
sheet = wb.active
print(sheet)

# 通过sheet[列行名]获取
a = sheet['A2']

# 通过sheet.cell(row,column)获取
b = sheet.cell(1, 2) # 即sheet['B1']

# 获取单元格内容
print(a.value,a)
print(b.value,b)

# 获取单元格所在列和行
print('a is '+str((a.column,a.row)))

from openpyxl.utils import get_column_letter, column_index_from_string

# 对列进行字母/数字转化
c_num = column_index_from_string('B') # c_num = 2
c_char = get_column_letter(5) # c_char = 'E‘
print(c_num,c_char)

print(sheet.rows)

for row in sheet.rows:
for cell in row:
print(cell.value)

for column in sheet.columns:
for cell in column:
if cell.value :
print(cell.value)
print("")

for spaces in sheet['A1':'B2']:
for cell in spaces:
print(cell.value)

for cell in list(sheet.rows)[0]:
print(cell.value)


maxrow = sheet.max_row
maxcolumn = sheet.max_column
print(maxrow,maxcolumn)

写入Excel文档

创建工作表

在开头读取时已经介绍,默认的打开方式为可读可写,那么使用 load_workbook(filename) 读取 Excel 文档后也就可以直接写入了。另外,如果需要新建一个 Excel 文件,可以使用 Workbook()方法,同时它会自动提供一个 sheet 工作表。对于删除一个工作表,则可以使用 workbook 对象的 remove(sheet) 方法删除

# 新建一个Excel文档
wb = openpyxl.Workbook()

# 删除某个工作表
wb.remove(sheet)

删除工作表

# 删除某个工作表 
wb.remove(sheet)

写入单元格

获取工作表和之前一样,如果使用 load_workbook(filename) 读取,那么获取工作表后可以直接通过sheet[行列值]写入单元格。学习时,有资料介绍还可以传入Excel中的公式进行赋值,不过要注意,在读取文件时需要加上参数 data_only=True ,这样才能返回数字,否则将返回字符串,即公式本身

import openpyxl
# 新建一个Excel文档
wb = openpyxl.Workbook()

print(wb.sheetnames)
sheet = wb["Sheet"]

# 直接赋值
sheet['A1'].value = 2

# 公式赋值
sheet['A6'].value = '=SUM(A1:A5)'

追加一行或多行

另外,也可使用 sheet.append(parameters) 一行或多行写入

# 写入一行
row = [1 ,2, 3, 4, 5]
sheet.append(row)

# 写入多行
rows = [
['ID', 'Name', 'Department'],
['001', 'Lee','CS'],
['002', 'John','MA'],
['003', 'Amy','IS']
]
# sheet.append(rows) 此语法报错

for i in rows:
print(i)
sheet.append(i)

实例:

# -*- coding: utf-8 -*-

from openpyxl import Workbook

wb = Workbook() # 默认生成一个名为Sheet的sheet

# 创建sheet

for name in ['a','b']:

ws = wb.create_sheet(name)

# 追加一行

for sheet in wb:

sheet.append(['name','name2'])

# 在A列和B列追加(参数为字典)

for sheet in wb:

sheet.append({'A':'dicta','B':'dictb'})

wb.save('test.xlsx')

插入 一行或者多行


from openpyxl import Workbook

wb = Workbook() # 默认生成一个名为Sheet的sheet

# 创建sheet

for name in ['a','b']:

ws = wb.create_sheet(name)

# 追加一行

for sheet in wb:

sheet.append(['name'])

# 第一行插入空行

for sheet in wb:

sheet.insert_rows(1)

# 在第2行往下数3行插入空行(2、3、4行)

for sheet in wb:

sheet.insert_rows(2,3)

wb.save('test.xlsx')

保存文件

写完文件后,使用 workbook.save(path+filename)进行保存,不过要注意文件扩展名一定要是 xlsx 格式

# 保存文件至当前目录
wb.save('new_file.xlsx')

设置单元格样式

单元格样式主要包括字体、边框、颜色以及对齐方式等,这些均位于 openpyxl.styles 库中

# 导入字体、边框、颜色以及对齐方式相关库
from openpyxl.styles import Font, Border, Side, PatternFill, colors, Alignment

字体

通过 sheet 单元格 font 属性设置字体风格

# 设置字体风格为Times New Roman,大小为16,粗体、斜体,颜色蓝色

sheet['A1'].font = Font(name='Times New Roman', size=16, bold=True, italic=True, color=colors.BLUE)

对齐方式

通过 sheet 单元格 alignment 属性设置文本对齐风格

# 通过参数horizontal和vertical来设置文字在单元格里的对齐方式,此外设置值还可为left和right
sheet['B1'].alignment = Alignment(horizontal='center',vertical='center')

边框

通过 sheet 单元格 border 属性设置字体风格

# 首先设置边框四个方向的线条种类
left, right, top, bottom = [Side(style='thin', color='000000')] * 4
# 再将各方向线条作为参数传入Border方法
sheet['C1'].border = Border(left=left, right=right, top=top, bottom=bottom)

设置行高和列宽

行和列的长度大小可以通过 row_dimensions[序号].height 和 column_dimensions[标号].width 来设置

# 设置行高
sheet.row_dimensions[1].height = 25

# 设置列宽
sheet.column_dimensions['D'].width = 15.5

合并和拆分单元格

对单元格的合并与拆分,主要是通过 sheet 的 merge_cells(args1:args2)和unmerge_cells(args1:args2) 两个方法来实现的

当然,除了对角矩形区域化合并,也可以对一行或一列进行合并,只需相应修改参数即可。不过,这里要注意的是,合并后单元格显示的文本内容是合并前最左上角单元格的内容,而其他单元格内容则会自动清除。

# 合并单元格
sheet.merge_cells('A1:B2')

# 拆分单元格
sheet.unmerge_cells('A1:B2')

删除行或者列

删除列
ws.delete_cols(1)
删除列
ws.delete_rows(1)

读取实例

import openpyxl
# 新建一个Excel文档
wb = openpyxl.Workbook()

print(wb.sheetnames)
sheet = wb["Sheet"]

# 直接赋值
# sheet['A1'].value = 2

# 公式赋值
sheet['A6'].value = '=SUM(A1:A5)'

# 写入一行
row = [1 ,2, 3, 4, 5]
sheet.append(row)

# 写入多行
rows = [
['ID', 'Name', 'Department'],
['001', 'Lee','CS'],
['002', 'John','MA'],
['003', 'Amy','IS']
]
# sheet.append(rows)
for i in rows:
print(i)
sheet.append(i)

from openpyxl.styles import Font, Border, Side, PatternFill, colors, Alignment
sheet['A1'].font = Font(name='Times New Roman', size=16, bold=True, italic=True, color=colors.BLUE)

# 首先设置边框四个方向的线条种类
left, right, top, bottom = [Side(style='thin', color='000000')] * 4
# 再将各方向线条作为参数传入Border方法
sheet['C1'].border = Border(left=left, right=right, top=top, bottom=bottom)
# 设置行高
sheet.row_dimensions[1].height = 25

# 设置列宽
sheet.column_dimensions['D'].width = 15.5

# # 合并单元格
sheet.merge_cells('A1:B2')
# 拆分单元格
sheet.unmerge_cells('A1:B2')
print(sheet.max_row)

sheet.delete_rows(1)
print(sheet.max_row)

wb.save('new_file.xlsx')


【声明】内容源于网络
0
0
橙子好甜
人生苦短,我用python --it测试狗
内容 30
粉丝 0
橙子好甜 人生苦短,我用python --it测试狗
总阅读0
粉丝0
内容30