用python批量清理删除doc和docx的页头页脚
创始人
2024-01-27 21:18:50
0

用python批量清理删除doc和docx的页头页脚,不区分内容,只要包含页头页脚直接清理掉。

import os
from docx import Document
from win32com import client as win32

def clear_paragraphs(paragraphs):
    for paragraph in paragraphs:
        for run in paragraph.runs:
            run.clear()

def remove_header_footer_docx(doc):
    for section in doc.sections:
        clear_paragraphs(section.header.paragraphs)
        clear_paragraphs(section.footer.paragraphs)

def remove_header_footer_doc(filename):
    word_app = win32.Dispatch('Word.Application')
    doc = word_app.Documents.Open(filename)

    for section in doc.Sections:
        section.Headers(1).Range.Delete()
        section.Footers(1).Range.Delete()

    doc.Close(True)

def batch_remove_headers_footers(input_folder, output_folder):
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    for filename in os.listdir(input_folder):
        input_path = os.path.join(input_folder, filename)
        output_path = os.path.join(output_folder, filename)

        if filename.endswith(".docx"):
            doc = Document(input_path)
            remove_header_footer_docx(doc)
            doc.save(output_path)
        elif filename.endswith(".doc"):
            remove_header_footer_doc(input_path)
            os.rename(input_path, output_path)

if __name__ == "__main__":
    input_folder = "输入文件夹的路径"
    output_folder = "输出文件夹的路径"

    batch_remove_headers_footers(input_folder, output_folder)

相关内容

python3基础教程答案...
Python3教程PDF下载 Python3是一种广泛使用的高级...
2024-12-28 00:59:15
python是一种什么的编...
Python是一种高级编程语言,它以其简洁易读的语法和强大的功能而...
2024-12-27 05:22:35
php与python两种语...
在编程语言的世界里,PHP和Python是两种非常流行的语言,尽管...
2024-12-27 03:58:44
云虚拟主机搭建云手机 py...
云虚拟主机运行Python的方法 随着互联网的快速发展,越来越多...
2024-12-08 15:13:09
如何在windows设置p...
在Windows 3中设置环境变量的方法有很多种,以下是其中的11...
2024-11-22 12:39:24
python中for循环的...
Python中的for循环是一种常用的控制结构,用于重复执行一段代...
2024-11-09 21:42:26

热门资讯

Mobi、epub格式电子书如... 在wps里全局设置里有一个文件关联,打开,勾选电子书文件选项就可以了。
小程序支付时提示:appid和... [Q]小程序支付时提示:appid和mch_id不匹配 [A]小程序和微信支付没有进行关联,访问“小...
scoped_dir32_70... 一台虚拟机C盘总是莫名奇妙的空间用完,导致很多软件没法再运行。经过仔细检查发现是C:\Program...
定时清理删除C:\Progra... C:\Program Files (x86)下面很多scoped_dir开头的文件夹 写个批处理 定...
pycparser 是一个用... `pycparser` 是一个用 Python 编写的 C 语言解析器。它可以用来解析 C 代码并构...
微信小程序使用slider实现... 众所周知哈,微信小程序里面的音频播放是没有进度条的,但最近有个项目呢,客户要求音频要有进度条控制,所...
Apache Doris 2.... 亲爱的社区小伙伴们,我们很高兴地向大家宣布,Apache Doris 2.0.0 版本已于...
项目管理和工程管理的区别 项目管理 项目管理,顾名思义就是专注于开发和完成项目的管理,以实现目标并满足成功标准和项目要求。 工...
python返回昨天日期的方法 本文实例讲述了python返回昨天日期的方法。分享给大家供大家参考。具体实现方法如下: #-*-co...
Python模块学习:zipf... 最近在写一个网络客户端下载程序,用于下载服务器上的数据。有些数据(如文本,office文档)如果直接...