python将一个长文txt按字数分割成多个txt
创始人
2024-01-29 22:30:47
0

你可以使用Python来将一个长文本文件按字数分割成多个小的文本文件。下面是一个简单的示例代码,可以帮助你实现这个任务:

def split_text(input_file, output_prefix, max_words_per_file):
    with open(input_file, 'r', encoding='utf-8') as f:
        text = f.read()

    words = text.split()
    total_words = len(words)

    num_files = (total_words // max_words_per_file) + 1

    for i in range(num_files):
        start_idx = i * max_words_per_file
        end_idx = (i + 1) * max_words_per_file
        output_file = f"{output_prefix}_{i + 1}.txt"

        with open(output_file, 'w', encoding='utf-8') as f:
            f.write(' '.join(words[start_idx:end_idx]))

if __name__ == "__main__":
    input_file = "input.txt"  # 输入长文本文件的文件名
    output_prefix = "output_file"  # 输出文件的前缀,每个文件将以此前缀加上序号命名
    max_words_per_file = 500  # 每个输出文件包含的最大字数

    split_text(input_file, output_prefix, max_words_per_file)

在这个示例代码中,split_text 函数接受输入文件名、输出文件前缀和每个输出文件包含的最大字数作为参数。它首先读取输入文件中的文本,然后将文本分割成单词。接下来,它计算出需要创建的输出文件数量,并循环创建这些文件,每个文件包含指定数量的字词。

请注意,这只是一个简单的示例,可能不适用于所有情况。如果你的文本中包含特殊字符或标点符号,你可能需要根据实际情况进行适当的调整。


相关内容

热门资讯

Windows 11 和 10... Windows 11/10 文件夹属性中缺少共享选项卡 – 已修复 1.检查共享选项卡是否可用 右键...
Radmin VPN Wind... Radmin VPN 是一款免费且用户友好的软件,旨在牢固地连接计算机以创建一个有凝聚力的虚拟专用网...
如何修复 Steam 内容文件... Steam 内容文件锁定是当您的 Steam 文件无法自行更新时出现的错误。解决此问题的最有效方法之...
在 Windows 11 中打... 什么是链路状态电源管理? 您可以在系统控制面板的电源选项中看到链接状态电源管理。它是 PCI Exp...
事件 ID 7034:如何通过... 点击进入:ChatGPT工具插件导航大全 服务控制管理器 (SCM) 负责管理系统上运行的服务的活动...
Hive OS LOLMine... 目前不清退的交易所推荐: 1、全球第二大交易所OKX欧意 国区邀请链接: https://www.m...
在 iCloud 上关闭“查找... 如果您是 Apple 的长期用户,您肯定会遇到过 Find My 应用程序,它本机安装在 iPhon...
iPhone 屏幕上有亮绿色斑... iPhone 是市场上最稳定的智能手机之一,这主要归功于专为它们设计的 iOS 操作系统。然而,他们...
balenaEtcher烧录后... balenaEtcher烧录后u盘或者内存卡无法识别不能使用的解决方法想要恢复原来的方法,使用win...
farols1.1.501.0... faro ls 1.1.501.0(64bit)可以卸载,是一款无需连接外部PC机或笔记本计算机即可...